communications-mining

latest

false

重要 :

Communications Mining は UiPath IXP の一部となりました。詳しくは、ユーザーガイドの「はじめに」セクションをご覧ください。このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

Communications Mining ガイド

最終更新日時 2025年3月25日

抽出フィールドの設定の概要

注: ラベルを設定し、自動化するプロセスを決定します。利点を考慮して、以下のいずれかの方法で抽出を設定します。この段階では、エンドツーエンドのオートメーションを促進するために抽出する必要のあるデータポイントを決定することが非常に重要です。

重要: フィールドの種類を変更すると必ずアノテーションが失われるため、フィールドの種類で各フィールドに対して正しいデータ型が使用されていることを確認してください。フィールドの種類を変更した後は、フィールドに手動で再アノテーションを行うことしかできず、これには時間がかかる可能性があります。

探索ページ

モデルのトレーニングプロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[探索] で既存のスキーマにフィールドを追加したりできます。
[探索] で抽出を設定すると、以下のことが可能になります。
- メッセージのデータに基づいてフィールドを作成する。
- 新しいフィールドがあったら抽出に追加する。

[設定] ページ

モデルのトレーニングプロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[設定] で既存のスキーマにフィールドを追加したりできます。
抽出するフィールドが事前にわかっている場合は、[設定] で一括抽出を設定します。

[トレーニング] ページ

[トレーニング] タブを使用してモデルをトレーニングする場合は、新しい抽出を設定できます。ガイド付きトレーニングを進めながら、ラベルとフィールドの抽出の両方にアノテーションを行うこともできます。

一般的なガイダンス

注: プラットフォームの LLM 生成 AI 機能により抽出データが作成されます。予測は、トレーニング済みのラベルとフィールドの名前に基づきます。

抽出を設定するには、名前とフィールドの種類が必要なフィールドを設定します。これは、最も低い子レベルのラベルで行うことをお勧めします。
わかりやすい簡潔な名前にします。フィールドのデータを正確に表すフィールド名を選びます。簡潔さと明瞭さのバランスを考慮してください。フィールドには正確でわかりやすい名前を付けます。フィールドの役割に関する必要なコンテキストをモデルに提供できるようにするためです。
たとえば、住所が変更された場合に、新しい住所のみを抽出するには、新しい番地、新しい市区町村、新しい郵便番号、というフィールド名を設定しておくと便利です。
あいまいなフィールド名は避けてください。フィールド名は明確な、プロジェクト内の他のフィールドや概念と区別のつきやすいものにしてください。たとえば、Value (値) ではなく、Sales Amount (売上) や Account Balance (アカウント残高) などのより具体的な名前を使用します。
抽出フィールドの場合は、同じ種類のフィールドを複数作成できますが、一般フィールドの場合は不可能です。一般フィールドでこの問題に対処するには、同じ設定で別の種類のフィールドを作成します。

注: [Date Change] ラベルがあり、[Date Before] フィールドと [Date After] フィールドを取得する場合、これら両方のフィールドに同じデータ型を関連付けることはできません (例: これらの両方のフォーム定義で基になるフィールドの種類として Date 型を使用する)。

2 つの異なるフィールドの種類 ([Date Before] 用と [Date After] 用) を作成し、それぞれのフォーム定義にマッピングする必要があります。

フィールド名のベストプラクティス

[フィールド名] は、モデルにプロンプトを入力するために使用されます。抽出が期待どおりに実行されない場合は、[フィールド名] を、ユースケースをより具体的に表す名前に変更してください。フィールド名を変更すると、パフォーマンスが向上する場合があります。

以下のフィールド名は例にすぎず、フィールドの命名方法はユースケースや、抽出しようとしているデータのコンテキストによって異なります。

ユースケース	非推奨のフィールド名	パフォーマンスが向上するフィールド名
住所変更の要求時に、新しい住所の詳細を抽出して、下流のシステムに入力する必要がある。	住所郵便番号市町村	新しい住所新しい郵便番号新しい市区町村
ロジスティクス出荷要求の一部として、SAP に入力する各商品の合計税内訳 (VAT 額と VAT 率の両方) を特定する必要がある。	アイテム ID 税額	アイテム ID VAT 額 VAT 率
請求書の変更要求時に、古い請求書番号と新しい番号を特定し、古い請求書をキャンセルして新しい請求書を再発行する必要がある。	請求番号	古い請求書番号新しい請求書番号

一般フィールドと抽出フィールド

エンドツーエンドのオートメーションに役立つフィールドには、以下の 2 種類があります。

一般フィールド
抽出フィールド

Communications Mining で利用可能なさまざまな種類のフィールドと、それぞれいつ使用したらよいかを理解することが重要です。

一般フィールド	抽出フィールド
一般フィールドとは、抽出対象のフィールドのことであり、データセット内の複数の異なるトピック/ラベルにまたがって存在する可能性があります。以前はエンティティと呼ばれていました。一般に、データセット全体のメッセージに適用され、特定のラベルには関連付けられていません。通常、トリアージに役立ち、識別子 (ポリシー番号など) として使用されるデータポイントに限定される必要があります。	抽出フィールドとは、特定のラベルに基づいて条件付け (および作成) されるフィールドのことです。つまり、自動化する特定のラベルに関連付けられます。メッセージレベルで作成およびトレーニングされ、特定のラベルに関連付けられます。

一般フィールド

抽出フィールド

一般フィールドとは、抽出対象のフィールドのことであり、データセット内の複数の異なるトピック/ラベルにまたがって存在する可能性があります。

以前はエンティティと呼ばれていました。
一般に、データセット全体のメッセージに適用され、特定のラベルには関連付けられていません。
通常、トリアージに役立ち、識別子 (ポリシー番号など) として使用されるデータポイントに限定される必要があります。

抽出フィールドとは、特定のラベルに基づいて条件付け (および作成) されるフィールドのことです。つまり、自動化する特定のラベルに関連付けられます。

メッセージレベルで作成およびトレーニングされ、特定のラベルに関連付けられます。

注: 抽出スキーマを設定するときは、自動化するプロセス (ラベル) を決める必要があります。抽出スキーマには、要求を自動的に処理するために必要な各フィールドが常に含まれている必要があります。

次の表は、一般フィールドと抽出フィールドの主な違いを示しています。2 つのまったく異なるモデルでこれらの種類のフィールドが予測されるため、違いを確認しておいてください。

フィールドの種類	予測	確認のレベル	*スパンレス対** スパンあり*	スパンの重複	同じ種類のフィールド間でフィールドの種類を共有する	サポートされているデータ型**
一般フィールド	データセット全体で自動的に	段落レベル	スパンフルのみ	不可	(現時点では) 不可	文字列日付金額正規表現テンプレート
抽出フィールド	(現時点では) オンデマンドのみ	メッセージレベル (ラベルのコンテキスト内)	スパンフルとスパンレスの両方	可能	可能	文字列日付金額数値

このガイドの「スパンありフィールドとスパンなしフィールド」ページの「スパンなしフィールド」をご覧ください。

このガイドの「データ型」ページの各フィールドの種類でサポートされるデータ型を確認してください。

抽出フィールドの例

この例では、これら 2 つのラベルのエンドツーエンドのオートメーションの促進に関連する抽出フィールドをプラットフォームが識別できます。

一般フィールドの例

この例では、プラットフォームは、タクソノミーの特定のラベルがこのメッセージに適用されるかどうか確信がありせん。ですが、メッセージ自体から特定のフィールドを抽出することはできます。一般フィールドを設定すると、プラットフォームはラベルの予測に関係なくこれらのフィールドを識別できます。

[探索] でフィールドを設定する

[探索] ページで一般フィールドと抽出フィールドの両方を設定または変更するには、以下の手順を実行します。

重要:

フィールドの種類を変更すると必ずアノテーションが失われるため、フィールドの種類で各フィールドに対して正しいデータ型が使用されていることを確認してください。フィールドの種類を変更した後は、フィールドに手動で再アノテーションを行うことしかできず、これには時間がかかる可能性があります。

ラベルを含むコミュニケーション ([探索] の抽出フィールドを定義する場所) で、[フィールドのアノテーションを行う] を選択します。
抽出フィールドを設定する場合は、右側の [フィールドのアノテーション] バーのラベル名の横にカーソルを合わせて、[フィールドを管理] を選択します。一般フィールドを設定する場合は、[一般フィールド] の横にカーソルを合わせて、そこでフィールドを管理します。
[新しい抽出フィールド] を選択して、新しい抽出フィールドを追加します。複数のフィールドを追加できます。
抽出フィールド名と抽出するフィールドの種類 を入力します。既存のフィールドの種類を選択するか、抽出対象のフィールドの種類が設定されていない場合は新たに作成します。
[保存] を選択して抽出フィールドを保存します。

注: アノテーションのインターフェイスでは、特に抽出結果が折りたたまれている場合、ラベルに従って設定されている最初のフィールドが抽出結果の識別フィールドとして表示されます。表示するフィールドを変更するには、単にドラッグアンドドロップを使用してフィールドを並べ替えます。

[設定] でフィールドを設定する

[設定] ページで一般フィールドと抽出フィールドの両方を設定または変更するには、以下の手順を実行します。

注: [トレーニング] タブからフィールドを設定する場合は、[設定] タブにリダイレクトされます。

重要:

[トレーニング] でもフィールドを設定するには、以下の手順に従ってください。

[設定]、[タクソノミー] の順に移動します。
抽出フィールドを作成するには、[ラベルとフィールド] タブに移動します。
抽出フィールドを作成する特定のラベルで、ドロップダウンメニューを選択します。ドロップダウンを選択すると、指定したラベルのすべてのフィールドのリストが展開されます。
新しい抽出フィールドを追加するには、下部の [抽出フィールド] を選択します。
[フィールド名] と [抽出フィールドの種類] を入力して、新しい抽出フィールドを設定します。
新しい一般フィールドを作成するには、[一般フィールド] タブに移動します。右上隅の [新しいフィールド] を選択します。
[フィールド名] と [一般フィールドの種類] を入力して、新しい一般フィールドを設定します。

フィールドの種類を設定する

フィールドを設定するときには、特定のデータ型を選択する必要があります。

既定の種類は次のとおりです。

日付
Exact Text (実際のテキスト)
Inferred Text
金額
Number
注:
フィールドの種類は、一般フィールドまたは抽出フィールドのいずれか一方にのみ使用できます。2 つの間で共有することはできません。また、「Inferred text (推論されたテキスト)」と「数」のフィールドの種類は抽出フィールドにのみ使用できます。

以下の表に、各種類をどのような場合に使用するかを示します。

フィールドの種類
データ型	一般フィールド	抽出フィールド	説明	例
文字列	X	X	文字列には、任意の文字 (各種文字のほか、数字など) を含めることができます。文字列には、メッセージに明示的に存在する (スパンフル) 入力値、または推論される (スパンレス) 入力値を含めることもできます。詳しくは、スパンフルフィールドについての説明をご覧ください。	組織名名住所
日付*	X	X	日付にはさまざまな非構造化形式があり、UiPath® の事前トレーニング済みの日付フィールドが使用されます。	開始日有効期限
数値	X	X	数量はさまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの数量フィールドを使用して数値が解釈されます。	項目数変化率 (%)
金額*	X	X	金額は通常、さまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの金額モデルが使用されます。	合計保険料手数料
正規表現	X		特定のフィールドを常に特定の形式で抽出する必要がある場合は、正規表現を使用してルールを設定できます。詳しくは、UiPath® の公式ドキュメントをご覧ください。	常に 3 文字で始まり、6 桁の数字で終わる必要があるポリシー番号
テンプレート	X		サポートされているテンプレートのリストについては、UiPath® の公式ドキュメントをご覧ください。	SEDOL (SEDOL コード) BIC

注:

多くのフィールドは、下流工程用に構造化データ形式に正規化する必要があります。

* プラットフォーム内では、金額と日付は自動的に正規化される一般フィールドの種類です。詳細については、フィールドの正規化に関する UiPath® の公式ドキュメントをご覧ください。

スパンフルフィールドとは

スパンフルフィールドとは、テキストに明示的に記載されているデータポイントのことです (取引 ID、ポリシー番号など)。

スパンレスフィールドとは

スパンレスフィールドとは、テキストに明示的に記載されていない可能性があるものの、メッセージから抽出する必要がある (つまり、メッセージから推測できる) データポイントのことです。つまり、抽出したいテキストの範囲がメッセージに必ずしも存在するとは限りません。

一般フィールドを設定するときに、入力値がメッセージに存在する必要があるかどうか、または入力値をメッセージから推測できる (つまり、テキストからそのまま抽出する必要がある) かどうかを指定します。

スパンレスにする必要がある場合のあるフィールドの例をいくつか示します。

正規化する必要がある値 (日付など)。
メール内の複数の領域にわたり連結する必要がある値。
メールのどこにも存在しないものの、メールの特性から暗示される値。
複数の段落、行、または列にまたがる (つまり、連続したスパンには表示されない) 値。

注: スパンレスフィールドは、抽出フィールドのデータ型が文字列として設定されている場合にのみ使用できます。

新しいフィールドの種類を作成する

フィールドの種類は、新しいフィールドの初期ステートです。使用するフィールドの種類がない場合は、以下の手順に従って新しいフィールドの種類を設定します。新しいフィールドの種類は、フィールドの作成時にドロップダウンから設定できますが、必要に応じてフィールドの種類ページ自体でも設定できます。

できるだけ幅広くフィールドの種類を設定してから、より細かく微調整します。

A - フィールドの種類に名前を付けます。
注: フィールドの種類名は、フィールド名とは違い、モデルによってコンテキストとしては使用されません。
B - 抽出フィールド用の新しいフィールドの種類を設定するか、一般フィールドを設定するかを定義します。
C - 一般フィールドまたは抽出フィールドを設定する場合、そのフィールドの種類に固有のデータ型を選択する必要があります。
注: 抽出に新しいフィールドの種類を設定するか、一般フィールドを設定するかによって、設定できるデータ型が異なる場合があります。選択したデータ型に応じて、追加の構成も適用できます。