communications-mining
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Communications Mining ガイド

最終更新日時 2024年12月20日

抽出フィールドの設定の概要

注: ラベルを設定し、自動化するプロセスを決定します。利点を考慮して、以下のいずれかの方法で抽出を設定します。この段階では、エンドツーエンドのオートメーションを促進するために抽出する必要のあるデータ ポイントを決定することが非常に重要です。​

探索ページ

  • モデルのトレーニング プロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[探索] で既存のスキーマにフィールドを追加したりできます。​
  • [探索] で抽出を設定すると、以下のことが可能になります。
    • メッセージのデータに基づいてフィールドを作成する。
    • 新しいフィールドがあったら抽出に追加する。

[設定] ページ

  • モデルのトレーニング プロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[設定] で既存のスキーマにフィールドを追加したりできます。
  • 抽出するフィールドが事前にわかっている場合は、[設定] で一括抽出を設定します。

[トレーニング] ページ

[トレーニング] タブを使用してモデルをトレーニングする場合は、新しい抽出を設定できます。ガイド付きトレーニングを進めながら、ラベルとフィールドの抽出の両方にアノテーションを行うこともできます。

一般的なガイダンス

注: プラットフォームの LLM 生成 AI 機能により抽出データが作成されます。予測は、トレーニング済みのラベルフィールドの名前に基づきます。
  • 抽出を設定するには、名前とフィールドの種類が必要なフィールドを設定します。これは、最も低い子レベルのラベルで行うことをお勧めします。​
  • わかりやすい簡潔な名前にします。フィールドのデータを正確に表すフィールド名を選びます。簡潔さと明瞭さのバランスを考慮してください。フィールドには正確わかりやすい名前を付けます。フィールドの役割に関する必要なコンテキストをモデルに提供できるようにするためです。​
  • たとえば、住所が変更された場合に、新しい住所のみを抽出するには、新しい番地、新しい市区町村、新しい郵便番号、というフィールド名を設定しておくと便利です。​
  • あいまいなフィールド名は避けてください。フィールド名は明確な、プロジェクト内の他のフィールドや概念と区別のつきやすいものにしてください。たとえば、Value (値) ではなく、Sales Amount (売上) や Account Balance (アカウント残高) などのより具体的な名前を使用します。​
  • 抽出フィールドの場合は、同じ種類のフィールドを複数作成できますが、一般フィールドの場合は不可能です。一般フィールドでこの問題に対処するには、同じ設定で別の種類のフィールドを作成します。
注: [Date Change] ラベルがあり、[Date Before] フィールドと [Date After] フィールドを取得する場合、これら両方のフィールドに同じデータ型を関連付けることはできません (例: これらの両方のフォーム定義で基になるフィールドの種類として Date 型を使用する)。

2 つの異なるフィールドの種類 ([Date Before] 用と [Date After] 用) を作成し、それぞれのフォーム定義にマッピングする必要があります。

フィールド名のベスト プラクティス

[フィールド名] は、モデルにプロンプトを入力するために使用されます。抽出が期待どおりに実行されない場合は、[フィールド名] を、ユース ケースをより具体的に表す名前に変更してください。フィールド名を変更すると、パフォーマンスが向上する場合があります。

以下のフィールド名は例にすぎず、フィールドの命名方法はユース ケースや、抽出しようとしているデータのコンテキストによって異なります。​

ユースケース非推奨のフィールド名​パフォーマンスが向上するフィールド名​
住所変更の要求時に、新しい住所の詳細を抽出して、下流のシステムに入力する必要がある。
  • 住所​
  • 郵便番号​
  • 市町村
  • 新しい住所​
  • 新しい郵便番号​
  • 新しい市区町村​
ロジスティクス出荷要求の一部として、SAP に入力する各商品の合計税内訳 (VAT 額と VAT 率の両方) を特定する必要がある。
  • アイテム ID​
  • 税額
  • アイテム ID​
  • VAT 額​
  • VAT 率
請求書の変更要求時に、古い請求書番号と新しい番号を特定し、古い請求書をキャンセルして新しい請求書を再発行する必要がある。
  • 請求番号
  • 古い請求書番号​
  • 新しい請求書番号

一般フィールドと抽出フィールド

エンドツーエンドのオートメーションに役立つフィールドには、以下の 2 種類があります。

  1. 一般フィールド
  2. 抽出フィールド

Communications Mining で利用可能なさまざまな種類のフィールドと、それぞれいつ使用したらよいかを理解することが重要です。

一般フィールド抽出フィールド​
一般フィールドとは、抽出対象のフィールドのことであり、データセット内の複数の異なるトピック/ラベルにまたがって存在する可能性があります。
  • 以前はエンティティと呼ばれていました。
  • 一般に、データセット全体のメッセージに適用され、特定のラベルには関連付けられていません。​
  • 通常、トリアージに役立ち、識別子 (ポリシー番号など) として使用されるデータ ポイントに限定される必要があります。
抽出フィールドとは、特定のラベルに基づいて条件付け (および作成) されるフィールドのことです。つまり、自動化する特定のラベルに関連付けられます。
  • メッセージ レベルで作成およびトレーニングされ、特定のラベルに関連付けられます​。
注: 抽出スキーマを設定するときは、自動化するプロセス (ラベル) を決める必要があります。抽出スキーマには、要求を自動的に処理するために必要な各フィールドが常に含まれている必要があります。​

次の表は、一般フィールド抽出フィールドの主な違いを示しています。2 つのまったく異なるモデルでこれらの種類のフィールドが予測されるため、違いを確認しておいてください。

フィールドの種類予測確認のレベルスパンレス* 対 スパンあり*スパンの重複同じ種類のフィールド間でフィールドの種類を共有するサポートされているデータ型**
一般フィールドデータセット全体で自動的に​段落レベル​スパンフルのみ​不可​(現時点では) 不可​
  • 文字列​
  • 日付​
  • 金額​
  • 正規表現​
  • テンプレート​
抽出フィールド(現時点では) オンデマンドのみ​メッセージ レベル (ラベルのコンテキスト内)​スパンフルとスパンレスの両方​可能​可能​
  • 文字列​
  • 日付​
  • 金額​
  • 数値​

このガイドの「スパンありフィールドとスパンなしフィールド」ページの「スパンなしフィールド」をご覧ください。​

このガイドの「データ型」ページの各フィールドの種類でサポートされるデータ型を確認してください。

抽出フィールドの例​

この例では、これら 2 つのラベルのエンドツーエンドのオートメーションの促進に関連する抽出フィールドをプラットフォームが識別できます。



一般フィールドの例

この例では、プラットフォームは、タクソノミーの特定のラベルがこのメッセージに適用されるかどうか確信がありせん。ですが、メッセージ自体から特定のフィールドを抽出することはできます。一般フィールドを設定すると、プラットフォームはラベルの予測に関係なくこれらのフィールドを識別できます。



[探索] でフィールドを設定する

以下の手順に従って、[探索] ページで一般フィールド抽出フィールドの両方を設定または変更できます。

  1. ラベルを含むコミュニケーション ([探索] の抽出フィールドを定義する場所) で、[フィールドのアノテーションを行う] を選択します。
  2. 抽出フィールドを設定する場合は、右側の [フィールドのアノテーション] バーのラベル名の横にカーソルを合わせて、[フィールドを管理] を選択します。一般フィールドを設定する場合は、[一般フィールド] の横にカーソルを合わせて、そこでフィールドを管理します。​


  3. [新しい抽出フィールド] を選択して、新しい抽出フィールドを追加します。複数のフィールドを追加できます。​
  4. 抽出フィールド名と抽出するフィールドの種類 を入力します。既存のフィールドの種類を選択するか、抽出対象のフィールドの種類が設定されていない場合は新たに作成します。


  5. Select Save to save the extraction fields.
Note: In the annotation interface, the first field configured under a label will be displayed as the identifying field for an extraction, especially when the extraction is collapsed. To change which field is displayed, simply reorder the fields using drag-and-drop.

[設定] でフィールドを設定する

以下の手順に従って、[設定] ページで一般フィールド抽出フィールドの両方を設定または変更します。

注: [トレーニング] でフィールドを設定する場合は、[設定] にリダイレクトされます。

[トレーニング] でもフィールドを設定するには、以下の手順に従ってください。

  1. [設定][タクソノミー] の順に移動します。
  2. 抽出フィールドを作成するには、[ラベルとフィールド] タブに移動します。
  3. On the specific label that you want to create an extraction field on, select the dropdown menu. Selecting the dropdown expands the list of all the fields on a given label.
  4. 新しい抽出フィールドを追加するには、下部の [抽出フィールド] を選択します。​
  5. [フィールド名][抽出フィールドの種類] を入力して、新しい抽出フィールドを設定します。


  6. 新しい一般フィールドを作成するには、[一般フィールド] タブに移動します。右上隅の [新しいフィールド] を選択します。​
  7. Fill out the Field name and General field type to configure your new General field(s).​


Note: In the annotation interface, the first field configured under a label will be displayed as the identifying field for an extraction, especially when the extraction is collapsed. To change which field is displayed, simply reorder the fields using drag-and-drop.

フィールドの種類を設定する

フィールドを設定するときには、特定のデータ型を選択する必要があります。

既定の種類は次のとおりです。
  • 日付
  • 正確なテキスト
  • 推論されたテキスト
  • 金額
  • Number
    注:

    A field type can be used exclusively for either general fields or extraction fields – they cannot be shared between the two. Additionally, 'Inferred text' and 'Number' field types can only be used for extraction fields.



次の表は、どのような場合に各種類を使用するかを示しています。

フィールドの種類
データ型一般フィールド​抽出フィールド​説明
文字列X​X​文字列には、任意の文字 (各種文字のほか、数字など) を含めることができます。​

Strings can also have input values that are explicitly present (spanful) in the message or inferred (spanless). Check out more details about spanful fields.

  • 組織名
  • 住所
日付*X​X​日付にはさまざまな非構造化形式があり、UiPath® の事前トレーニング済みの日付フィールドが使用されます。​

  • 開始日​
  • 有効期限​
数値X​X​数量はさまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの数量フィールドを使用して数値が解釈されます。​

  • 項目数​
  • 変化率 (%)​
額*X​X​Monetary quantities typically come in varying unstructured formats and use UiPath’s® pre-trained monetary quantity model. ​

  • 合計保険料​
  • 手数料​
正規表現X​If a specific field always needs to be extracted in a specific format, the rules can be configured with RegEx. For more details, check the official UiPath® documentation.
  • 常に 3 文字で始まり、6 桁の数字で終わる必要があるポリシー番号​
テンプレートX​Check the official UiPath® documentation for a list of supported templates.
  • SEDOL (SEDOL コード)​
  • BIC​

注:

多くのフィールドは、下流工程用に構造化データ形式に正規化する必要があります。​

*Within the platform, monetary quantities and dates are general field types that are automatically normalized. For more details, check the official UiPath® documentation on field normalization.

スパンフル フィールドとは

スパンフル フィールドとは、テキストに明示的に記載されているデータ ポイントのことです (取引 ID、ポリシー番号など)。

スパンレス フィールドとは

スパンレス フィールドとは、テキストに明示的に記載されていない可能性があるものの、メッセージから抽出する必要がある (つまり、メッセージから推測できる) データ ポイントのことです。つまり、抽出したいテキストの範囲がメッセージに必ずしも存在するとは限りません

一般フィールドを設定するときに、入力値がメッセージに存在する必要があるかどうか、または入力値をメッセージから推測できる (つまり、テキストからそのまま抽出する必要がある) かどうかを指定します。​

スパンレスにする必要がある場合のあるフィールドの例をいくつか示します。

  • 正規化する必要がある値 (日付など)。​
  • メール内の複数の領域にわたり連結する必要がある値​。
  • メールのどこにも存在しないものの、メールの特性から暗示される値​。
  • 複数の段落、行、または列にまたがる (つまり、連続したスパンには表示されない) 値。
注: スパンレス フィールドは、抽出フィールドのデータ型が文字列として設定されている場合にのみ使用できます。


新しいフィールドの種類を作成する​

A field type is the initial state of your new field. If you do not have a field type to use, follow these steps to set up a new field type. You can set up the new field type from the dropdown when creating a field, but also on the field type page itself if needed​.

できるだけ幅広くフィールドの種類を設定してから、より細かく微調整します​。

  1. A - フィールドの種類に名前を付けます。​
    注: フィールドの種類名は、フィールド名とは違い、モデルによってコンテキストとしては使用されません。
  2. B - 抽出フィールド用の新しいフィールドの種類を設定するか、一般フィールドを設定するかを定義します。​
  3. C - 一般フィールドまたは抽出フィールドを設定する場合、そのフィールドの種類に固有のデータ型を選択する必要があります。
    注: 抽出に新しいフィールドの種類を設定するか、一般フィールドを設定するかによって、設定できるデータ型が異なる場合があります。選択したデータ型に応じて、追加の構成も適用できます。


注: 以下の手順では、プラットフォームで利用可能なすべての定義済みフィールドの種類と、それぞれをどのような場合に使用すべきかのリスト (および詳細) が示されています。

[設定] を使用して新しいフィールドの種類を作成する​

注: 必要に応じて、[フィールドの種類] ページで新しいフィールドの種類を作成することもできます。[フィールド] ページから作成すると、対象のフィールドが事前に選択され、すぐにそのフィールドに割り当てられます。​

[探索] ページ、または [トレーニング] タブの [設定] ページで、新しいフィールドの種類を設定できます。

Once the data type has been configured on a field type, you cannot change it. Select the correct data type when creating a field type. If you do not select the correct data, you have to delete the field type and re-create it with the correct data type.

[設定] ページから、抽出フィールド一般フィールドの両方に新しいフィールドの種類を設定できます。​

To set up a new field type in the Settings page, follow these steps:

  1. On the Settings page, select the Taxonomy tab.

  2. In the Taxonomy tab, select Field types.

  3. Select New field type.



[探索] を使用して新しいフィールドの種類を作成する

注: [探索] を使用した新しいフィールドの種類の作成方法は、[トレーニング] でも同じです​。

Follow these steps to set up your field types via the Explore page:.

  1. On the Explore page, select Annotate Fields.

  2. Click the three dot menu next to either general field or extraction field section. You can only create a new field type in its respective section.

  3. In the Manage fields section, select the field type dropdown menu, select New field type and set up your field type.

注: 一般フィールドまたは抽出フィールドに対応するフィールドの種類を、[フィールドのアノテーション] ペインのそれぞれのセクションで設定する必要があります。


このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.