communications-mining
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
UiPath logo, featuring letters U and I in white
Communications Mining ガイド
Last updated 2024年11月19日

抽出フィールドの設定の概要

注: ラベルを設定し、自動化するプロセスを決定します。利点を考慮して、以下のいずれかの方法で抽出を設定します。この段階では、エンドツーエンドのオートメーションを促進するために抽出する必要のあるデータ ポイントを決定することが非常に重要です。​

探索ページ

  • モデルのトレーニング プロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[探索] で既存のスキーマにフィールドを追加したりできます。​
  • [探索] で抽出を設定すると、以下のことが可能になります。
    • メッセージのデータに基づいてフィールドを作成する。
    • 新しいフィールドがあったら抽出に追加する。

[設定] ページ

  • モデルのトレーニング プロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[設定] で既存のスキーマにフィールドを追加したりできます。
  • 抽出するフィールドが事前にわかっている場合は、[設定] で一括抽出を設定します。

[トレーニング] ページ

[トレーニング] タブを使用してモデルをトレーニングする場合は、新しい抽出を設定できます。ガイド付きトレーニングを進めながら、ラベルとフィールドの抽出の両方にアノテーションを行うこともできます。

一般的なガイダンス

注: プラットフォームの LLM 生成 AI 機能により抽出データが作成されます。予測は、トレーニング済みのラベルフィールドの名前に基づきます。
  • 抽出を設定するには、名前とフィールドの種類が必要なフィールドを設定します。これは、最も低い子レベルのラベルで行うことをお勧めします。​
  • わかりやすい簡潔な名前にします。フィールドのデータを正確に表すフィールド名を選びます。簡潔さと明瞭さのバランスを考慮してください。フィールドには正確わかりやすい名前を付けます。フィールドの役割に関する必要なコンテキストをモデルに提供できるようにするためです。​
  • たとえば、住所が変更された場合に、新しい住所のみを抽出するには、新しい番地、新しい市区町村、新しい郵便番号、というフィールド名を設定しておくと便利です。​
  • あいまいなフィールド名は避けてください。フィールド名は明確な、プロジェクト内の他のフィールドや概念と区別のつきやすいものにしてください。たとえば、Value (値) ではなく、Sales Amount (売上) や Account Balance (アカウント残高) などのより具体的な名前を使用します。​
  • 抽出フィールドの場合は、同じ種類のフィールドを複数作成できますが、一般フィールドの場合は不可能です。一般フィールドでこの問題に対処するには、同じ設定で別の種類のフィールドを作成します。
注: [Date Change] ラベルがあり、[Date Before] フィールドと [Date After] フィールドを取得する場合、これら両方のフィールドに同じデータ型を関連付けることはできません (例: これらの両方のフォーム定義で基になるフィールドの種類として Date 型を使用する)。

2 つの異なるフィールドの種類 ([Date Before] 用と [Date After] 用) を作成し、それぞれのフォーム定義にマッピングする必要があります。

フィールド名のベスト プラクティス

[フィールド名] は、モデルにプロンプトを入力するために使用されます。抽出が期待どおりに実行されない場合は、[フィールド名] を、ユース ケースをより具体的に表す名前に変更してください。フィールド名を変更すると、パフォーマンスが向上する場合があります。

以下のフィールド名は例にすぎず、フィールドの命名方法はユース ケースや、抽出しようとしているデータのコンテキストによって異なります。​

ユースケース非推奨のフィールド名​パフォーマンスが向上するフィールド名​
住所変更の要求時に、新しい住所の詳細を抽出して、下流のシステムに入力する必要がある。
  • 住所​
  • 郵便番号​
  • 市町村
  • 新しい住所​
  • 新しい郵便番号​
  • 新しい市区町村​
ロジスティクス出荷要求の一部として、SAP に入力する各商品の合計税内訳 (VAT 額と VAT 率の両方) を特定する必要がある。
  • アイテム ID​
  • 税額
  • アイテム ID​
  • VAT 額​
  • VAT 率
請求書の変更要求時に、古い請求書番号と新しい番号を特定し、古い請求書をキャンセルして新しい請求書を再発行する必要がある。
  • 請求番号
  • 古い請求書番号​
  • 新しい請求書番号

一般フィールドと抽出フィールド

エンドツーエンドのオートメーションに役立つフィールドには、以下の 2 種類があります。

  1. 一般フィールド
  2. 抽出フィールド

Communications Mining で利用可能なさまざまな種類のフィールドと、それぞれいつ使用したらよいかを理解することが重要です。

一般フィールド抽出フィールド​
一般フィールドとは、抽出対象のフィールドのことであり、データセット内の複数の異なるトピック/ラベルにまたがって存在する可能性があります。
  • 以前はエンティティと呼ばれていました。
  • 一般に、データセット全体のメッセージに適用され、特定のラベルには関連付けられていません。​
  • 通常、トリアージに役立ち、識別子 (ポリシー番号など) として使用されるデータ ポイントに限定される必要があります。
抽出フィールドとは、特定のラベルに基づいて条件付け (および作成) されるフィールドのことです。つまり、自動化する特定のラベルに関連付けられます。
  • メッセージ レベルで作成およびトレーニングされ、特定のラベルに関連付けられます​。
注: 抽出スキーマを設定するときは、自動化するプロセス (ラベル) を決める必要があります。抽出スキーマには、要求を自動的に処理するために必要な各フィールドが常に含まれている必要があります。​

次の表は、一般フィールド抽出フィールドの主な違いを示しています。2 つのまったく異なるモデルでこれらの種類のフィールドが予測されるため、違いを確認しておいてください。

フィールドの種類予測確認のレベルスパンレス* 対 スパンあり*スパンの重複同じ種類のフィールド間でフィールドの種類を共有するサポートされているデータ型**
一般フィールドデータセット全体で自動的に​段落レベル​スパンフルのみ​不可​(現時点では) 不可​
  • 文字列​
  • 日付​
  • 金額​
  • 正規表現​
  • テンプレート​
抽出フィールド(現時点では) オンデマンドのみ​メッセージ レベル (ラベルのコンテキスト内)​スパンフルとスパンレスの両方​可能​可能​
  • 文字列​
  • 日付​
  • 金額​
  • 数値​

このガイドの「スパンありフィールドとスパンなしフィールド」ページの「スパンなしフィールド」をご覧ください。​

このガイドの「データ型」ページの各フィールドの種類でサポートされるデータ型を確認してください。

抽出フィールドの例​

この例では、これら 2 つのラベルのエンドツーエンドのオートメーションの促進に関連する抽出フィールドをプラットフォームが識別できます。



一般フィールドの例

この例では、プラットフォームは、タクソノミーの特定のラベルがこのメッセージに適用されるかどうか確信がありせん。ですが、メッセージ自体から特定のフィールドを抽出することはできます。一般フィールドを設定すると、プラットフォームはラベルの予測に関係なくこれらのフィールドを識別できます。



[探索] でフィールドを設定する

以下の手順に従って、[探索] ページで一般フィールド抽出フィールドの両方を設定または変更できます。

  1. ラベルを含むコミュニケーション ([探索] の抽出フィールドを定義する場所) で、[フィールドのアノテーションを行う] を選択します。
  2. 抽出フィールドを設定する場合は、右側の [フィールドのアノテーション] バーのラベル名の横にカーソルを合わせて、[フィールドを管理] を選択します。一般フィールドを設定する場合は、[一般フィールド] の横にカーソルを合わせて、そこでフィールドを管理します。​


  3. [新しい抽出フィールド] を選択して、新しい抽出フィールドを追加します。複数のフィールドを追加できます。​
  4. 抽出フィールド名と抽出するフィールドの種類 を入力します。既存のフィールドの種類を選択するか、抽出対象のフィールドの種類が設定されていない場合は新たに作成します。


  5. 右下の [保存] を選択して抽出フィールドを保存します。
Note: In the annotation interface, the first field configured under a label will be displayed as the identifying field for an extraction, especially when the extraction is collapsed. To change which field is shown, simply reorder the fields using drag-and-drop.

[設定] でフィールドを設定する

以下の手順に従って、[設定] ページで一般フィールド抽出フィールドの両方を設定または変更します。

注: [トレーニング] でフィールドを設定する場合は、[設定] にリダイレクトされます。

[トレーニング] でもフィールドを設定するには、以下の手順に従ってください。

  1. [設定][タクソノミー] の順に移動します。
  2. 抽出フィールドを作成するには、[ラベルとフィールド] タブに移動します。
  3. 抽出フィールドを作成する特定のラベルで、ドロップダウン メニューを選択します。ドロップダウンを選択すると、指定したラベルのすべてのフィールドのリストが展開されます。
  4. 新しい抽出フィールドを追加するには、下部の [抽出フィールド] を選択します。​
  5. [フィールド名][抽出フィールドの種類] を入力して、新しい抽出フィールドを設定します。


  6. 新しい一般フィールドを作成するには、[一般フィールド] タブに移動します。右上隅の [新しいフィールド] を選択します。​
  7. [フィールド名][一般フィールドの種類] を入力して、新しい一般フィールドを設定します。​


Note: In the annotation interface, the first field configured under a label will be displayed as the identifying field for an extraction, especially when the extraction is collapsed. To change which field is shown, simply reorder the fields using drag-and-drop.

フィールドの種類を設定する

フィールドを設定するときには、特定のデータ型を選択する必要があります。

The default types are:
  • 日付
  • Exact Text
  • Inferred Text
  • 金額
  • Number


The following table details when to use each type.

フィールドの種類
データ型一般フィールド​抽出フィールド​説明
文字列X​X​文字列には、任意の文字 (各種文字のほか、数字など) を含めることができます。​

文字列には、メッセージに明示的に存在する (スパンフル) 入力値、または推論される (スパンレス) 入力値を含めることもできます。詳細については、以下を確認してください。

  • 組織名
  • 住所
日付*X​X​日付にはさまざまな非構造化形式があり、UiPath® の事前トレーニング済みの日付フィールドが使用されます。​

  • 開始日​
  • 有効期限​
数値X​X​数量はさまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの数量フィールドを使用して数値が解釈されます。​

  • 項目数​
  • 変化率 (%)​
額*X​X​同様に、金額も通常はさまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの金額モデルが使用されます。​

  • 合計保険料​
  • 手数料​
正規表現X​特定のフィールドを常に特定の形式で抽出する必要がある場合は、正規表現を使用してルールを設定できます。詳しくは、UiPath® の公式ドキュメントをご覧ください​。
  • 常に 3 文字で始まり、6 桁の数字で終わる必要があるポリシー番号​
テンプレートX​サポートされているテンプレートのリストについては、UiPath® の公式ドキュメントをご覧ください。​
  • SEDOL (SEDOL コード)​
  • BIC​

注:

多くのフィールドは、下流工程用に構造化データ形式に正規化する必要があります。​

プラットフォーム内では、金額日付は自動的に正規化される一般フィールドの種類です。詳細については、フィールドの正規化に関する UiPath® の公式ドキュメントをご覧ください。

スパンフル フィールドとは

スパンフル フィールドとは、テキストに明示的に記載されているデータ ポイントのことです (取引 ID、ポリシー番号など)。

スパンレス フィールドとは

スパンレス フィールドとは、テキストに明示的に記載されていない可能性があるものの、メッセージから抽出する必要がある (つまり、メッセージから推測できる) データ ポイントのことです。つまり、抽出したいテキストの範囲がメッセージに必ずしも存在するとは限りません

一般フィールドを設定するときに、入力値がメッセージに存在する必要があるかどうか、または入力値をメッセージから推測できる (つまり、テキストからそのまま抽出する必要がある) かどうかを指定します。​

スパンレスにする必要がある場合のあるフィールドの例をいくつか示します。

  • 正規化する必要がある値 (日付など)。​
  • メール内の複数の領域にわたり連結する必要がある値​。
  • メールのどこにも存在しないものの、メールの特性から暗示される値​。
  • 複数の段落、行、または列にまたがる (つまり、連続したスパンには表示されない) 値。
注: スパンレス フィールドは、抽出フィールドのデータ型が文字列として設定されている場合にのみ使用できます。


新しいフィールドの種類を作成する​

フィールドの種類は、新しいフィールドの初期ステートです。使用するフィールドの種類がない場合は、以下の手順に従って新しいフィールドの種類を設定します。新しいフィールドの種類は、フィールドの作成時にドロップダウンから設定できますが、必要に応じてフィールドの種類ページ自体でも設定できます​。

できるだけ幅広くフィールドの種類を設定してから、より細かく微調整します​。

  1. A - フィールドの種類に名前を付けます。​
    注: フィールドの種類名は、フィールド名とは違い、モデルによってコンテキストとしては使用されません。
  2. B - 抽出フィールド用の新しいフィールドの種類を設定するか、一般フィールドを設定するかを定義します。​
  3. C - 一般フィールドまたは抽出フィールドを設定する場合、そのフィールドの種類に固有のデータ型を選択する必要があります。
    注: 抽出に新しいフィールドの種類を設定するか、一般フィールドを設定するかによって、設定できるデータ型が異なる場合があります。選択したデータ型に応じて、追加の構成も適用できます。


注: 以下の手順では、プラットフォームで利用可能なすべての定義済みフィールドの種類と、それぞれをどのような場合に使用すべきかのリスト (および詳細) が示されています。

[設定] を使用して新しいフィールドの種類を作成する​

注: 必要に応じて、[フィールドの種類] ページで新しいフィールドの種類を作成することもできます。[フィールド] ページから作成すると、対象のフィールドが事前に選択され、すぐにそのフィールドに割り当てられます。​

[探索] ページ、または [トレーニング] タブの [設定] ページで、新しいフィールドの種類を設定できます。

フィールドの種類にデータ型を設定すると、後から変更することはできなくなります。フィールドの種類を作成するときには、正しいデータ型を選択してください。正しいデータを選択しなかった場合は、フィールドの種類を削除し、正しいデータ型で再作成する必要があります。

[設定] ページから、抽出フィールド一般フィールドの両方に新しいフィールドの種類を設定できます。​

[設定] ページで新しいフィールドの種類を設定するには、以下の手順に従ってください。

(1) [設定] > (2) [タクソノミー] > (3) [フィールドの種類] > (4) [新しいフィールドの種類] > (5) フィールドの種類を設定します。



[探索] を使用して新しいフィールドの種類を作成する

注: [探索] を使用した新しいフィールドの種類の作成方法は、[トレーニング] でも同じです​。

[探索] ページでフィールドの種類を設定するには、以下の手順に従ってください。

注: 一般フィールドまたは抽出フィールドに対応するフィールドの種類を、[フィールドのアノテーション] ペインのそれぞれのセクションで設定する必要があります。

(1) [探索] > (2) [フィールドのアノテーションを行う] > (3) 一般フィールドまたは抽出フィールドのセクションの横にある 3 点リーダーをクリックします。新しいフィールドの種類は、それぞれのセクションでのみ作成できます > (4) [フィールドを管理] > (5) フィールドの種類ドロップダウンを選択してから、[新しいフィールドの種類] を選択します。フィールドの種類を設定します。



このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.