- 基本情報
- 管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining
- ライセンス情報
- よくある質問など
抽出フィールドの設定の概要
- モデルのトレーニング プロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[探索] で既存のスキーマにフィールドを追加したりできます。
- [探索] で抽出を設定すると、以下のことが可能になります。
- メッセージのデータに基づいてフィールドを作成する。
- 新しいフィールドがあったら抽出に追加する。
- モデルのトレーニング プロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[設定] で既存のスキーマにフィールドを追加したりできます。
- 抽出するフィールドが事前にわかっている場合は、[設定] で一括抽出を設定します。
- 抽出を設定するには、名前とフィールドの種類が必要なフィールドを設定します。これは、最も低い子レベルのラベルで行うことをお勧めします。
- わかりやすい簡潔な名前にします。フィールドのデータを正確に表すフィールド名を選びます。簡潔さと明瞭さのバランスを考慮してください。フィールドには正確でわかりやすい名前を付けます。フィールドの役割に関する必要なコンテキストをモデルに提供できるようにするためです。
- たとえば、住所が変更された場合に、新しい住所のみを抽出するには、新しい番地、新しい市区町村、新しい郵便番号、というフィールド名を設定しておくと便利です。
- あいまいなフィールド名は避けてください。フィールド名は明確な、プロジェクト内の他のフィールドや概念と区別のつきやすいものにしてください。たとえば、Value (値) ではなく、Sales Amount (売上) や Account Balance (アカウント残高) などのより具体的な名前を使用します。
- 抽出フィールドの場合は、同じ種類のフィールドを複数作成できますが、一般フィールドの場合は不可能です。一般フィールドでこの問題に対処するには、同じ設定で別の種類のフィールドを作成します。
2 つの異なるフィールドの種類 ([Date Before] 用と [Date After] 用) を作成し、それぞれのフォーム定義にマッピングする必要があります。
[フィールド名] は、モデルにプロンプトを入力するために使用されます。抽出が期待どおりに実行されない場合は、[フィールド名] を、ユース ケースをより具体的に表す名前に変更してください。フィールド名を変更すると、パフォーマンスが向上する場合があります。
以下のフィールド名は例にすぎず、フィールドの命名方法はユース ケースや、抽出しようとしているデータのコンテキストによって異なります。
ユースケース | 非推奨のフィールド名 | パフォーマンスが向上するフィールド名 |
---|---|---|
住所変更の要求時に、新しい住所の詳細を抽出して、下流のシステムに入力する必要がある。 |
|
|
ロジスティクス出荷要求の一部として、SAP に入力する各商品の合計税内訳 (VAT 額と VAT 率の両方) を特定する必要がある。 |
|
|
請求書の変更要求時に、古い請求書番号と新しい番号を特定し、古い請求書をキャンセルして新しい請求書を再発行する必要がある。 |
|
|
エンドツーエンドのオートメーションに役立つフィールドには、以下の 2 種類があります。
- 一般フィールド
- 抽出フィールド
Communications Mining で利用可能なさまざまな種類のフィールドと、それぞれいつ使用したらよいかを理解することが重要です。
一般フィールド | 抽出フィールド |
---|---|
一般フィールドとは、抽出対象のフィールドのことであり、データセット内の複数の異なるトピック/ラベルにまたがって存在する可能性があります。
| 抽出フィールドとは、特定のラベルに基づいて条件付け (および作成) されるフィールドのことです。つまり、自動化する特定のラベルに関連付けられます。
|
次の表は、一般フィールドと抽出フィールドの主な違いを示しています。2 つのまったく異なるモデルでこれらの種類のフィールドが予測されるため、違いを確認しておいてください。
フィールドの種類 | 予測 | 確認のレベル | スパンレス* 対 スパンあり* | スパンの重複 | 同じ種類のフィールド間でフィールドの種類を共有する | サポートされているデータ型** |
一般フィールド | データセット全体で自動的に | 段落レベル | スパンフルのみ | 不可 | (現時点では) 不可 |
|
抽出フィールド | (現時点では) オンデマンドのみ | メッセージ レベル (ラベルのコンテキスト内) | スパンフルとスパンレスの両方 | 可能 | 可能 |
|
このガイドの「スパンありフィールドとスパンなしフィールド」ページの「スパンなしフィールド」をご覧ください。
このガイドの「データ型」ページの各フィールドの種類でサポートされるデータ型を確認してください。
以下の手順に従って、[探索] ページで一般フィールドと抽出フィールドの両方を設定または変更できます。
- ラベルを含むコミュニケーション ([探索] の抽出フィールドを定義する場所) で、[フィールドのアノテーションを行う] を選択します。
- 抽出フィールドを設定する場合は、右側の [フィールドのアノテーション] バーのラベル名の横にカーソルを合わせて、[フィールドを管理] を選択します。一般フィールドを設定する場合は、[一般フィールド] の横にカーソルを合わせて、そこでフィールドを管理します。
- [新しい抽出フィールド] を選択して、新しい抽出フィールドを追加します。複数のフィールドを追加できます。
- 抽出フィールド名と抽出するフィールドの種類 を入力します。既存のフィールドの種類を選択するか、抽出対象のフィールドの種類が設定されていない場合は新たに作成します。
- 右下の [保存] を選択して抽出フィールドを保存します。
以下の手順に従って、[設定] ページで一般フィールドと抽出フィールドの両方を設定または変更します。
[トレーニング] でもフィールドを設定するには、以下の手順に従ってください。
- [設定]、[タクソノミー] の順に移動します。
- 抽出フィールドを作成するには、[ラベルとフィールド] タブに移動します。
- 抽出フィールドを作成する特定のラベルで、ドロップダウン メニューを選択します。ドロップダウンを選択すると、指定したラベルのすべてのフィールドのリストが展開されます。
- 新しい抽出フィールドを追加するには、下部の [抽出フィールド] を選択します。
- [フィールド名] と [抽出フィールドの種類] を入力して、新しい抽出フィールドを設定します。
- 新しい一般フィールドを作成するには、[一般フィールド] タブに移動します。右上隅の [新しいフィールド] を選択します。
- [フィールド名] と [一般フィールドの種類] を入力して、新しい一般フィールドを設定します。
フィールドを設定するときには、特定のデータ型を選択する必要があります。
- 日付
- Exact Text
- Inferred Text
- 金額
- Number
The following table details when to use each type.
フィールドの種類 | ||||
データ型 | 一般フィールド | 抽出フィールド | 説明 | 例 |
文字列 | X | X | 文字列には、任意の文字 (各種文字のほか、数字など) を含めることができます。
文字列には、メッセージに明示的に存在する (スパンフル) 入力値、または推論される (スパンレス) 入力値を含めることもできます。詳細については、以下を確認してください。 |
|
日付* | X | X | 日付にはさまざまな非構造化形式があり、UiPath® の事前トレーニング済みの日付フィールドが使用されます。
|
|
数値 | X | X | 数量はさまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの数量フィールドを使用して数値が解釈されます。
|
|
金 額* | X | X | 同様に、金額も通常はさまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの金額モデルが使用されます。
|
|
正規表現 | X | | 特定のフィールドを常に特定の形式で抽出する必要がある場合は、正規表現を使用してルールを設定できます。詳しくは、UiPath® の公式ドキュメントをご覧ください。 |
|
テンプレート | X | | サポートされているテンプレートのリストについては、UiPath® の公式ドキュメントをご覧ください。 |
|
多くのフィールドは、下流工程用に構造化データ形式に正規化する必要があります。
プラットフォーム内では、金額と日付は自動的に正規化される一般フィールドの種類です。詳細については、フィールドの正規化に関する UiPath® の公式ドキュメントをご覧ください。
スパンフル フィールドとは
スパンフル フィールドとは、テキストに明示的に記載されているデータ ポイントのことです (取引 ID、ポリシー番号など)。
スパンレス フィールドとは
スパンレス フィールドとは、テキストに明示的に記載されていない可能性があるものの、メッセージから抽出する必要がある (つまり、メッセージから推測できる) データ ポイントのことです。つまり、抽出したいテキストの範囲がメッセージに必ずしも存在するとは限りません。
一般フィールドを設定するときに、入力値がメッセージに存在する必要があるかどうか、または入力値をメッセージから推測できる (つまり、テキストからそのまま抽出する必要がある) かどうかを指定します。
スパンレスにする必要がある場合のあるフィールドの例をいくつか示します。
- 正規化する必要がある値 (日付など)。
- メール内の複数の領域にわたり連結する必要がある値。
- メールのどこにも存在しないものの、メールの特性から暗示される値。
- 複数の段落、行、または列にまたがる (つまり、連続したスパンには表示されない) 値。
フィールドの種類は、新しいフィールドの初期ステートです。使用するフィールドの種類がない場合は、以下の手順に従って新しいフィールドの種類を設定します。新しいフィールドの種類は、フィールドの作成時にドロップダウンから設定できますが、必要に応じてフィールドの種類ページ自体でも設定できます。
できるだけ幅広くフィールドの種類を設定してから、より細かく微調整します。
- A - フィールドの種類に名前を付けます。
注: フィールドの種類名は、フィールド名とは違い、モデルによってコンテキストとしては使用されません。
- B - 抽出フィールド用の新しいフィールドの種類を設定するか、一般フィールドを設定するかを定義します。
- C - 一般フィールドまたは抽出フィールドを設定する場合、そのフィールドの種類に固有のデータ型を選択する必要があります。
注: 抽出に新しいフィールドの種類を設定するか、一般フィールドを設定するかによって、設定できるデータ型が異なる場合があります。選択したデータ型に応じて、追加の構成も適用できます。
[探索] ページ、または [トレーニング] タブの [設定] ページで、新しいフィールドの種類を設定できます。
フィールドの種類にデータ型を設定すると、後から変更することはできなくなります。フィールドの種類を作成するときには、正しいデータ型を選択してください。正しいデータを選択しなかった場合は、フィールドの種類を削除し、正しいデータ型で再作成する必要があります。
[設定] ページから、抽出フィールドと一般フィールドの両方に新しいフィールドの種類を設定できます。
[設定] ページで新しいフィールドの種類を設定するには、以下の手順に従ってください。
(1) [設定] > (2) [タクソノミー] > (3) [フィールドの種類] > (4) [新しいフィールドの種類] > (5) フィールドの種類を設定します。
[探索] ページでフィールドの種類を設定するには、以下の手順に従ってください。
(1) [探索] > (2) [フィールドのアノテーションを行う] > (3) 一般フィールドまたは抽出フィールドのセクションの横にある 3 点リーダーをクリックします。新しいフィールドの種類は、それぞれのセクションでのみ作成できます > (4) [フィールドを管理] > (5) フィールドの種類ドロップダウンを選択してから、[新しいフィールドの種類] を選択します。フィールドの種類を設定します。