- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
- モデルのトレーニング プロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[探索] で既存のスキーマにフィールドを追加したりできます。
- [探索] で抽出を設定すると、以下のことが可能になります。
- メッセージのデータに基づいてフィールドを作成する。
- 新しいフィールドがあったら抽出に追加する。
- モデルのトレーニング プロセスの任意の時点で、新しい抽出を設定したり、スキーマを変更したり、[設定] で既存のスキーマにフィールドを追加したりできます。
- 抽出するフィールドが事前にわかっている場合は、[設定] で一括抽出を設定します。
抽出を設定するには、名前とフィールドの種類が必要なフィールドを設定します。これは、最も低い子レベルのラベルで行うことをお勧めします。
わかりやすい簡潔な名前にします。フィールドのデータを正確に表すフィールド名を選びます。簡潔さと明瞭さのバランスを考慮してください。フィールドには正確でわかりやすい名前を付けます。フィールドの役割に関する必要なコンテキストをモデルに提供できるようにするためです。
たとえば、住所が変更された場合に、新しい住所のみを抽出するには、新しい番地、新しい市区町村、新しい郵便番号、というフィールド名を設定しておくと便利です。
あいまいなフィールド名は避けてください。フィールド名は明確な、プロジェクト内の他のフィールドや概念と区別のつきやすいものにしてください。たとえば、Value (値) ではなく、Sales Amount (売上) や Account Balance (アカウント残高) などのより具体的な名前を使用します。
抽出フィールドの場合は、同じ種類のフィールドを複数作成できますが、一般フィールドの場合は不可能です。一般フィールドでこの問題に対処するには、同じ設定で別の種類のフィールドを作成します。
[フィールド名] は、モデルにプロンプトを入力するために使用されます。抽出が期待どおりに実行されない場合は、[フィールド名] を、ユース ケースをより具体的に表す名前に変更してください。フィールド名を変更すると、パフォーマンスが向上する場合があります。
以下のフィールド名は例にすぎません。そのため、フィールドの命名方法はユース ケースや、抽出しようとしているデータのコンテキストによって異なります。
ユースケース | 非推奨のフィールド名 | パフォーマンスが向上するフィールド名 |
---|---|---|
住所変更の要求時に、新しい住所の詳細を抽出して、下流のシステムに入力する必要がある。 |
|
|
ロジスティクス出荷要求の一部として、SAP に入力する各商品の合計税内訳 (VAT 額と VAT 率の両方) を特定する必要がある。 |
|
|
請求書の変更要求時に、古い請求書番号と新しい番号を特定し、古い請求書をキャンセルして新しい請求書を再発行する必要がある。 |
|
|
エンドツーエンドのオートメーションに役立つフィールドには、以下の 2 種類があります。
- 一般フィールド
- 抽出フィールド
Communications Mining で利用可能なさまざまな種類のフィールドと、それぞれいつ使用したらよいかを理解することが重要です。
一般フィールド | 抽出フィールド |
---|---|
一般フィールドとは、抽出対象のフィールドのことであり、データセット内の複数の異なるトピックやラベルにまたがって存在する可能性があります。
| 抽出フィールドとは、特定のラベルに基づいて条件付けおよび作成されるフィールドのことです。つまり、自動化する特定のラベルに関連付けられます。
|
次の表は、一般フィールドと抽出フィールドの主な違いを示しています。2 つのまったく異なるモデルでこれらの種類のフィールドが予測されるため、違いを確認しておいてください。
フィールドの種類 | 予測 | 確認のレベル | スパンレス* 対 スパンあり* | スパンの重複 | 同じ種類のフィールド間でフィールドの種類を共有する | サポートされているデータ型** |
一般フィールド | データセット全体で自動的に | 段落レベル | スパンフルのみ | 不可 | 不可 |
|
抽出フィールド | オンデマンドのみ | メッセージ レベル (ラベル コンテキスト内) | スパンフルとスパンレスの両方 | 可能 | 可能 |
|
*詳しくは、「 スパンありフィールド」および「スパンなしフィールド」をご覧ください。
**各フィールドがサポートするデータ型について詳しくは、「 フィールドの種類を設定する」をご覧ください。
抽出フィールドの例
この例では、これら 2 つのラベルのエンドツーエンドのオートメーションの促進に関連する抽出フィールドをプラットフォームが識別できます。
一般フィールドの例
この例では、プラットフォームは、タクソノミーの特定のラベルがこのメッセージに適用されるかどうか確信がありせん。ですが、メッセージ自体から特定のフィールドを抽出することはできます。一般フィールドを設定すると、プラットフォームはラベルの予測に関係なくこれらのフィールドを識別できます。
[探索] ページで一般フィールドと抽出フィールドの両方を設定または変更するには、以下の手順を実行します。
- ラベルを含むコミュニケーション ([探索] の抽出フィールドを定義する場所) で、[フィールドのアノテーションを行う] を選択します。
- 抽出フィールドを設定する場合は、右側の [フィールドのアノテーション] バーのラベル名の横にカーソルを合わせて、[フィールドを管理] を選択します。一般フィールドを設定する場合は、[一般フィールド] の横にカーソルを合わせて、そこでフィールドを管理します。
- [新しい抽出フィールド] を選択して、新しい抽出フィールドを追加します。複数のフィールドを追加できます。
- 抽出フィールド名と抽出するフィールドの種類 を入力します。既存のフィールドの種類を選択するか、抽出対象のフィールドの種類が設定されていない場合は新たに作成します。
- [保存] を選択して抽出フィールドを保存します。
[設定] ページで一般フィールドと抽出フィールドの両方を設定または変更するには、以下の手順を実行します。
[トレーニング] でもフィールドを設定するには、以下の手順に従ってください。
- [設定]、[タクソノミー] の順に移動します。
- 抽出フィールドを作成するには、[ラベルとフィールド] タブに移動します。
- 抽出フィールドを作成する特定のラベルで、ドロップダウン メニューを選択します。ドロップダウンを選択すると、指定したラベルのすべてのフィールドのリストが展開されます。
- 新しい抽出フィールドを追加するには、下部の [抽出フィールド] を選択します。
- [フィールド名] と [抽出フィールドの種類] を入力して、新しい抽出フィールドを設定します。
- 新しい一般フィールドを作成するには、[一般フィールド] タブに移動します。右上隅の [新しいフィールド] を選択します。
- [フィールド名] と [一般フィールドの種類] を入力して、新しい一般フィールドを設定します。
- 日付
- Exact Text (実際のテキスト)
- Inferred Text
- 金額
- Number
以下の表に、各フィールドの種類をどのような場合に使用するかを示します。
フィールドの種類 | ||||
データ型 | 一般フィールド | 抽出フィールド | 説明 | 例 |
文字列 | X | X | 文字列には、各種文字のほか、数字など、任意の文字を含めることができます。
文字列には、メッセージに明示的に存在する (スパンフル) 入力値、または推論される (スパンレス) 入力値を含めることもできます。詳しくは、スパンフル フィールドについての説明をご覧ください。 |
|
日付* | X | X | 日付はさまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの日付フィールドが使用されます。
|
|
数値 | X | X | 数量はさまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの数量フィールドを使用して数値が解釈されます。
|
|
金 額* | X | X | 金額は通常、さまざまな非構造化形式で取得され、UiPath® の事前トレーニング済みの金額モデルが使用されます。
|
|
正規表現 | X | | If a specific field always needs to be extracted in a specific format, the rules can be configured with RegEx. For more details, check Building custom regex general fields. |
|
テンプレート | X | | サポートされているテンプレートのリストを確認してください。 |
|
* プラットフォーム内では、金額と日付は自動的に正規化される一般フィールドの種類です。フィールドの正規化について詳しくは、「 一般フィールドの書式設定」をご覧ください。
スパンフル フィールド
スパンフル フィールドとは、取引 ID、保険証券番号など、テキストに明示的に記載されているデータ ポイントのことです。
スパンレス フィールド
スパンレス フィールドとは、テキストに明示的に記載されていない可能性があるものの、メッセージから抽出する必要がある (つまり、メッセージから推測できる) データ ポイントのことです。つまり、抽出したいテキストの範囲がメッセージに必ずしも存在するとは限りません。
一般フィールドを設定するときに、入力値がメッセージに存在する必要があるかどうか、または入力値をメッセージから推測できる (つまり、テキストからそのまま抽出する必要がある) かどうかを指定します。
スパンレスにする必要がある場合のあるフィールドの例を以下にいくつか示します。
- 正規化する必要がある値 (日付など)。
- メール内の複数の領域にわたり連結する必要がある値。
- メールのどこにも存在しないものの、メールの特性から暗示される値。
- 複数の段落、行、または列にまたがる値。つまり、連続したスパンには表示されない値。
- Must be present in the message - This option is spanful.
- Inferred from the message - This option is spanless.
新しいフィールドの種類を作成する
フィールドの種類は、新しいフィールドの初期ステートです。使用するフィールドの種類がない場合は、以下の手順を適用して新しいフィールドの種類を設定します。新しいフィールドの種類は、フィールドの作成時にドロップダウン メニューから設定できますが、フィールドの種類ページ自体でも設定できます。
- Name - Give your field type a name.
注: フィールドの種類名は、フィールド名とは違い、モデルによってコンテキストとしては使用されません。
- Define for - Define whether you are setting up a new field type for an extraction field or a general field. Select one of the following options: Extraction field or General field.
- Data type - When setting up your general fields or extraction fields, select the specific data type for the field type.
注: 抽出に新しいフィールドの種類を設定するか、一般フィールドを設定するかによって、設定できるデータ型が異なる場合があります。選択したデータ型に応じて、追加の構成も適用できます。
- Input value - Select one of the following options:
- Must be present in the message - The value must be present as a continuous span of text in the message.
- Inferred from the message - The value can be inferred from the context in the message. You can input values and optionally annotate evidence from the message.
Creating a new field type (Settings tab)
[探索] タブ、または [トレーニング] タブの [設定] タブで、新しいフィールドの種類を設定できます。
フィールドの種類にデータ型を設定すると、後から変更することはできなくなります。フィールドの種類を作成するときには、正しいデータ型を選択してください。正しいデータを選択しなかった場合は、フィールドの種類を削除し、正しいデータ型で再作成する必要があります。
[設定] タブから、抽出フィールドと一般フィールドの両方に新しいフィールドの種類を設定できます。
[設定] タブで新しいフィールドの種類を設定するには、以下の手順に従ってください。
- [設定] ページに移動します。
- [タクソノミー] タブを選択します。
- [ フィールドの種類 ] タブを選択します。
- [新しいフィールドの種類] を選択します。
- 新しいフィールドの種類を設定します。
[探索] で新しいフィールドの種類を作成する
新しいフィールドの種類を設定するには、次の手順を実行します。
- [探索] タブで [フィールドのアノテーションを行う] を選択します。
- 一般フィールドまたは抽出フィールドの横にある縦三点リーダー ボタンを選択します。
- [フィールドを管理] を選択します。
注: 新しいフィールドの種類は、抽出フィールドのそれぞれのセクションでのみ作成できます。
- [フィールドを管理] セクションで、[フィールドの種類] ドロップダウン メニューを選択します。
- [新しいフィールドの種類] を選択し、フィールドの種類を設定します。