- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
抽出データを生成する
前提条件
パフォーマンス指標や警告がなくユース ケースに適した適合率または再現率レベルのラベルを選択します。
抽出の検証プロセスは、検証を通じてこれらの抽出のパフォーマンスを把握するために必要です。
トレーニングする抽出データを決定します。Report (レポート) > Statement of Accounts (勘定書) を、トレーニングするスキーマの例として使用します。
このプロセスを自動化するには、次のデータ ポイントを抽出して下流のシステムに入力します。
![[タクソノミー] タブの作成された抽出フィールドのリスト。](https://dev-assets.cms.uipath.com/assets/images/ixp/ixp-list-of-created-extraction-fields-in-the-taxonomy-tab-601190-f1e094c5.webp)
これは、[ 探索] でトレーニングしている場合にのみ当てはまることです。[トレーニング] では、抽出トレーニング バッチを選択すると、抽出データが事前に読み込まれます。必要に応じてこのトレーニング モードを使用して、各抽出のトレーニング例の数 (つまり、ラベルに割り当てられた一連のフィールド) の数を 25 以上に増やします。これにより、モデルは抽出のパフォーマンスを正確に推定できます。
Preview LLM を使用する場合は、各フィールドの例が 25 個になったら、それ以上例にアノテーションを行うのを止めることをお勧めします。コンテキスト内学習と検証には 25 個で十分であり、例を増やしてもパフォーマンスは向上しません。
手順
抽出データを生成するには、以下の手順に従います。
-
[探索] タブに移動します。
-
[ ラベル] を選択し、抽出データを生成するラベルを選択します。
![この画像は、抽出データを生成するラベルを選択したときの [探索] ページを示しています。](https://dev-assets.cms.uipath.com/assets/images/ixp/ixp-this-image-depicts-the-explore-page-when-selecting-the-label-to-generate-extractions-on-436347-f867efb5.webp)
-
[抽出データを予測] を選択します。[探索] でページごとに抽出データが生成されます。つまり、指定したページのすべてのコメントに予測が適用されます。
注:次のページに移動するたびに、再度 [ 抽出データを予測 ] を選択する必要があります。
さらに、[ フィールドのアノテーションを行う]、[ 抽出データを予測] の順に選択して、個別のコメント レベルで抽出データを生成できます。詳しくは、「 抽出データを予測する」をご覧ください。
4. 抽出予測を行った後、モデルがコメントの抽出されたフィールドを取得すると、テキスト内の関連する範囲が強調表示されます。モデルのサイド パネルに抽出された値が表示されます。予測値の検証方法については、「 生成された抽出データを検証してアノテーションを行う」をご覧ください。

抽出データを予測する
このセクションでは、抽出データを予測した場合の動作について説明します。
- このモデルでは、生成 AI モデルを使用し、抽出スキーマで以前に定義した各データ ポイントをマッピングして、それらを意図 (ラベル) に関連付けます。
- それらデータ ポイントを抽出して構造化されたスキーマで返し、SME が確認できるようにします。
- 構造化スキーマは、より複雑なオートメーションを可能にすることを意図したものであり、下流のオートメーションで使用できるよう API 内で JSON 形式で構造化されています。