ixp
latest
false
- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など
生成された抽出データを検証してアノテーションを行う

Communications Mining ガイド
最終更新日時 2025年8月11日
このセクションでは、抽出でフィールドの予測を検証する方法について説明します。
抽出には、次の種類があります。
- 生成される抽出データ - モデルは、指定した入力 ([ 抽出データを予測] を選択した場合のラベルとアノテーション) に基づいて抽出データを予測します。
- 手動で作成した抽出 - モデルがまだラベルを予測していない場合に、特定のラベルの抽出フィールドを作成できます。
モデルが検証の統計情報を返すことができるように、十分な例を提供してください。検証の統計情報は、抽出のパフォーマンスを理解するのに役立ちます。また、抽出を微調整することもできます。
微調整すると、収集したアノテーションを使用して抽出モデルのパフォーマンスを向上させることができます。また、すぐに使えるモデルを使用して、ユース ケースのパフォーマンスを向上させることもできます。
注:
- ラベルのトレーニングを停止するタイミングを指定できます
- 抽出のパフォーマンス要件は、ユース ケースによって異なります。
大事な: ベスト プラクティスとして Preview LLMを使用する場合は、各フィールドの例が 25 個になったら、それ以上例のアノテーションを行うのをやめます。 コンテキスト内の学習と検証にはこれで十分であり、例を増やしてもパフォーマンスは向上しません。
抽出結果を確認し、状況に応じて以下のアクションのいずれかを選択できます。
- 抽出がすべて正しければ、抽出を受け入れます。
- 誤った予測がある場合は、抽出データを修正します。
- 抽出データがメッセージに存在しない場合は、存在しないとしてマークします。
- エンドツーエンドで自動化するために必要なフィールドが存在しない場合は、それらのフィールドを追加で設定します。
概要
# | 説明 |
1 | フィールドの予測がすべて正しい場合は、[すべて確認] を選択して、アノテーションが正しいことを一括で確認します。 |
2 | 新しい抽出フィールドを追加するには、[一般フィールド] の横またはいずれかの抽出フィールドの横にあるプラス ボタンを選択します。既存のフィールドを編集するには、[一般フィールド] の横またはいずれかの抽出フィールドの横にある縦三点リーダー ボタンを選択します。 |
3 | サイド パネルで、予測された抽出データの横にあるボックスをオンにすると、フィールドのアノテーションが正しいことが抽出レベルで確認されます。 |
4 | 各フィールドの下で、モデルによって予測されたデータ ポイントを確認できます。
予測が正しくない場合は、[x] ボタンを選択してフィールドの予測が正しくなるよう調整します。 |
5 | 予測されたデータ ポイントは、元のメッセージ内でマークされます。
|
6 | フィールドを追加または変更するには、該当の [一般フィールド] または [抽出フィールド] セクションで、[+] ボタンの横にカーソルを合わせます。 |
7 | 一般フィールドまたは特定の抽出フィールドに表示されるフィールドを展開するには、ドロップダウン ボタンを選択します。 |
抽出結果を検証する
抽出データを検証するには、以下の手順を実行します。
- データセットの横にある [探索] を選択して、その特定のデータセットにアクセスします。
- [探索] タブで [フィールドのアノテーションを行う] を選択します。
- サイド パネルで、[抽出データを予測] ボタンを選択します。
- 同じサイド パネルに、赤または緑の円でマークされた一致インジケーターがモデルの予測の横に表示されます。
注: 一致インジケーターは、ユーザーが抽出フィールドに対して行ったアノテーションとモデルの予測が一致するかどうかを示します。インジケーターは、赤または緑の円で抽出フィールド レベルおよび抽出データ レベルでユーザー インターフェイスにマークされます。値が一致しない場合は、値が一致しないか欠落しています。最新のモデルの予測を再実行して、指定したアノテーションと一致するかどうかを確認できます。一致インジケーターによって返される可能性のあるステートは次のとおりです。
- 緑 - 予測はアノテーションと一致します。すべての抽出フィールドに緑色のインジケーターが付いている場合にのみ、抽出レベルで表示されます。
- 赤 - 予測がアノテーションと一致しないか、予測にアノテーションが欠落しています。抽出データ内のいずれかのフィールドに赤色のインジケーターが付いている場合に、抽出レベルで表示されます。
未確認ステートの抽出
以下の図は、未確認ステートの抽出データの外観を示しています。右側のペインでは、抽出は未確認としてマークされ、テキスト自体は明るい色で強調表されます。
注: [一般フィールド] についても、上記同様です。
確認済みステートの抽出
以下の図は、確認済みステートのフィールドの外観を示しています。右側のペインでは、抽出データは確認済みとしてマークされ、テキスト自体は濃い色で強調表示されます。
注: [一般フィールド] についても、上記同様です。
注: [トレーニング] タブの [抽出] はパブリック プレビューの段階です。
[トレーニング] タブでの抽出データの検証は、[探索] タブの場合と同様の方法で行います。
抽出データを検証するには、以下の手順を実行します。
- データセットの横にある [トレーニング] を選択して、その特定のデータセットにアクセスします。
- [トレーニング] タブで [抽出] を選択します。
- 検証するラベルの抽出データを選択します。
- 表示されたメッセージがラベルの適用可能な例であるかどうかを確認します。
- 適用可能なラベルをすべて適用したら、[次: フィールドのアノテーションを行う] を選択します。
- 次のページでは、赤または緑の円でマークされた一致インジケーターがモデル予測の横に表示されます。
注: 一致インジケーターは、ユーザーが抽出フィールドに対して行ったアノテーションとモデルの予測が一致するかどうかを示します。インジケーターは、赤または緑の円で抽出フィールド レベルおよび抽出データ レベルでユーザー インターフェイスにマークされます。値が一致しない場合は、値が一致しないか欠落していることがわかります。最新のモデルの予測を再実行して、指定したアノテーションと一致するかどうかを確認できます。一致インジケーターによって返される可能性のあるステートは次のとおりです。
- 緑 - 予測はアノテーションと一致します。すべての抽出フィールドに緑色のインジケーターが付いている場合にのみ、抽出レベルで表示されます。
- 赤 - 予測がアノテーションと一致しないか、予測にアノテーションが欠落しています。抽出データ内のいずれかのフィールドに赤色のインジケーターが付いている場合に、抽出レベルで表示されます。
- [すべて確定して次へ] を選択すると、次のメッセージが表示されて自動的にアノテーションが行われます。