- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
「教える」は探索フェーズの 2 番目の手順にあたり、その目的は、ラベルが適用されるかどうかについてモデルが最も混乱しているラベルの予測を表示することです。前の手順と同様に、予測が正しいか間違っているかを確認し、それによってモデルに強力なトレーニング シグナルを提供する必要があります。これは最も重要な、ラベル固有のトレーニング モードです。
「ラベルを教える」は、未確認のメッセージに対するアノテーションに特化したトレーニング モードです。そのため、このモードでは [確認済み] フィルターは無効化されます。
- ドロップダウン メニューから [ ラベルを教える ] を選択します (次の図を参照)。
- トレーニングするラベルを選択します。「教える」モードでは、既定で未確認のメッセージを表示するように選択されています。
- 選択したラベルが適用されているかどうかについてモデルが最も混乱しているメッセージが選択され、提示されます。つまり、予測を確認して、正しければラベルを適用し、正しくなければ他のラベルを適用する必要があります。
注:
- 予測の範囲は、感情が有効化されていないデータでは最大 50%、感情が有効化されたデータでは 66% です。
- 必ず、適用される他のすべてのラベルに加え、焦点を当てている特定のラベルも適用してください。
必要に応じて、このトレーニング モードを使用して各ラベルのトレーニング例の数を 25 個以上に増やし、プラットフォームがラベルのパフォーマンスを正確に推定できるようにする必要があります。
各ラベルで十分なパフォーマンスを達成するために必要な例の数は、さまざまな要因によって異なります。各ラベルのパフォーマンスを理解して改善する方法については、改良フェーズで対応します。
このプラットフォームでは、特定のラベルのパフォーマンスを改善する手段として「ラベルを教える」を使用するよう定期的に推奨されます。これによってさらに多様なトレーニング例を提供し、その例を使用して、ラベルを適用すべきデータセット内の他のインスタンスを識別できます。
発見とシャッフルを実行しても、一部のラベルにまだ例がほとんどなく、「ラベルを教える」モードで有用なトレーニング例が明らかにならない場合があります。この場合、次のトレーニング モードを使用して、学習すべき例をさらにプラットフォームに提供することをお勧めします。
[探索] での語句やフレーズの検索は、[発見] での検索と同じように機能します。2 つの主な違いの 1 つは、[探索] では検索結果を個別に確認してアノテーションを行う必要があるのに対し、[発見] では一括でアノテーションを行う点です。[探索] で検索するには、ページの左上にある検索ボックスに検索語句を入力します。
ただし、検索を使用しすぎるとモデルに偏りが生じる可能性があります。これは避けるべき問題です。このトレーニング モードでは、追加する例をラベルあたり 10 個未満にし、アノテーションの偏りを避けます。また、「教える」モードに戻る前に、プラットフォームが再トレーニングする時間を確保してください。
詳しくは 、[探索] タブの「検索を使用してトレーニングする」をご覧ください。
オプション 2 - ラベル
ラベルを使用したトレーニングは、探索フェーズで概説されている主要な手順の 1 つではありませんが、トレーニングのこのフェーズで役立つことに変わりはありません。ラベル モードでは、そのラベルが予測されているメッセージが信頼度順に降順で表示されます。つまり、最も信頼度の高い予測が先頭に表示され、最も信頼度の低い予測が最後に表示されます。
ただし、このモードが役に立つのは、90% を超える高信頼度ではない予測を確認する場合のみです。その理由は、モデルの信頼度が非常に高い (90% 超) 場合、予測を確認してもモデルに新しい情報は伝わらず、モデルはラベルが適用されることにすでに自信を持っているためです。必要に応じて、ページのさらに下の方にある、信頼度の低い例を探します。ただし、信頼度が高い予測が誤っている場合は、正しいラベルを適用し、それによって誤った予測を却下してください。