ixp
latest
false
- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
最終更新日時 2025年10月20日
「バランス」とは、モデルのトレーニング データがデータセット全体をどの程度適切に代表しているかを表す場合に使用される用語です。
モデルがどの程度バランスがとれているかを評価する場合、トレーニング データとデータセット全体との間のアンバランスの原因となり得るアノテーションの偏りが検索されます。
このために、アノテーションの偏りモデルを使用して、確認済みのデータと未確認のデータを比較し、アノテーションされたデータがデータセット全体を代表していることが確認されます。データが代表的ではない場合、モデルのパフォーマンス指標は誤解を招くものになり、信頼できない可能性があります。
アノテーションの偏りは通常、ラベルの割り当てに使用したトレーニング モードのバランスがとれていなかった結果です。特に、[テキスト検索] を使用しすぎてシャッフル モードを十分に使用していない場合にあてはまります。
リバランス トレーニング モードは、確認済みのセット内の代表性の低いメッセージを示します。このモードで例にアノテーションを行うと、データセット内のアンバランスに素早く対処できます。