- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
適合率では、モデルが行う予測のうち、実際に正しかったものの割合を測定します。つまり、モデルが行ったすべての真の予測のうち、 真陽性 の割合が特定されます。
適合率 = 真陽性 / (真陽性 + 偽陽性)
たとえば、「情報のリクエスト」というラベルが適用されると予測されているメッセージがデータセット内に全部で 100 件ある場合、適合率とは、「情報のリクエスト」が予測された合計回数のうち、そのラベルが正しく予測された回数の割合です。
95% の適合率とは、特定のラベルを持つと予測されたメッセージが全部で 100 件ある場合、95 件に正しくアノテーションが行われ、5 件に間違ったアノテーションが行われている (つまり、そのラベルにアノテーションが行われるべきではない) ことを意味します。
適合率の仕組みについて詳しくは、「 適合率と再現率の説明」をご覧ください。
個々のラベルの AP のスコアは、そのラベルの再現率の値 (0 から 100%) それぞれにおける、すべての適合率スコアの平均として計算されます。
基本的に、平均適合率では、そのラベルのすべての信頼度しきい値でのモデルのパフォーマンスを測定した値です。
mAP は、モデルの総合的なパフォーマンスを示す最も有用な指標の 1 つであり、異なるモデル バージョンを相互に簡単に比較できます。
mAP スコアでは、[検証] で使用されるトレーニング セット内に 20 個以上の例が含まれる、タクソノミー内のすべてのラベルの平均適合率スコアの平均値を計算します。
一般的には、mAP スコアが高いほどモデルの総合的なパフォーマンスは良好ですが、モデルの健全性を把握する際に考慮すべき要因はこれだけではありません。モデルに偏りがなく、カバレッジが高いことを確認することも重要です。