- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
3 番目のフェーズはトレーニング プロセスの最後のステップであり、改良と呼ばれます。このステージの目的は、モデルのパフォーマンスを把握し、必要なパフォーマンスになるまでモデルを改良することです。これには、期待どおりのパフォーマンスではない特定のラベルの改善、関連するラベルの概念をすべてキャプチャしていることの確認、およびトレーニング データがデータセット全体をバランスよく反映していることの確認が含まれます。
このプラットフォームは、ユーザーがモデルのパフォーマンスをまったく意識しなくても済むように設計されているほか、パフォーマンスの改善が必要な領域で非常に柔軟にパフォーマンスを改善できるように設計されています。どのようなユース ケースであっても、モデルがデータセットを正確に代表する内容をキャプチャしていることを確信する必要があり、このトレーニング フェーズによってその確信を持つことができます。
ナレッジ ベースのこのセクションでは、以下に概説する手順について詳しく説明しますが、まず、適合率と再現率、検証の仕組み、およびモデルのパフォーマンスのさまざまな側面を理解する方法について詳しく説明します。
-
モデルの評価を確認する - この手順では、[検証] でモデルの評価を確認し、モデルにパフォーマンスの問題があると考えられる箇所とその問題への対処方法に関するガイダンスを確認します。このセクションには、モデルのパフォーマンスの理解と改善について詳しい説明が含まれます。
-
ラベルのパフォーマンスを改良する - この手順では、推奨されるアクションを実行してラベルのパフォーマンスを改善します。これには、アノテーションの潜在的な不整合に対処するのに役立つ「ラベルを確認」と「見逃されたラベル」のトレーニング モードを使用することと、「ラベルを教える」モードを使用することが含まれます。詳しくは、「[ラベルを教える] を使用したトレーニング (探索)」をご覧ください。
-
カバレッジを拡大する - できるだけ多くのデータセットが意味のあるラベル予測で網羅されるようにするのに役立ちます。
-
バランスを改善する - この手順では、トレーニング データがデータセット全体をバランスよく反映するようにします。データセットのバランスを改善することで、アノテーションの偏りを減らし、予測の信頼性を向上できます。