- 基本情報
- 管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining
- ライセンス情報
- よくある質問など
[改良] について
3 番目のフェーズはトレーニング プロセスの最後のステップであり、「改良」と呼ばれます。このステージの目的は、モデルのパフォーマンスを把握し、必要なパフォーマンスになるまでモデルを改良することです。これには、期待どおりのパフォーマンスではない特定のラベルの改善、関連するラベルの概念をすべてキャプチャしていることの確認、およびトレーニング データがデータセット全体をバランスよく反映していることの確認が含まれます。
このプラットフォームは、ユーザーがモデルのパフォーマンスをまったく意識しなくても済むように設計されているほか、パフォーマンスの改善が必要な領域で非常に柔軟にパフォーマンスを改善できるように設計されています。どのようなユース ケースであっても、モデルがデータセットを正確に代表する内容をキャプチャしていることを確信する必要があり、このトレーニング フェーズによってその確信を持つことができます。
ナレッジ ベースのこのセクションでは、以下に概説する手順について詳しく説明しますが、まず、適合率と再現率、検証の仕組み、およびモデルのパフォーマンスのさまざまな側面を理解する方法について詳しく説明します。
主な手順
モデルの評価を確認する - この手順では、[検証] でモデルの評価を確認し、モデルにパフォーマンスの問題があると考えられる箇所とその問題への対処方法に関するガイダンスを確認します。このセクションには、モデルのパフォーマンスの理解と改善について詳しい説明が含まれます。
ラベルのパフォーマンスを改良する - この手順では、推奨されるアクションを実行してラベルのパフォーマンスを改善します。これには、アノテーションの潜在的な不整合に対処するのに役立つ「ラベルを確認」と「見逃されたラベル」のトレーニング モードを使用することと、「ラベルを教える」モードを使用することが含まれます (詳しくは、こちらの探索フェーズで説明します)。
カバレッジを拡大する - この手順は、できるだけ多くのデータセットが意味のあるラベル予測で網羅されるようにするのに役立ちます。
バランスを改善する - この手順では、トレーニング データがデータセット全体をバランスよく反映するようにします。データセットのバランスを改善することで、アノテーションの偏りを減らし、予測の信頼性を向上できます。