- 基本情報
- 管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining
- ライセンス情報
- よくある質問など
Communications Mining ガイド
生成 AI によるアノテーション (新機能)
生成 AI によるアノテーションは、Microsoft の Azure OpenAI エンドポイントを使用して AI により提案されたラベルを生成し、タクソノミーの設計とモデル トレーニングの初期フェーズを加速させます。また、Communications Mining のすべてのユース ケースで価値実現までの時間を短縮します。
この機能には、次が含まれています。
- クラスターの提案: 識別されたテーマに基づいてクラスターの新しいラベルまたは既存のラベルを提案します。
- アノテーション支援機能: ラベル名や説明に基づいてラベルを自動的に予測します。
生成 AI によるアノテーション機能はデータセットに対して自動的に有効化され、使用を開始するにあたって作業は一切必要ありません。
データセットを作成すると、クラスターの提案が短時間で自動的に生成されます。タクソノミーがアップロードされている場合 (強く推奨)、Communications Mining により、クラスターに対して既存のラベルと新しいラベルの両方が提案されます。
タクソノミーをデータセットにアップロードすると、トレーニング データなしで、ラベル名と説明のみを使用して初期モデルをトレーニングするよう自動的にトリガーされます。これには、タクソノミーをアップロードしてから数分かかる場合があります。
- クラスターの提案の場合: [トレーニング] タブに移動してクラスターのバッチを選択するか、[発見] タブに移動してクラスター モードを選択し、アノテーションを開始します。
- アノテーション支援機能の場合: [トレーニング] タブに移動して推奨されるアクションに従うか、[探索] タブに移動し、「シャッフル」モードまたは「ラベルを教える」モードを選択してラベル付けを開始します。
前提条件: 「確認とアノテーション」権限
クラスターの提案は、各 [クラスター] ページの上部に表示されます (白い網掛けに青い枠線)。各クラスターに対して提案されたラベルが 1 つまたは複数ある場合があります。
ラベルの感情分析を有効化している場合は、クラスターの提案に肯定的または否定的な感情 (白い網掛けに緑または赤の枠線) が表示されます。
AI により提案されたラベルは、ラベル名の横に赤いスパークル アイコンが表示されているので区別できます。
モデル トレーナーは、クラスターの提案をそれぞれ確認し、次の操作を行う必要があります。
- クリックして承認する、または
- 提供された提案に同意できない場合は、新しいラベルを割り当てる
クラスターの提案では、各クラスターに対して推奨されるラベルが自動的に生成され、モデルのトレーニング プロセスの最初のフェーズを大幅に高速化できます。
また、トレーニングする概念の定義にユーザーが苦慮している場合は、タクソノミーの設計にも役立ちます。
クラスターの提案は、クラスター内のメッセージ全体で共有されている、識別されたテーマに基づいて生成されます。
クラスターの作成とラベルの提案の生成は、完全に教師なしの自動的なプロセスであり、人間による入力は必要ありません。
クラスターに対するラベルの提案は、事前定義されたタクソノミーの有無にかかわらず生成されますが、インポートしたラベル/既存のラベルを利用して提案に影響を及ぼすと、通常はより有用な提案になります。
前提条件: 「確認とアノテーション」権限
前提条件 2: インポートしたラベル名のリスト
任意、ただし強く推奨: インポートしたラベルの説明のリスト
最初のモデルが、ラベル名と説明をトレーニングの入力として使用して自動的にトレーニングされると、データセット内の多くのメッセージに対して予測が表示されます。
これらの予測は、これまでとまったく同じように機能します。単に、トレーニング データなしで生成されているだけです。
ラベルの感情分析を有効化している場合、最初の予測には肯定的な感情または否定的な感情のいずれかが付きます (信頼度レベルに基づく、緑/赤の異なる網掛け)。
アノテーション支援機能はどのトレーニング バッチまたはモードでも機能しますが、「シャッフル」と「ラベルを教える」で使用するのが最も効果的です ([トレーニング] または [探索] の各トレーニング バッチでの通常のアノテーション手順に従います)。
アノテーション支援機能では、十分なコンテキストを使用してトレーニング例なしで各ラベルの予測が自動的に生成され、モデルのレーニング プロセスの第 2 フェーズを大幅に高速化できます。
最初の予測は、ラベル名と自然言語の説明の品質によって決まります (つまり、名前が曖昧な場合、予測が曖昧になるか、最小限になる可能性があります)。ラベルの詳細な説明があると、初期のモデルのパフォーマンスを向上できます。
データセットをさらにトレーニングすると、ラベル名と説明、およびピン留めされた例の両方を使用して、関連するラベル予測が生成されます。
トレーニングをさらに行うと予測は改善され続け、最終的には、アノテーション付きのトレーニング例が十分に提供されていれば、そのトレーニング例のみを利用するようになります。
アノテーション支援機能では、予測を承認/拒否することで教師あり学習を行う必要がありますが、ピン留めされた例がゼロまたはごくわずかでも、より良好な予測が提供され、モデルのトレーニングで最も時間のかかる部分が加速されます。