- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
生成 AI によるアノテーションは、Microsoft Azure OpenAI エンドポイントを使用して AI により提案されたラベルを生成し、タクソノミーの設計とモデル トレーニングの初期フェーズを加速させるとともに、Communications Mining™ のすべてのユース ケースで価値実現までの時間を短縮します。
生成 AI によるアノテーションには以下が含まれます。
- クラスターの提案 - 識別されたテーマに基づいてクラスターの新しいラベルまたは既存のラベルを提案します。
- アノテーション支援機能 - ラベル名や説明に基づいてラベルを自動的に予測します。
生成 AI によるアノテーション機能はデータセットに対して自動的に有効化されるため、それ以上の操作は不要です。
データセットを作成すると、クラスターの提案が短時間で自動的に生成されます。タクソノミーがアップロードされている場合 (強く推奨されます)、Communications Mining™ により、クラスターに対して既存のラベルと新しいラベルの両方が提案されます。
タクソノミーをデータセットにアップロードすると、トレーニング データなしで、ラベル名と説明のみを使用して初期モデルをトレーニングするよう自動的にトリガーされます。この操作には、タクソノミーをアップロードしてから数分かかる場合があります。
- クラスターの提案の場合、[トレーニング] タブに移動してクラスターのバッチを選択します。または、[発見] タブに移動し、クラスター モードを選択してアノテーションを開始します。
- アノテーション支援機能の場合、[トレーニング] タブに移動して推奨されるアクションに従います。または、[探索] タブに移動し、「シャッフル」モードまたは「ラベルを教える」モードを選択してアノテーションを開始します。
クラスターの提案は、各 [クラスター] ページに対して表示されます。各クラスターに対して提案されたラベルが 1 つまたは複数ある場合があります。
ラベルの感情分析を有効化している場合は、クラスターの提案に肯定的または否定的な感情が表示されます。感情は緑または赤で強調表示できます。
AI により提案されたラベルを特定するには、次の画像を確認します。
モデルのトレーナーは、各クラスターの提案を確認し、次のいずれかを実行する必要があります。
- 選択して承認します。
- 提供された提案に同意できない場合は、新しいラベルを割り当てる
クラスターの提案では、各クラスターに対して推奨されるラベルが自動的に生成され、モデルのトレーニング プロセスの最初のフェーズを大幅に高速化できます。また、トレーニングする概念の定義にユーザーが苦慮している場合は、タクソノミーの設計にも役立ちます。
クラスターの提案は、クラスター内のメッセージ全体で共有されている、識別されたテーマに基づいて生成されます。
クラスターの作成とラベルの提案の生成は、完全に教師なしの自動的なプロセスであり、人間による入力は必要ありません。
クラスターに対するラベルの提案は、事前定義されたタクソノミーの有無にかかわらず生成されますが、インポートしたラベルまたは既存のラベルを利用して提案に影響を及ぼすと、通常はより有用な提案になります。
- Automation Cloud™ ユーザーとして IXP モデル トレーナー ロールを割り当てているか、レガシ ユーザーとして確認 とラベル 付けの権限を割り当てている必要があります。
- インポートしたラベル名のリスト
- Optionally, an imported list of label descriptions is highly recommended. The platform uses descriptions as a training input to make predictions, so make sure you are clear and concise when describing the label concept.
最初のモデルが、ラベル名と説明をトレーニングの入力として使用して自動的にトレーニングされると、データセット内の多くのメッセージに対して予測が表示されます。
これらの予測は、これまでとまったく同じように機能します。つまり、単にトレーニング データなしで生成されているだけです。
ラベルの感情分析を有効化している場合、最初の予測には、信頼度レベルに応じて、緑または赤のさまざまな網掛けで肯定的または否定的な感情が付きます。
アノテーション支援機能は どのトレーニング バッチまたはモードでも機能しますが、最も効果的なのは「 シャッフル 」と 「ラベルを教える」です。[ トレーニング ] タブまたは [ 探索 ] タブの各トレーニング バッチでの通常のアノテーション手順に従う必要があります。
アノテーション支援機能では、十分なコンテキストを使用してトレーニング例なしで各ラベルの予測が自動的に生成され、モデルのレーニング プロセスの第 2 フェーズを大幅に高速化できます。
最初の予測は、ラベル名と自然言語の説明の品質によって決まります。たとえば、名前が曖昧な場合、予測が曖昧になるか、最小限になる可能性があります。ラベルの詳細な説明があると、初期のモデルのパフォーマンスを向上できます。
データセットをさらにトレーニングすると、ラベル名と説明、およびピン留めされた例の両方を使用して、関連するラベル予測が生成されます。
トレーニングをさらに行うと予測は改善され続け、最終的には、アノテーション付きのトレーニング例が十分に提供されていれば、そのトレーニング例のみを利用するようになります。
アノテーション支援機能では、予測を承認または拒否することで教師あり学習を行う必要がありますが、ピン留めされた例がゼロまたはごくわずかでも、より良好な予測が提供され、モデルのトレーニングで最も時間のかかる部分が加速されます。