- 基本情報
- 管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- データ要件の理解
- トレーニング
- 概要
- [クラスター] を使用したトレーニング
- [検索] を使用したトレーニング (発見)
- 一般フィールドを使用する
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining
- ライセンス情報
- よくある質問など
Communications Mining ガイド
[クラスター] を使用したトレーニング
必要なユーザー権限:「ソースの表示」および「確認とアノテーション」
データがプラットフォームに読み込まれると、概念または類似する意図を共有していると思われるコミュニケーション (メッセージ) がグループ化され、30 個のクラスターが表示されます。トレーニング プロセスのこの部分の目的は、クラスターごとに提示されるデータにアノテーションを行うことです。
このプロセスでは、複数の類似するメッセージに一度にラベルを追加したり、必要に応じて個々のメッセージにラベルを追加/削除したりできるため、モデルのトレーニングがより簡単かつ迅速になります。
クラスターに穴テーションを行う際に役立つヒント:
- ラベル名を決めるのに長時間かけないようにします。ラベル名は、トレーニング プロセス中にいつでも変更できます。
- ラベルに名前を付けるときはできるだけ具体的にし、最初のうちはタクソノミーの階層をできるだけ少なくフラットにしておきます (子ラベルを追加しすぎないようにします)。階層はあとでいつでも変更および再構築できるため、最初はラベル名をできるだけ具体的にすることをお勧めします。 いつでも操作をやり直してラベルを削除できるので、この段階では、できる限り多くのラベルをメッセージに追加する必要があります。既存のラベルを拡張するよりも、このほうが簡単で迅速です。
- 多くの場合、最初に具体的できめ細かい分類を作成するほうが簡単であることに留意します。詳細すぎる場合は、後で簡単にタクソノミーを編集して「プルーニング」できます。つまり、追加するラベルとサブラベルを減らすのではなく増やします。
- フラットな階層のラベルから始めることをお勧めします (サブラベルを追加しすぎないようにします)。後でいつでもタクソノミーを再構成して、より階層的な構造にすることができます。
- 各メッセージには複数のラベルを割り当てることができます。必ず、関連するラベルをすべて適用してください。そうしないと、省略したラベルにはメッセージを関連付けないようにモデルに教えることになります。
- 今すぐ時間をかけて慎重にアノテーションを行い、将来、マシンがラベルを迅速・正確に予測できるようにすることをお勧めします。
- すべてのクラスターが明確に同様の意図を持つわけではありません。意図がすべて異なっていても作業を進めてかまいません。
新しいデータセットを初めて作成した場合、次に示すように [発見] が空である可能性があります。これは単に、プラットフォームのアルゴリズムがメッセージをクラスターにグループ化するためにバックグラウンドで作業しているためなので、心配はいりません。データ ソース内のメッセージの数によっては、この処理に最大で数時間かかる場合があります。
[発見] のレイアウトとクラスターの例を以下に示します。この例では、これらのメッセージでホテルのベッドの快適さという共通のテーマが共有されていることが検出されています。
レイアウトの説明:
A
- 「クラスター」モードと「検索」モードを切り替えるトグル ボタンB
- 別のクラスターに切り替えるドロップダウン メニューC
- ページに表示されているすべてのメッセージにラベルを適用するボタンD
- クラスター 7 から表示されている 6 件のメッセージの 1 件 (各クラスターには 12 件のメッセージが含まれる)E
- ラベルを個々のメッセージに適用するボタンF
- ページに表示されているメッセージの数 (6 から 12 件) を調整するドロップダウン メニューG
- ページ上でのメッセージの選択を調整および反転するボタンH
- メッセージの選択を解除し、一括して追加したラベルから除外するボタン
下の画像で強調表示されているように、[発見] では、メッセージがそのクラスターにグループ化された最大の寄与要因が強調表示されるため、共通のテーマをすばやく識別できます。
共通のテーマが強調表示されている [発見] ページ
- 濃い線は、範囲の中でより重要な部分を示します (その範囲にホバーすると説明が表示されます)。
- 薄い線は、クラスターへの寄与度が中程度からやや弱いことを示します。
1. クラスター内の各メッセージを確認します。
2. ページ上のすべてのメッセージに適用されるラベルがあると思われる場合は、[ラベルを追加] を選択します。
3. ラベルの名前を入力して Enter キーを押すか、表示されるピン ボタンをクリックします (この方法で一度に複数のラベルを追加できます。別のラベルを入力してピン ボタンをもう一度クリックします)。
4. [ラベルを適用] ボタンをクリックして、ラベルをメッセージに割り当てます。割り当てられたラベルは、ページ上のすべてのメッセージの下に表示されます。
または、強調表示されている [ラベルを追加 +] ボタンをクリックして、個々のメッセージにラベルを追加することもできます。
ページ上のメッセージのグループにラベルを追加したものの、1 つまたは複数を除外したい場合は、強調表示されたトグル ボタン (A) を使用して選択を解除できます。次に、上部 (B) で強調表示されているボタンを使用して、選択を反転したり、すべてを選択解除/再選択したりできます。
強調表示されたボタンを使用して、同じクラスターの異なるページを表示したり (A)、ページあたりのメッセージの数を調整したりできます (B)。クラスターのアノテーションが完了したら、下のドロップダウン リスト (C) を使用して新しいクラスターに移動できます。
モデルにより 30 個のクラスターが提示されます。これらのクラスターで作業を行って、探索フェーズの強固な基盤を構築することが重要です。ただし、関係がないクラスターである場合は、スキップします。
[発見] は、大量のトレーニングが完了すると再トレーニングを開始します。180 件のメッセージ (クラスターの半数) にアノテーションが行われると、再トレーニングが行われ、クラスターが更新されます。 少なくとも 30 件を確認するまで、根気よく作業を続けてください。