- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
[探索] ページでは、データセットを検索、確認、フィルター処理して、個々のメッセージと一般フィールドを検査および確認できます。このページに移動するには、ナビゲーション バーから [探索] タブを選択します。
既定では、[ 探索 ] には、データセット内の最も新しい 20 件のメッセージが 「最近 」モードで表示されます。ドロップダウンのモード セレクターを選択すると、これを変更できます。
ドロップダウン メニューから選択できるオプションは次のとおりです。
- 最近 – 最も新しい 20 件のメッセージを表示します。
- シャッフル – 20 件のランダムなメッセージを表示します。
- 教える – どのようにアノテーションを行うべきかプラットフォームが判断できない 20 件のメッセージを表示します。
- 信頼度が低い – 有益なラベルの予測で十分に網羅されていない 20 件のメッセージを表示します。
- リバランス - データセット内のトレーニング データで十分に代表されていない 20 件のメッセージを表示します。
- ラベル – 選択したラベルが割り当てられているか予測されている 20 件のメッセージを表示します。これは、ラベルを選択する際の既定のモードです。
- ラベルを確認 - 選択したラベルが誤って適用された可能性がある 20 件のメッセージを表示します。
- 見逃されたラベル – 選択したラベルが見逃された可能性がある 20 件のメッセージを表示します。
ページの下部で、次の 20 件のメッセージのページに移動するか、前のページに戻るかを選択できます。
このセクションでは、Communications Mining™ のフィルターとその適用方法について説明します。
[フィルター] バーではメッセージの特定のグループを検索して、そこでフィルター処理できます。
- 特定の日付範囲 - 正確な日付を選択したり、[過去 1 週間]、[月]、[90 日]、[年] などのオプションから選択したりできます。
- 確認済みまたは未確認のメッセージ
- データセットで感情機能が有効化されている場合、肯定的または否定的な感情の予測を含むメッセージ
- 特定の一般フィールドが予測されているか割り当てられているメッセージ
- 特定のラベル、または予測されたラベルの組み合わせを含む、または除外するメッセージです。詳しくは、「 高度な予測フィルター」をご覧ください。
さらに、[ 新しいフィルターを追加] を選択することで、メッセージに関連付けられたメタデータ プロパティに基づくフィルターを追加できます。
[新しいフィルターを追加] を選択すると、利用可能なすべてのプロパティ フィルターのリストがドロップダウン メニューに表示されます。
フィルターは最初からカテゴリ別にグループ化されています。一部のフィルターはデータセット内のコミュニケーションの種類 (例: メール) に固有です。
プロパティがグループ化されるプロパティのカテゴリは次のとおりです。
- ソース - データセットに複数のソースがある場合にのみ表示されます。
- メール - 個々のメールに固有です (たとえば、メールの送信者)。
- スレッド - メールに固有であり、メール スレッドの特性に関連します。
- 添付ファイル - メッセージ (主にメール) に固有で、特定の添付ファイル プロパティがあります。
- ユーザー - 各メッセージとともにアップロードされた (プラットフォームによって抽出されたものではない)、その他すべてのメタデータ プロパティです。
アイコンは、各プロパティのプロパティの種類が数値または文字列のどちらであるかを示します。文字列のユーザー プロパティの場合、ホバーすると値の例が表示されます。
文字列形式のメタデータ フィールドにフィルターを追加する場合、選択に含めるか除外するかを選択できます。次の画像をご覧ください。
数値形式のメタデータ フィールドにフィルターを追加する場合、次の図に示すように、最小値または最大値を選択して任意の範囲を作成できます。
適用したフィルターを削除するには、ホバーしたときに表示されるゴミ箱アイコンを選択するか、[ すべてクリア ] を選択して適用されているすべてのフィルターを削除します。
ラベル フィルター バーを使用して、予測された特定のラベルを含む、または除外するメッセージをフィルター処理できます。この操作は、モデルのトレーニング中、またはデータを探索および解釈する際に実行できます。詳しくは、「 高度な予測フィルター」をご覧ください。
[ラベル] セクションにある以下のボタンを使用してフィルターを適用し、すべてのメッセージを表示するか、ラベルが割り当てられているメッセージまたは予測がある未確認のメッセージに絞り込むことができます。アイコンは次のように表示されます。アイコンを選択すると色が変わります。
| 割り当てられたラベルがあるメッセージを選択します。 | |
| 予測されたラベルがあるメッセージを選択します。 |
フィルターの選択を解除するには、ボタンをもう一度選択します。
これらのボタンのいずれも選択せずにフィルターを適用して特定のラベルに絞り込むと、ラベルがピン留めまたは予測されているすべてのメッセージに絞り込まれ、確認済みのメッセージから順番に表示されます。
ラベル フィルター バーと + ラベルフィルターを追加すると 、包含フィルターと除外フィルターを複雑に組み合わせて追加できます。たとえば、X と Y が予測されているメッセージを表示するが、Z が予測されているメッセージは表示しないといった場合などです。これらのフィルターの使用方法について詳しくは、「 高度な予測フィルター」をご覧ください。
赤いダイヤルのトレーニング インジケーター
- 一部のラベルには赤いダイヤルのトレーニング インジケーターが表示され、プラットフォームがラベルのパフォーマンスを正確に評価するために、さらにトレーニング例が必要なラベルを強調表示します。詳しくは、「メッセージを確認する」をご覧ください。
- どれだけ完全な円になっているかで、さらにいくつ例が必要かを示します。赤いセクションが大きいほど、より多くの例が必要です。
- ラベルの複雑さによっては、アノテーションが行われた例が 25 個になると、赤い円は消えます。ただし、正確な予測を得るのにさらに例が必要になる場合があります。
- メッセージを確認して、さらにトレーニング例を見つける必要があります。