ixp
latest
false
- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
最終更新日時 2025年10月20日
このセクションでは、コア プラットフォームの概念の概要について説明します。
エンド ユーザーの観点から見たプラットフォームの詳細については、『 Communications Mining™ ガイド』をご覧ください。
| 概念 | 説明 | 例 |
|---|---|---|
| ソース | Communications Mining™ では、データはデータ ソース (ソース) に編成されます。通常、ソースはチャネルに対応します。メール メールボックス、アンケートの結果、一連のカスタマー レビューはすべて、Communications Mining にデータ ソースとしてアップロードできるデータの例です。複数のソースを組み合わせてモデルを構築できるため、単一のモノリシックなソースではなく、複数のソース側を選択することをお勧めします。 | この図は、電子メール データ (個々の電子メールを含むソース A) と顧客レビュー データ (個々の顧客レビューを含むソース B および C) を示しています。 カスタマーレビューデータは、データの出所に基づいて2つのソースに分割されますが、共通のモデルを構築するために1つのデータセットに結合されます。 |
| コメント | ソース内では、テキスト通信の個々の部分がコメントとして表されます。コメントには必ず ID、タイムスタンプ、テキスト本文があり、コメントが表すデータの種類に基づいた追加のフィールドがあります。たとえば、メールには、From、To、Cc などの予期されるメール フィールドが含まれます。 | この図は、 利用可能なコメント フィールド がさまざまなコメントの種類でどのように使用されるかを示しています。たとえば、メールのコメントでは [送信元] フィールドに送信者のアドレスが含まれ、顧客レビューのコメントではレビューの作成者が含まれます。各コメントの下部に表示されるメタデータ フィールドは、ユーザーが定義したものです。両方の顧客レビュー ソースに同じフィールド セットを使用していることに注意してください。この例では、これらのフィールドを 1 つのデータセットに結合するため、モデルの優れたパフォーマンスを確保するために、データの一貫性を確保する必要があります。 |
| データセット | データセットでは、モデルを構築するために 1 つ以上のソースにアノテーションを行うことができます。ソースは複数のデータセットに含めることができます。データセット内のすべてのラベルのセットをタクソノミーと呼びます。 | この図は、サポート メールボックス データの上に構築された 2 つのデータセットと、顧客のレビュー データを組み合わせた 1 つのデータセットを示しています。データセット 1 とデータセット 2 は同じデータに基づいていますが、ラベルのタクソノミーは異なります。それぞれのユース ケース (分析と自動化) では異なるラベル セットが必要になるためです。 |
| モデル | ユーザーがより多くのデータに注釈を付けると、モデルが継続的に更新されます。 一貫性のある予測を受け取るには、モデルのクエリ時にモデルのバージョン番号を指定する必要があります。 | |
| ラベル | ラベルはモデルのトレーニング時に適用され、モデルに予測のクエリを実行するときに返されます。ラベルが予測として返される場合、ラベルには信頼度スコアが関連付けられ、モデルが予測が適用されると考える可能性を示します。予測を「はい」または「いいえ」の回答に変換するには、適切な適合率/再現率のトレードオフを表すように選択されたしきい値に対して信頼度スコアを確認する必要があります。 | ラベルは、モデルのトレーニング時に Communications Mining ユーザーによって割り当てられます。Communications Mining のユーザー インターフェイスは、ユーザーが最も関連性の高いコメントにアノテーションを行い、ラベルが一貫性を持って適用され、十分な数のコメントにアノテーションが行われてパフォーマンスの高いモデルを生成するのに役立ちます。 |