communications-mining
latest
false
- API ドキュメント
- CLI
- 連携ガイド
- ブログ
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining による注釈バイアスの修正
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 会話型データ インテリジェンスのための Communications Mining と Google AutoML の比較
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
Communications Mining 開発者ガイド
最終更新日時 2024年12月20日
概要
このセクションでは、コア プラットフォームの概念の概要について説明します。
エンドユーザーの観点から見たプラットフォームの詳細については、 Communications Mining ユーザー ガイドをご覧ください。
概念 | 説明 | EXAMPLE |
---|---|---|
ソース | Communications Mining では、データはデータ ソースまたは ソースに編成されます。 通常、ソースはチャネルに対応します。 電子メール メールボックス、調査結果、または一連の顧客レビューはすべて、データ ソースとして Communications Mining にアップロードできるデータの例です。 複数のソースを組み合わせてモデルを構築できるため、単一のモノリシックソースではなく、複数のソースの側で誤りを犯すのが最善です。 | この図は、電子メール データ (個々の電子メールを含むソース A) と顧客レビュー データ (個々の顧客レビューを含むソース B および C) を示しています。 カスタマーレビューデータは、データの出所に基づいて2つのソースに分割されますが、共通のモデルを構築するために1つのデータセットに結合されます。 |
コメント | ソース内では、テキスト通信の個々の部分が コメントとして表されます。 コメントには常に ID、タイムスタンプ、テキスト本文、およびそれが表すデータの種類に基づく追加のフィールドがあります。 たとえば、メールには、"from"、"to"、"cc" などの予期されるメール フィールドがあります。 | この図は、 使用可能なコメント フィールド がさまざまなコメント タイプによってどのように使用されるかを示しています。 たとえば、電子メールのコメントでは "from" フィールドに送信者のアドレスが含まれ、カスタマー レビュー コメントではレビュー作成者が含まれます。 メタデータフィールド(各コメントの下部に表示されます)はユーザー定義です。 両方のカスタマー レビュー ソースに同じフィールド セットを使用していることに注意してください。ここではこれらを 1 つのデータセットに結合するため、モデルのパフォーマンスを向上させるには、データの一貫性が必要です。 |
データセット | データセットでは、モデルを構築するために 1 つ以上のソースに注釈を付けることができます。 ソースは複数のデータセットに含めることができます。 データセット内のすべてのラベルのセットを タクソノミーと呼びます。 | この図は、サポート メールボックス データの上に構築された 2 つのデータセットと、顧客レビュー データを組み合わせた 1 つのデータセットを示しています。 データセット 1 とデータセット 2 は同じデータに基づいていますが、ユース ケース (分析と自動化) で異なるラベル セットを必要とするため、ラベルの分類方法が異なります。 |
モデル | ユーザーがより多くのデータに注釈を付けると、モデルが継続的に更新されます。 一貫性のある予測を受け取るには、モデルのクエリ時にモデルのバージョン番号を指定する必要があります。 | |
ラベル | ラベルは、モデルのトレーニング時に適用され、モデルに予測のクエリを実行するときに返されます。 ラベルが予測として返される場合、ラベルには 信頼度スコア が関連付けられており、モデルが予測が適用されると考える可能性を示します。 予測を「はい/いいえ」の回答に変換するには、精度と再現率のトレードオフを表すように選択されたしきい値に対して信頼度スコアを確認する必要があります。 | ラベルは、モデルのトレーニング時に Communications Mining ユーザーによって割り当てられます。 Communications Mining UI を使用すると、ユーザーは最も関連性の高いコメントに注釈を付け、ラベルが一貫して適用され、パフォーマンスの高いモデルを生成するのに十分なコメントに注釈が付けられます。 |