communications-mining
latest
false
- API ドキュメント
- CLI
- 連携ガイド
- ブログ
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining による注釈バイアスの修正
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 会話型データ インテリジェンスのための Communications Mining と Google AutoML の比較
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
Communications Mining 開発者ガイド
最終更新日時 2024年12月20日
一般フィールドの設定
例として保険のユースケースを使用します。 保険会社のメールボックスは、処理のために別のチームにトリアージする必要があるブローカーから電子メールを受信します。 この例では、データセットは既にトレーニングされており、タクソノミーは次のようになります。
図 1. タクソノミーの例
このメールボックスは、更新、キャンセル、および管理要求を受信しますが、これらは緊急の場合があります。 Communications Mining は、これらの各概念を認識するようにトレーニングされており、Communications Mining の予測を使用して、サポート チケットを作成することで、正しいチームに電子メールをトリアージできます。
顧客に迅速に対応できるように、ダウンストリームチームがリクエストを処理するのに役立ついくつかの重要なデータポイントを抽出できます。 具体的には、電子メールから保険証券番号、被保険者組織名、ブローカー名を抽出します。 一般的なフィールド抽出を使用してこれを行うことができます。
図 2. 設定済みの一般フィールド
保険証券番号の形式はこの特定の保険会社に固有であるため、一般フィールドを最初からトレーニングできるように構成します。 一方、被保険者は組織の一種であるため、組み込みの組織全般フィールドに基づいてトレーニング可能になるように構成します。 最後に、ブローカーは常に自分の名前を電子メールに入れるとは限らないため、ブローカーの電子メールアドレス(コメントメタデータから利用可能)を使用して、一般的なフィールドとして抽出するのではなく、内部データベースで対応する名前を検索することにしました。
次の表は、これらのアプローチをまとめたものです。
構成 | 使用すべきタイミング | 例 |
---|---|---|
基本一般フィールドのないトレーニング可能な一般フィールド | さまざまな種類の内部 ID によく使用される場合や、Communications Mining に適切な基本汎用フィールドがない場合に使用されます。 | 保険証券番号、顧客 ID |
基本一般フィールドを持つトレーニング可能な一般フィールド | Communications Mining の既存の構築済みの一般フィールドをカスタマイズするために使用します。 | 取消日 (基準日)、被保険者団体 (団体基準) |
事前構築済みの一般フィールド (トレーニング不可) | 定義されたとおりに正確に一致させる必要がある、トレーニングによって間違いを招くような一般的なフィールドに使用されます。 | ISIN (ISIN コード) |
一般フィールドの代わりにコメントメタデータを使用する | 必要な情報がコメント メタデータに構造化された形式で既に存在する場合に使用されます。 | Sender Address (送信者のアドレス)、Sender Domain (送信者のドメイン) |