- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
タクソノミーを定義する
モデルが最も関連性の高い予測を返すようにするには、各データセットのタクソノミーを正しく定義する必要があります。これは、生成 AI による抽出プロセスにおいて重要な手順です。モデルの学習と予測は、事前に定義した詳細に基づいて行われるためです。
まず、タクソノミーを次のように定義します。
-
Communications Mining™ にログインして、[データセット] ページを表示します。
-
[ 新しいデータセット ] を選択して新しいデータセットを作成し、必要なフィールドに入力します。詳しくは、「 新しいデータセットを作成する」をご覧ください。
-
[次へ] を選択します。
-
[ラベルを定義] ステップで、[ラベルを追加] を選択します。
-
ラベルを正しく定義および構成し、ラベルの構成を明確に説明します。
たとえば、「ラベル 1」、「ラベル 2」のように、構造を持たずに個々のラベルを追加したり、「ラベル 1」、「ラベル 2」という
Parent label > Branch label > Child label構造を持つ階層を作成したりできます。このラベル階層は、この特定のデータセットのタクソノミーを表します。詳しくは、「 ラベルの階層」をご覧ください。 -
[作成] を選択します。
注:データセットのタクソノミーを表示または編集するには、[ 探索 ] タブまたは [ レポート ] タブのサイドパネルで、[ ラベル] セクションが表示されるまで下にスクロールします。
タクソノミーを設定したら、自動化するプロセスを決定します。
次に、ドキュメントから抽出する必要がある特定のデータ ポイントまたはフィールドを特定します。
最後に、データ ポイントを一貫性のある構造に整理します (つまり、抽出スキーマ) 。データ抽出プロセスをガイドします。抽出スキーマを構築するには、[ トレーニング]、[ 探索]、または [設定 ] タブを使用してフィールドを設定し、フィールドの種類を設定します。
詳しくは、次のリソースをご覧ください。