- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
IXP の移行後、Communications Mining の元の [ データセット ] ページは、Communications Mining™ のデータセットを含む IXP のホームページに置き換えられました。
[ データセット ] ページに移動するには、Automation Cloud の IXP サービスを選択します。[ データセット ] ページは、Communications Mining を含む [コミュニケーション データ] 機能が事前に選択されているため、既定で表示されます。
- アクセス権のあるすべてのデータセットを表示します。
- データセットを編集または削除します。
メモ: データセットを編集または削除するには、 IXP プロジェクト管理者 ロールが割り当てられている必要があります。
- IXP の他の機能に移動します。各機能について詳しくは、『IXP 概要ガイド』の「 機能の種類 」ページをご覧ください。
- [検索] オプションを使用して、特定のデータセットを名前で検索します
IXP にアクセスすると、[ データセット ] ページが表示されます。リストからデータセットを選択して Communications Mining にアクセスします。Communications Mining では、[ トレーニング]、[ 発見]、[ 探索]、[ 検証]、[ レポート]、[ モデル]、[ ストリーム]、[ 設定] の各タブからデータセットを処理できます。
新しいデータセットを作成するときに、既存のデータセットのカーボンコピーを作成することを選択できます。つまり、コピーするデータセットから、同じソース、一般的なフィールド、感情の選択、ラベル、レビュー済みの例をコピーします。
その後、コピーされたデータセットで作業できますが、これには別の名前が必要ですが、元のデータセットに影響を与えずに変更を加えることができます。
以下のシナリオでは、既存のデータセットをコピーすることをお勧めします。
- データセットの構造の観点からモデルに大きな変更を加える場合などに、元のデータセットに戻したくなったときに備えて元のデータセットを保持しておく
- 元のデータセットにアノテーションを行うことで、すでに完了した作業を利用して新しいデータセットを作成し、その後、新しいデータセットに、類似する性質を持つソースを追加する
- データセット名
- API 名
- プロジェクト
- モデル言語 - [English ] と [ Multilingual] から選択します。
各データセットには独自の設定ページがあり、そのデータセットに関する有用な情報が含まれています。[設定] ページにアクセスするには、特定のデータセットの横にある省略記号を選択し、[データセットの設定] を選択します。
このページは次のタブに分かれています。
- データセット - データセットのグローバル設定 (タイトル、説明、ソースなど) を更新します。
- タクソノミー - ラベル、およびその説明、抽出フィールド、一般フィールド、フィールドの種類を作成、読み取り、更新、削除します。完全なラベルのタクソノミーをダウンロードすることもできます。
- 統計 - アノテーションの統計情報とメッセージのメタデータ プロパティを表示します。
- ホームページから特定のデータセットの横にある省略記号を選択し、[ 削除] を選択します。
- [ 設定] タブの [ データセットを完全に削除] オプションを選択します。
サインインすると、[データセット] ページにリダイレクト されます 。
または、ページ上部にある Communications Mining™ のロゴを選択して、いつでもこのページに移動できます。
[データセット] ページでは、次のことができます。
- アクセス権のあるすべてのデータセットを表示します。
- データセットを編集または削除します。
手記: データセットを編集または削除するには、 データセット管理者 権限が割り当てられている必要があります。
- プラットフォーム内の他のページに移動する。
データセットのリストにあるオプション ( [探索]、[ トレーニング]、[レポート] など) のいずれかを選択すると 、 そのデータセットに直接移動できます。
アクセス権を持っているデータセットについては、ドロップダウン メニューを使用してフィルターを適用し、自分が属する特定のプロジェクトに絞り込むことができます。これにより、表示されるデータセットの数を制限できます。
また、[ 検索 ] オプションを使用して特定のデータセットを名前で検索することもできます。
各データセット カードには、データセットに関する有用な情報が表示されます。
各データセット カードは以下を参照します。
- データセットのタイトルと説明
- データセットのリンク先のプロジェクトとデータセット名 (プロジェクトまたは名前)
- データセットに接続されているソース
- モデル ファミリ、つまり言語です。
- 感情分析が有効かどうか
- データセットの最終変更日時。ホバーすると、データセットの作成日時も表示されます。
データセット情報カードにある [探索]、[トレーニング]、[レポート] を選択して、該当するページに移動します。
新しいデータセットを作成するときに、既存のデータセットのコピーを作成するよう選択できます。つまり、タクソノミーのコピー元のデータセットと同じソース、一般フィールド、感情の選択、ラベル、確認済みの例をコピーします。
その後、コピーのデータセット (別の名前を付ける必要があります) で作業することで、元のデータセットに影響を与えることなく自由に変更を加えることができます。
- データセットの構造の観点からモデルに大きな変更を加える場合などに、元のデータセットに戻したくなったときに備えて元のデータセットを保持しておく
- 元のデータセットにアノテーションを行うことで、すでに完了した作業を利用して新しいデータセットを作成し、その後、新しいデータセットに、類似する性質を持つソースを追加する
別のデータセットから既存のデータセットをコピーするには、データセット カードの省略記号を選択し、[ 複製] を選択します。この操作では、そのデータセットで選択されているものと同じソースと感情が自動的に選択されます。
データセットを複製したら、データセットに接続する追加のソースをすべて選択します。
データセットの概要ページと同様に、各データセットには個別の専用の設定ページがあります。このページには、[設定] タブを選択してアクセスできます。
[設定] ページには、データセットに関する有用な情報が含まれており、ここでさまざまな操作を実行できます。
このページは次のタブに分かれています。
- データセット - データセットのグローバル設定 (タイトル、説明、ソースなど) を更新します。
- タクソノミー - ラベルとその説明、抽出フィールド、一般フィールド、フィールドの種類を作成、読み取り、更新、および削除します。ラベルの完全なタクソノミーをダウンロードすることもできます。
- 統計 - アノテーションの統計情報とメッセージのメタデータ プロパティを確認します。
[データセット] ページで [データセットを完全に削除] を選択して、データセットを削除することもできます。