- はじめに
- アクセス制御と管理
- ソースとデータセットを管理する
- モデルのトレーニングと保守
- 生成 AI による抽出
- 分析と監視を使用する
- オートメーションと Communications Mining™
- 開発者
- 機械が単語を理解する方法:NLPに埋め込むためのガイド
- トランスフォーマーによるプロンプトベースの学習
- 効率的な変圧器II:知識蒸留と微調整
- 効率的な変圧器I:注意メカニズム
- 階層的な教師なしインテントモデリング:トレーニングデータなしで価値を得る
- Communications Mining™ でアノテーションの偏りを修正する
- アクティブ ラーニング: より優れた ML モデルを短時間で実現
- それはすべて数字にあります-メトリックを使用してモデルのパフォーマンスを評価します
- モデルの検証が重要な理由
- 対話データ分析 AI としての Communications Mining™ と Google AutoML を比較する
- ライセンス
- よくある質問など

Communications Mining ガイド
データセット
Automation Cloud™ ユーザー向けのデータセットの概要
データセットにアクセスするには、 IXP 閲覧者 ロールまたは IXP アナリスト ロールが割り当てられている必要があります。
IXP の移行後、Communications Mining™ の元の [ データセット ] ページは IXP のホームページに置き換えられ、Communications Mining のデータセットが含まれるようになりました。
[ データセット ] ページに移動するには、Automation Cloud の IXP サービスを選択します。[ データセット ] ページは、Communications Mining を含む [コミュニケーション データ] 機能が事前に選択されているため、既定で表示されます。
[ データセット ] ページでは、以下の操作を実行できます。
-
アクセス権のあるすべてのデータセットを表示します。
-
データセットを編集または削除します。
注:データセットを編集または削除するには、 IXP プロジェクト管理者 ロールが割り当てられている必要があります。
-
IXP の他の機能に移動します。各機能について詳しくは、『IXP 概要ガイド』の「 機能の種類 」ページをご覧ください。
-
[検索] オプションを使用して、特定のデータセットを名前で検索します

データセットを選択する (Automation Cloud)
IXP にアクセスすると、[ データセット ] ページが表示されます。リストからデータセットを選択して Communications Mining にアクセスします。Communications Mining では、[ トレーニング]、[ 発見]、[ 探索]、[ 検証]、[ レポート]、[ モデル]、[ ストリーム]、[ 設定] の各タブからデータセットを処理できます。
既存のデータセットをコピーする (Automation Cloud)
新しいデータセットを作成するときに、既存のデータセットのカーボンコピーを作成することを選択できます。つまり、コピーするデータセットから、同じソース、一般的なフィールド、感情の選択、ラベル、レビュー済みの例をコピーします。
その後、コピーされたデータセットで作業できますが、これには別の名前が必要ですが、元のデータセットに影響を与えずに変更を加えることができます。
以下のシナリオでは、既存のデータセットをコピーすることをお勧めします。
- データセットの構造の観点からモデルに大きな変更を加える場合などに、元のデータセットに戻したくなったときに備えて元のデータセットを保持しておく
- 元のデータセットにアノテーションを行うことで、すでに完了した作業を利用して新しいデータセットを作成し、その後、新しいデータセットに、類似する性質を持つソースを追加する
既存のデータセットを別のデータセットからコピーするには、ホームページの特定のデータセットの横にある省略記号を選択し、[ 複製] を選択します。次に、[ データセットを複製 ] サイドパネルから必須フィールドに入力します。
- データセット名
- API 名
- プロジェクト
- モデルの言語 - [English ] と [ Multilingual] から選択します。
[データセットの設定] ページ (Automation Cloud)
各データセットには独自の設定ページがあり、そのデータセットに関する有用な情報が含まれています。[設定] ページにアクセスするには、特定のデータセットの横にある省略記号を選択し、[データセットの設定] を選択します。
このページは次のタブに分かれています。
- データセット - データセットのグローバル設定 (タイトル、説明、ソースなど) を更新します。
- タクソノミー - ラベルとその説明、抽出フィールド、一般フィールド、フィールドの種類を作成、読み取り、更新、削除します。ラベルの完全なタクソノミーをダウンロードすることもできます。
- 統計 - アノテーションの統計情報とメッセージのメタデータ プロパティを確認します。
データセットを削除するには、以下のいずれかのオプションを選択します。
-
ホームページで特定のデータセットの横にある省略記号を選択し、[ 削除] を選択します。
-
[設定] タブの [データセットを完全に削除] オプションを選択します。
注:削除オプションは、 IXP プロジェクト管理者 ロールが割り当てられている場合にのみ表示されます。
![図は、データセットの [設定] タブの内容を示しています。](https://dev-assets.cms.uipath.com/assets/images/ixp/ixp-the-image-shows-the-content-of-the-dataset-settings-tab-540844-6e41c0e0.webp)
レガシ ユーザー向けのデータセットの概要
データセットにアクセスするには、[ ソースの表示 ] 権限が割り当てられている必要があります。
サインインすると、[ データセット ] ページにリダイレクトされます。
または、ページ上部にある Communications Mining™ のロゴを選択して、いつでもこのページに移動できます。
[ データセット ] ページでは、以下の操作を実行できます。
- アクセス権のあるすべてのデータセットを表示します。
- データセットを編集または削除します。
注:
データセットを編集または削除するには、 データセット管理者権限 が割り当てられている必要があります。
- プラットフォーム内の他のページに移動する。
データセットのリストにあるオプション ( [探索]、[ トレーニング]、[レポート] など) のいずれかを選択すると 、 そのデータセットに直接移動できます。
アクセス権を持っているデータセットについては、ドロップダウン メニューを使用してフィルターを適用し、自分が属する特定のプロジェクトに絞り込むことができます。これにより、表示されるデータセットの数を制限できます。
また、[ 検索 ] オプションを使用して、特定のデータセットを名前で検索することもできます。
![この画像は、レガシ ユーザーの [データセット] ページを示しています。](https://dev-assets.cms.uipath.com/assets/images/ixp/ixp-this-image-depicts-the-datasets-page-for-legacy-users-388092-83f7f5c6.webp)
データセットを選択する (レガシ)
各データセット カードには、データセットに関する有用な情報が表示されます。
![この図は、[データセット] ページのデータセット カードを示しています。](https://dev-assets.cms.uipath.com/assets/images/ixp/ixp-the-image-depicts-a-dataset-card-on-the-datasets-page-388096-2cb2771f.webp)
各データセット カードは以下を参照します。
- データセットのタイトルと説明
- データセットのリンク先のプロジェクトとデータセット名 (プロジェクトまたは名前)
- データセットに接続されているソース
- モデル ファミリ、つまり言語です。
- 感情分析が有効かどうか
- データセットの最終変更日時。ホバーすると、データセットの作成日時も表示されます。
データセット情報カードにある [探索]、[トレーニング]、[レポート] を選択して、該当するページに移動します。
既存のデータセットをコピーする (レガシ)
新しいデータセットを作成するときに、既存のデータセットのコピーを作成するよう選択できます。つまり、タクソノミーのコピー元のデータセットと同じソース、一般フィールド、感情の選択、ラベル、確認済みの例をコピーします。
その後、コピーのデータセット (別の名前を付ける必要があります) で作業することで、元のデータセットに影響を与えることなく自由に変更を加えることができます。
データセットを複製する主な理由は以下のとおりです。
- データセットの構造の観点からモデルに大きな変更を加える場合などに、元のデータセットに戻したくなったときに備えて元のデータセットを保持しておく
- 元のデータセットにアノテーションを行うことで、すでに完了した作業を利用して新しいデータセットを作成し、その後、新しいデータセットに、類似する性質を持つソースを追加する
別のデータセットから既存のデータセットをコピーするには、データセット カードの省略記号を選択し、[ 複製] を選択します。この操作では、そのデータセットで選択されているものと同じソースと感情が自動的に選択されます。
データセットを複製したら、データセットに接続する追加のソースをすべて選択します。
![この図は、データセット カードの [複製] オプションを示しています。](https://dev-assets.cms.uipath.com/assets/images/ixp/ixp-the-image-depicts-the-duplicate-option-on-a-dataset-card-388100-453cb9ed.webp)
データセットの設定ページ (レガシ)
データセットの概要ページと同様に、各データセットには個別の専用の設定ページがあります。このページには、[設定] タブを選択してアクセスできます。
[設定] ページには、データセットに関する有用な情報が含まれており、ここでさまざまな操作を実行できます。
このページは次のタブに分かれています。
- データセット - データセットのグローバル設定 (タイトル、説明、ソースなど) を更新します。
- タクソノミー - ラベルとその説明、抽出フィールド、一般フィールド、フィールドの種類を作成、読み取り、更新、および削除します。ラベルの完全なタクソノミーをダウンロードすることもできます。
- 統計 - アノテーションの統計情報とメッセージのメタデータ プロパティを確認します。
[データセット] ページで [データセットを完全に削除] を選択して、データセットを削除することもできます。
削除オプションは、 データセット管理者権限 が割り当てられている場合にのみ表示されます。
![この図は、[設定] タブの [データセット] ページを示しています。](https://dev-assets.cms.uipath.com/assets/images/ixp/ixp-the-image-depicts-the-dataset-page-under-the-settings-tab-448335-31eaf6de.webp)