communications-mining
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Communications Mining ガイド
Last updated 2024年11月7日

[クラスター] を使用したトレーニング

必要なユーザー権限:「ソースの表示」および「確認とアノテーション」

注: ユーザーは、[ソースの表示] 権限があれば [発見] でメッセージを表示でき、[ラベルの表示] 権限があればラベルを表示できますが、[発見] で実際にラベルを適用するには [確認とアノテーション] 権限が必要です。

概要

データがプラットフォームに読み込まれると、概念または類似する意図を共有していると思われるコミュニケーション (メッセージ) がグループ化され、30 個のクラスターが表示されます。トレーニング プロセスのこの部分の目的は、クラスターごとに提示されるデータにアノテーションを行うことです。

このプロセスでは、複数の類似するメッセージに一度にラベルを追加したり、必要に応じて個々のメッセージにラベルを追加/削除したりできるため、モデルのトレーニングがより簡単かつ迅速になります。

クラスターに穴テーションを行う際に役立つヒント:

  • ラベル名を決めるのに長時間かけないようにします。ラベル名は、トレーニング プロセス中にいつでも変更できます。
  • ラベルに名前を付けるときはできるだけ具体的にし、最初のうちはタクソノミーの階層をできるだけ少なくフラットにしておきます (子ラベルを追加しすぎないようにします)。階層はあとでいつでも変更および再構築できるため、最初はラベル名をできるだけ具体的にすることをお勧めします。 いつでも操作をやり直してラベルを削除できるので、この段階では、できる限り多くのラベルをメッセージに追加する必要があります。既存のラベルを拡張するよりも、このほうが簡単で迅速です。
  • 多くの場合、最初に具体的できめ細かい分類を作成するほうが簡単であることに留意します。詳細すぎる場合は、後で簡単にタクソノミーを編集して「プルーニング」できます。つまり、追加するラベルとサブラベルを減らすのではなく増やします。
  • フラットな階層のラベルから始めることをお勧めします (サブラベルを追加しすぎないようにします)。後でいつでもタクソノミーを再構成して、より階層的な構造にすることができます。
  • 各メッセージには複数のラベルを割り当てることができます。必ず、関連するラベルをすべて適用してください。そうしないと、省略したラベルにはメッセージを関連付けないようにモデルに教えることになります。
  • 今すぐ時間をかけて慎重にアノテーションを行い、将来、マシンがラベルを迅速・正確に予測できるようにすることをお勧めします。
  • すべてのクラスターが明確に同様の意図を持つわけではありません。意図がすべて異なっていても作業を進めてかまいません。

[発見] が空の場合

新しいデータセットを初めて作成した場合、次に示すように [発見] が空である可能性があります。これは単に、プラットフォームのアルゴリズムがメッセージをクラスターにグループ化するためにバックグラウンドで作業しているためなので、心配はいりません。データ ソース内のメッセージの数によっては、この処理に最大で数時間かかる場合があります。

クラスターの生成中に表示される空の [発見] ページ

レイアウト

[発見] のレイアウトとクラスターの例を以下に示します。この例では、これらのメッセージでホテルのベッドの快適さという共通のテーマが共有されていることが検出されています。

「クラスター」モードの [発見] ページ

レイアウトの説明:

  • A - 「クラスター」モードと「検索」モードを切り替えるトグル ボタン
  • B - 別のクラスターに切り替えるドロップダウン メニュー
  • C - ページに表示されているすべてのメッセージにラベルを適用するボタン
  • D - クラスター 7 から表示されている 6 件のメッセージの 1 件 (各クラスターには 12 件のメッセージが含まれる)
  • E - ラベルを個々のメッセージに適用するボタン
  • F - ページに表示されているメッセージの数 (6 から 12 件) を調整するドロップダウン メニュー
  • G - ページ上でのメッセージの選択を調整および反転するボタン
  • H - メッセージの選択を解除し、一括して追加したラベルから除外するボタン

[発見] での共通のテーマの強調表示

下の画像で強調表示されているように、[発見] では、メッセージがそのクラスターにグループ化された最大の寄与要因が強調表示されるため、共通のテーマをすばやく識別できます。

共通のテーマが強調表示されている [発見] ページdocs image

共通のテーマが強調表示されている [発見] ページ

  • 濃い線は、範囲の中でより重要な部分を示します (その範囲にホバーすると説明が表示されます)。
  • 薄い線は、クラスターへの寄与度が中程度からやや弱いことを示します。

主な手順

注: 次のガイドでは、感情分析が有効化されていないデータセットのアノテーションを行うプロセスについて説明します。感情分析を有効化している場合も、プロセスはよく似ており、各ラベルを適用するときに肯定的または否定的な感情も選択します。感情がその概念の肯定的なバージョンであるか、それとも否定的なバージョンであるかを示す中立的なラベル名を使用できます。感情分析を使用したアノテーションについて詳しくは、こちらをご覧ください。

1. クラスター内の各メッセージを確認します。

2. ページ上のすべてのメッセージに適用されるラベルがあると思われる場合は、[ラベルを追加] を選択します。



3. ラベルの名前を入力して Enter キーを押すか、表示されるピン ボタンをクリックします (この方法で一度に複数のラベルを追加できます。別のラベルを入力してピン ボタンをもう一度クリックします)。



注: これではラベルはまだ適用されません。

4. [ラベルを適用] ボタンをクリックして、ラベルをメッセージに割り当てます。割り当てられたラベルは、ページ上のすべてのメッセージの下に表示されます。



または、強調表示されている [ラベルを追加 +] ボタンをクリックして、個々のメッセージにラベルを追加することもできます。

[発見] で個々のメッセージにラベルを追加する

ページ上のメッセージのグループにラベルを追加したものの、1 つまたは複数を除外したい場合は、強調表示されたトグル ボタン (A) を使用して選択を解除できます。次に、上部 (B) で強調表示されているボタンを使用して、選択を反転したり、すべてを選択解除/再選択したりできます。

[発見] で一括選択したメッセージから個々のメッセージを除外するdocs image

強調表示されたボタンを使用して、同じクラスターの異なるページを表示したり (A)、ページあたりのメッセージの数を調整したりできます (B)。クラスターのアノテーションが完了したら、下のドロップダウン リスト (C) を使用して新しいクラスターに移動できます。

モデルにより 30 個のクラスターが提示されます。これらのクラスターで作業を行って、探索フェーズの強固な基盤を構築することが重要です。ただし、関係がないクラスターである場合は、スキップします。

[発見] でクラスターおよびクラスター ページ間を移動する

注:

[発見] は、大量のトレーニングが完了すると再トレーニングを開始します。180 件のメッセージ (クラスターの半数) にアノテーションが行われると、再トレーニングが行われ、クラスターが更新されます。 少なくとも 30 件を確認するまで、根気よく作業を続けてください。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.