ixp
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Communications Mining ガイド

最終更新日時 2026年3月13日

バランスを改善する、および「リバランス」を使用する

注:

Automation Cloud ユーザーとして [ソース] - [読み取り ] 権限と [データセット - 確認 ] 権限、またはレガシ ユーザーとして [ ソースの表示 ] 権限と [ 確認とアノテーション] 権限を割り当てている必要があります。

バランス:導入と重要性

[検証][モデルの評価] に表示されるバランスの評価は、データセット内の確認済みのデータ (トレーニング データ) が、データセット全体と比較してどの程度バランスがとれているかを反映します。

ここでは、以下を含む多くの要因が考慮されます。

  • 確認済みのデータと未確認のデータの類似性 (パーセンテージ スコアで表示)
  • ランダム サンプリング (シャッフルモード) で確認した確認済みのデータの割合
  • リバランス」を使用して確認したデータの割合
  • テキスト検索」を使用して確認したデータの割合

モデルの評価の [バランス] コンポーネントの例

docs image

ランダム サンプリングで確認したデータの割合が高く (理想的には 20%+)、検索を使用してアノテーションを行った確認済みのデータの割合が低いことが重要です。

ただし、バランスの評価は、未確認のデータと確認済みのデータの類似性を測定する類似性スコアの影響を最も大きく受けます。

この類似性スコアの計算には、独自のアノテーションの偏りモデルを用いて、確認済みのデータと未確認のデータを比較し、アノテーションが行われたデータがデータセット全体を代表していることを確認します。データが代表的ではなく、偏った方法でアノテーションが行われている場合、モデルのパフォーマンス指標は誤解を招くものになり、信頼できない可能性があります。

このプラットフォームでのアノテーションの偏りは通常、ラベルの割り当てに使用したトレーニング モードのバランスがとれていなかった結果であり、特に「テキスト検索」を使用しすぎて「シャッフル」モードを十分に使用していない場合にあてはまります。ただし、「シャッフル」モードの使用割合が高い場合にも発生する可能性があります。「ラベルを教える」などのモードで特定のラベルをトレーニングすると、当然、確認済みのデータにわずかなアンバランスが生じる可能性があります。このプラットフォームでは、このような状況が発生した場合に特定し、迅速かつ効果的に対処できます。

リバランス: はじめにと使用方法

Rebalance is a training mode that helps to reduce the potential imbalances in how a model has been annotated, i.e. annotating bias, which mean that the reviewed data is not as representative of the whole dataset as it could be.

リバランス トレーニング モードは、確認済みのセット内の代表性の低いメッセージを示します。

このモードで提示されたメッセージにアノテーションを行うと (他のトレーニング モードの場合と同様の方法)、トレーニング データのアンバランスに対処し、モデルのバランス スコアを改善できます。

ヒント:

リバランスは一般的に、少しずつ頻繁に使用した場合に最も効果があります。このモードで少数のメッセージ (10 から 20 個) をアノテーションし、モデルを再トレーニングする時間を設けてから更新し、さらに多くの例をアノテーションすると、リバランスがモデルのバランス スコアに与える影響を最も効果的に最大化できます。

デモ データセットの「リバランス」トレーニング モード

docs image

類似性スコアが高いにもかかわらずバランスの評価が低い場合、シャッフル モードで十分な数のトレーニング データにアノテーションを行っていないことが原因である可能性があります。この場合、ランダムに選択されたメッセージにアノテーションを行うことが、優先度の高い推奨されるアクションとして提案されます。このモードでトレーニングすることにより、プラットフォームは、データセットに偏った方法でアノテーションが行われていないこと、およびトレーニング データが代表性の高いサンプルであることについて追加の確信を持つことができます。

使用するリバランスの量

リバランスを継続的に繰り返し使用してモデルの類似性スコアを向上させる必要があります。その結果、[バランス] の評価が向上します。

[検証] で評価が「良好」になった後、類似性スコアをどこまで高めてから「リバランス」でのトレーニングを中止するかは、ユーザーの判断に任されています。

この評価をできる限り最適化することを目標にすることはできますが、トレーニングを継続していくと必ず、効果が徐々に薄れていきます。一般的には、評価が「良好」になったら、良好なモデルとして許容できるパフォーマンス レベルであると見なすことをお勧めします。

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得