document-understanding
2024.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Document Understanding ガイド
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 2024年11月11日

インテリジェント キーワード分類器

インテリジェント キーワード分類器とは

インテリジェント キーワード分類器は、特定のドキュメントの種類のファイルから学習した単語ベクトルを使用して、ドキュメントの分類を実行する分類器です。

このアルゴリズムは、同じドキュメントの種類に対してコンテンツを繰り返すという概念を基に構築されており、ドキュメントの種類にはそれらのドキュメントの種類で通常発生する一連の単語があることを前提としています。これにより、ベクトル類似度の計算が可能になっています。

ファイルをドキュメントの種類に分類する際、インテリジェント キーワード分類器は以下を行います。

  • ファイルが最も類似する単語ベクトルを検索します。
  • 最もスコアが高いドキュメントの種類と、元になる主な一致単語を報告します。

インテリジェント キーワード分類器 にはファイル分割機能もあるため、特定のファイルの別個のページ範囲に対して複数のクラスを報告できます。

注: キーワード ベースの分類器と異なり、インテリジェント キーワード分類器をトレーニングする際にドキュメント内の参照を手動で選択する必要はありません。このような参照をトレーニング時に指定しても無視されます。

使用すべきタイミング

以下の場合、この分類器の使用を検討する必要があります。

  • 単一ファイルに 1 つ以上のドキュメントの種類が含まれる場合
  • コンテンツに関する限り、ドキュメントの種類を比較的容易に区別できる場合
注: v6.9.0 から、[インテリジェント キーワード分類器] アクティビティの分割パフォーマンスが向上しました。最適化された分割パフォーマンスを享受するには、v6.9.0 以降を使用してください。

特別な要件

You need to use your Automation CloudTM Document UnderstandingTM API Key, or host your own instance of the Intelligent Keyword Classifier in AI Center on-prem, to use this classifier.

トレーニング方法

[インテリジェント キーワード分類器トレーナー] アクティビティを [分類器トレーニング スコープ] 内に配置して、適宜設定します。

並行して実行される複数のトレーニングにおいて、トレーニング ファイルの整合性をアクティビティ レベルで確保することはできません。この問題の 2 つの解決策が、Document Understanding Process (Studio テンプレート) で提供されています。どちらの解決策も、トラフィック制御によるものです。

  1. ファイルをロックする (プロセス内で既定で実行): 拡張子 .lock を使用してファイル名を変更し、ファイルを修正後に保存します。次に、再度ファイル名を変更し、拡張子 .lock を削除します。
  2. 特殊キューを手動で設定する: Orchestrator 内に空のキューを作成し、プロジェクトの 2 つのアクティビティを統合します。

分類器のトレーニング方法について詳しくは、学習を管理ウィザードの使用方法について説明しているこちらのページをご覧ください。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.