- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- Document Manager
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
インテリジェント キーワード分類器
インテリジェント キーワード分類器は、特定のドキュメントの種類のファイルから学習した単語ベクトルを使用して、ドキュメントの分類を実行する分類器です。
このアルゴリズムは、同じドキュメントの種類に対してコンテンツを繰り返すという概念を基に構築されており、ドキュメントの種類にはそれらのドキュメントの種類で通常発生する一連の単語があることを前提としています。これにより、ベクトル類似度の計算が可能になっています。
ファイルをドキュメントの種類に分類する際、インテリジェント キーワード分類器は以下を行います。
- ファイルが最も類似する単語ベクトルを検索します。
- 最もスコアが高いドキュメントの種類と、元になる主な一致単語を報告します。
インテリジェント キーワード分類器 にはファイル分割機能もあるため、特定のファイルの別個のページ範囲に対して複数のクラスを報告できます。
以下の場合、この分類器の使用を検討する必要があります。
- 単一ファイルに 1 つ以上のドキュメントの種類が含まれる場合
- コンテンツに関する限り、ドキュメントの種類を比較的容易に区別できる場合
[インテリジェント キーワード分類器トレーナー] アクティビティを [分類器トレーニング スコープ] 内に配置して、適宜設定します。
並行して実行される複数のトレーニングにおいて、トレーニング ファイルの整合性をアクティビティ レベルで確保することはできません。この問題の 2 つの解決策が、Document Understanding Process (Studio テンプレート) で提供されています。どちらの解決策も、トラフィック制御によるものです。
- ファイルをロックする (プロセス内で既定で実行): 拡張子
.lock
を使用してファイル名を変更し、ファイルを修正後に保存します。次に、再度ファイル名を変更し、拡張子.lock
を削除します。 - 特殊キューを手動で設定する: Orchestrator 内に空のキューを作成し、プロジェクトの 2 つのアクティビティを統合します。
分類器のトレーニング方法について詳しくは、学習を管理ウィザードの使用方法について説明しているこちらのページをご覧ください。
インテリジェント キーワード分類器について詳しくは、こちらをご覧ください。