通知を受け取る

UiPath Document Understanding

UiPath Document Understanding

はじめに

UiPath の Document Understanding フレームワークを使用することで、オープンで拡張可能かつ幅広い用途で使える環境において、あらゆる受信ファイルの処理 (ファイルのデジタル化から抽出データの検証まで) を、円滑に行うことができます。

Document Understanding は、様々なドキュメントの種類から情報を抽出するために、異なるアプローチを組み合わることができるよう設計されています。さまざまなドキュメントからデータを抽出する単一のワークフローを作成することで、データ抽出プロセスをできるだけシンプルにします。

Document Understanding フレームワークを使用する前に、以下の Document Understanding フレームワーク コンポーネントを理解しておくことをお勧めします。

  • タクソノミー
    What documents need to be processed and what data is required from them?
    Used to define the document types and the pieces of information targeted for data extraction (fields) for each document type, and formalizes this information into a dedicated Taxonomy structure. This metadata information is managed through the Taxonomy Manager.

  • デジタル化
    What does this file contain?
    受け取るドキュメントのテキスト コンテンツと構造を取得し、ファイルを機械判読可能なコンテンツに変換して、下流でさらに処理できるようにするために使用します。

  • ドキュメント分類
    What types of documents from the taxonomy are found in this file?
    デジタル化されたファイルに含まれるドキュメントの種類を自動的に特定するために使用します。

  • ドキュメント分類の検証
    Is the predicted classification correct? This is how I can review and correct it.
    自動分類およびドキュメント分割の結果の人間による検証および修正をサポートするために使用します。

  • Classification Training
    Did the human review the data? This is how the robot can learn from it.
    人間が検証した情報を分類器に返し、それを使用して今後の予測を改善するために使用します。

  • データ抽出
    What data can be found in this particular document?
    特定の入力ドキュメントおよび分類ページ範囲内で、識別されたドキュメントの種類で必要とされる情報をキャプチャするために使用します。

  • データ抽出の検証
    Is the extracted information correct? This is how I can review and correct it.
    自動的に抽出されたデータ結果の、人間による検証および修正をサポートするために使用します。

  • データ抽出トレーニング
    Did the human review the data? This is how the robot can learn from it.
    人間が検証した抽出データを抽出器に返し、それを使用して抽出予測を改善するために使用します。

  • データ消費
    検証済みデータをエクスポートして消費するために使用します。

  • 使用状況の測定と請求のロジック
    利用可能な各サービスのページあたりの消費単位の説明に使用します。

以下の図は、Document Understanding フレームワークのコンポーネント間の関連を示しています。

The Document Understanding framework is found in the UiPath.IntelligentOCR.Activities package. Once the UiPath.IntelligentOCR.Activities package is installed, the Taxonomy Manager wizard appears in the top ribbon of the UiPath Studio. This same package contains all the core document understanding framework activities.

The scope activities (Classify Document Scope, Data Extraction Scope, Train Classifiers Scope, Train Extractors Scope) that are part of the Document Understanding framework allow you to use any document classification and data extraction algorithms that fit your use case and then train these algorithms.

The Document Understanding framework can be used not only with the out-of-the-box classifiers and extractors but also with any custom-built ones. These can be created using the abstract classes from the UiPath.DocumentProcessing.Contracts package and can be implemented as classification or data extraction activities. Custom-built OCR engines can also be created using the abstract classes from the UiPath.OCR.Contracts package.

リソース

Dedicated Document Understanding courses can be found in the UiPath RPA Academy.

UiPath コミュニティ フォーラムは、当社の成長著しいユーザー コミュニティから支援を受けられるフォーラムです。

10 か月前に更新


はじめに


改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。