Document Understanding ガイド

デリバリー:

最終更新日時 2025年7月10日

Document Understanding アクティビティ

DocumentUnderstanding.Activities では、Document Understanding^TM プロセスから得られたすべての情報を 1 つの Document Data オブジェクト内に格納することで、統一された方法でドキュメントを管理できます。さらに、DocumentUnderstanding.Activities はモダンプロジェクトと連携しているため、再利用が可能です。

既知の制限事項

UiPath は、DocumentUnderstanding.Activities パッケージの現在の制限事項を認識しており、近日中に解決する予定です。以下の機能はまだ利用できません。

ドキュメントの分割のサポート。
ビジネスルール。
モデルのトレーニング。
オートメーションがデプロイされているテナント以外のモデルのサポート。
Automation Suite のサポート。

1. ドキュメントの処理

ドキュメントを処理するには、PDF ファイルを抽出用に準備する必要があります。Document Understanding アクティビティを使用して、以下を実行できます。

テキスト、画像、特定のページを抽出したり、複数の PDF を結合したりする。
暗号化された PDF ドキュメントのパスワードを変更する。

Document Understanding アクティビティで PDF ファイルを処理するには、以下のアクティビティを使用します。

アクティビティ	説明
PDF のパスワードを設定	指定した PDF ファイルのパスワードを変更します。
PDF を結合	ファイルオブジェクトのコレクションを結合します。
PDF のページ数を取得	PDF ファイルの総ページ数を指定します。
PDF のテキストを抽出	PDF ドキュメントからテキストを抽出します。
PDF の画像を抽出	このアクティビティは、PDF ファイルで見つかるすべての画像を抽出します。
PDF のページ範囲を抽出	PDF ドキュメントの指定したページ範囲を抽出します。

2. データの抽出

[ドキュメントデータを抽出] アクティビティを使用すると以下のことができます。

Document Data オブジェクトとして保存された入力ファイルからデータを抽出する。
抽出結果を同じ Document Data オブジェクトに格納する。

ドキュメントデータは、Document Understanding ワークフロー内で入力変数および出力変数の両方として機能するリソースです。Document Data オブジェクトは、1 つのドキュメントに関する必要な情報をすべて保持します。ドキュメントを分類する場合、このオブジェクトにはドキュメントの種類が含まれます。データを抽出する場合は、対応する抽出されたフィールドが含まれます。アクティビティに関係なく、ドキュメントのテキストと DOM (ドキュメントオブジェクトモデル) は常に含まれます。

ファイルを入力として指定するのは、[ドキュメントデータを抽出] を初めて使用するときだけです。出力 (ドキュメントデータ) をワークフロー全体で再利用し、同じファイルが再デジタル化されないようにする必要があります。再デジタル化にはページあたり 1 AI ユニットのコストがかかります。

詳しくは、「ドキュメントデータ」をご覧ください。

3. データの分類

[ドキュメントを分類] アクティビティを使用して、以下を実行します。

さまざまな分類モデルから選択する。
分類したデータを Document Data オブジェクトに出力する。

4. データを検証する

ドキュメント処理の検証手順では、処理されたドキュメントを送信して、Action Center 内でチームのメンバーとともに検証します。以下のアクティビティを使用して、Action Center でのドキュメント検証プロセスを構成することもできます。

アクティビティ	説明
検証タスクを作成	検証アクションを作成し、ワークフローが完了するまで検証を中断します。
検証タスク完了まで待機し再開	検証が完了するまでアクションを一時停止し、検証後に自動的に再開します。
検証タスクを作成して待機	Action Center 内に抽出結果を視覚化および変更するためのアクションを作成し、アクションが完了するまでワークフローを一時停止します。
分類の検証タスクを作成	分類されたドキュメントデータを確認するアクションを作成します。ただし、アクションが完了するまで待機しません。
分類の検証タスクを作成して待機	分類されたデータを確認するアクションを作成し、アクションが完了するまで待機してからワークフローを再開します。
分類の検証タスク完了まで待機し再開	分類の検証アクションが完了するまで待機してから、ワークフローを再開します。