Document Understanding アクティビティ

最終更新日時 2025年10月2日

検証ステーション

このページでは、[ドキュメントをデジタル化]、[データ抽出スコープ]、[検証ステーションを提示] などのアクティビティを含むワークフローの作成方法を示します。

これらのアクティビティは、同じ種類のドキュメントからのデータの抽出と検証を自動化する場合に使用できます。これらの種類のタスクに適しているのは、請求書や発注書です。

次のワークフローでは、請求書で [ドキュメントをデジタル化] アクティビティを使用し、その後 [検証ステーションを提示] アクティビティを使用して情報を検証します。このワークフローで選択されている OCR エンジンは UiPath® Document OCR ですが、他の OCR エンジンに置き換えることができます。選択された請求書ドキュメントに基づいて作成されるシンプルなタクソノミーが使用されます。タクソノミーの作成方法について詳しくは、「タクソノミーの概要」をご覧ください。

ワークフローを作成する

Studio を開いて、新しいプロセスを作成します。プロセスの既定の名前は Main です。
ワークフローデザイナーに [シーケンス] コンテナーをドラッグします。
[シーケンス] コンテナーを選択し、次の変数を作成します。
1. 変数名: taxonomy
2. 変数の型: DocumentTaxonomy
3. 既定値: なし
[シーケンス] コンテナー内に [タクソノミーを読み込み] アクティビティを追加します。
[Taxonomy] フィールドに変数 taxonomy を追加します。
[シーケンス] コンテナー内の [タクソノミーを読み込み] アクティビティの後に、[繰り返し (コレクションの各要素)] アクティビティを追加します。
- 式 doc を [繰り返し (コレクションの各要素)] フィールドに追加します。
- 式 directory.GetFiles("TestData\InputDocs\") を [入力] フィールドに追加します。
- [プロパティ] パネルの [TypeArgument (引数の型)] ドロップダウンリストから [文字列] を選択します。

[繰り返し (コレクションの各要素)] アクティビティの [本文] コンテナーを選択し、次の表に示す変数を作成します。

表 1. 作成する変数
	変数の型	既定値
`docName`	GenericValue	N/A
`dom`	Document	N/A
`text`	文字列	N/A
`extractionResults`	ExtractionResult	N/A
`validatedResults`	ExtractionResult	N/A

[本体] コンテナー内に [代入] アクティビティを追加します。
- [左辺値 (To)/宛先] フィールドに変数 docName を追加します。
- [右辺値 (Value)] フィールドに式 System.IO.Path.GetFileNameWithoutExtension(doc) を追加します。
[代入] アクティビティの後に [1 行を書き込み] アクティビティを追加します。
式 "Digitizing "+docName を [テキスト] フィールドに追加します。
[1 行を書き込み] アクティビティの後に [ドキュメントをデジタル化] アクティビティを追加します。
- [ドキュメントパス] を doc に設定します。
- [ドキュメントテキスト] フィールドに変数 text を追加します。
- [ドキュメントオブジェクトモデル] フィールドに変数 dom を追加します。
[ドキュメントをデジタル化] アクティビティ内に OCR エンジンをドラッグします。この例では、UiPath Document OCR が使用されています。
[ ドキュメントをデジタル化] アクティビティの後に [ 1 行を書き込み ] アクティビティを追加します。
式 docName+" was digitized." を [テキスト] フィールドに追加します。
[1 行を書き込み] アクティビティの後に [1 行を書き込み] アクティビティを追加します。
式 "Opening the Validation Station" を [テキスト] フィールドに追加します。
[1 行を書き込み] アクティビティの後に [トライキャッチ] アクティビティを追加します。
[Try] セクションに [シーケンス] コンテナーを追加します。
[シーケンス] コンテナー内に [検証ステーションを提示] アクティビティを追加します。
- [ドキュメントパス] フィールドの値として doc を追加します。
- [ドキュメントテキスト] フィールドに変数 text を追加します。
- [ドキュメントオブジェクトモデル] フィールドに変数 dom を追加します。
- [Taxonomy] フィールドに変数 taxonomy を追加します。
- [自動抽出結果] フィールドに変数 extractedResults を追加します。
- [承認された抽出結果] フィールドに変数 validatedResults を追加します。
[検証ステーションを提示] アクティビティの後に、[テキストファイルに書き込み] アクティビティを追加します。
プロセスを実行します。ロボットは自動的にデータを抽出し、ドキュメントを分類し、指定されたフィールドを抽出し、検証用のデータを準備し、抽出されたドキュメントを表示します。

この例の ZIP アーカイブをダウンロードするには、こちらのリンクにアクセスしてください。

検証ステーションを使用する

ワークフローを実行すると、検証ステーション ウィザードが開きます。ここでは、[トークン] オプションまたは [カスタム領域] オプションを使用して、抽出された情報を検証したり、自分で情報を抽出したりできます。タクソノミーでフィールドを複数値として設定すると、そのフィールドでは複数の値を抽出できます。これは、複数の住所や異なる通貨が含まれるドキュメントの場合に便利です。