Document Understanding アクティビティ

最終更新日時 2026年2月17日

ドキュメントのデジタル化の手動検証

以下の例では、画像からデータを手動で抽出し、出力を別のファイルに表示する方法について説明します。これは、[ドキュメントをデジタル化] や [検証ステーションを提示] などのアクティビティを示します。これらのアクティビティは、UiPath.IntelligentOCR.Activities パッケージに含まれています。

注: このワークフローは UiPath.IntelligentOCR.Activities パッケージの古いバージョンを使用しています。

Steps:

Studio を開いて、新しいプロセスを作成します。プロセスの既定の名前は Main です。
注: プロジェクトフォルダー内に必要なすべてのファイル (.json ファイルとすべての画像) を必ず追加してください。

ワークフローデザイナーに [シーケンス] コンテナーを追加して、次の表に示す変数を作成します。

表 1. 作成する変数
	変数の型	既定値
`Text`	文字列
`DOM`	UiPath.DocumentProcessing.Contracts.Dom.Document
`Data`	UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
`DocumentTaxonomy`	UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
`TaxonomyJSON`	文字列
`HumanValidated`	UiPath.DocumentProcessing.Contracts.Results.ExtractionResult

シーケンス内に [テキストファイルを読み込み] アクティビティをドラッグします。
- [プロパティ] パネルで [FileName] フィールドにファイルの名前 (この場合は、"taxonomy.json") を追加します。
- Content (コンテンツ) フィールドに変数 TaxonomyJSON を追加します。
[テキストファイルを読み込み] アクティビティの後に [代入] アクティビティを追加します。
- [To] フィールドに変数 Data を追加し、[Value] フィールドに式 DocumentTaxonomy.Deserialize(TaxonomyJSON) を追加します。このアクティビティは抽出用のタクソノミーを構築します。
[代入] アクティビティの下に [ドキュメントをデジタル化] アクティビティを追加します。
- [プロパティ] パネルで [並列度] フィールドに値 1 を追加します。
- [ドキュメントパス] フィールドに式 "Input\Invoice01.tif" を追加します。
- [ドキュメントオブジェクトモデル] フィールドに変数 DOM を追加します。
- [ドキュメントテキスト] フィールドに変数 Text を追加します。
[ドキュメントをデジタル化] アクティビティ内に Google OCR エンジンを追加します。
- [プロパティ] パネルで [Image] フィールドに変数 Image を追加します。
- [ExtractWords] オプションのチェックボックスをオンにします。このオプションは、検出されたすべての単語の画面上の位置を抽出します。
- [Language] フィールドに式 "eng" を追加します。
- Profile ドロップダウンリストからオプション Legacy を選択します。
- [Scale] フィールドに値 2 を追加します。
[ドキュメントをデジタル化] アクティビティの後に [検証ステーションを提示] アクティビティを追加します。
- [プロパティ] パネルで [ドキュメントオブジェクトモデル] フィールドに変数 DOM を追加します。
- [ドキュメントパス] フィールドに式 "Input\Invoice01.tif" を追加します。
- [ドキュメントテキスト] フィールドに変数 Text を追加します。
- [Taxonomy] フィールドに変数 Data を追加します。
- [承認された抽出結果] フィールドに変数 HumanValidated を追加します。
[検証ステーションを提示] アクティビティの下に [繰り返し (コレクションの各要素)] アクティビティを追加します。
- [プロパティ] パネルで TypeArgument ドロップダウンリストからオプション UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint を選択します。
- 式 HumanValidated.ResultsDocument.Fields を Value (値) フィールドに追加します。
[繰り返し (コレクションの各要素)]アクティビティの [本体] 内に [メッセージをログ] アクティビティを追加します。
- [レベル] ドロップダウンリストからオプション Info を選択します。
- 式 item.FieldName を Message フィールドに追加します。
最初の [メッセージをログ] アクティビティの下に [メッセージをログ] アクティビティを追加します。
- [レベル] ドロップダウンリストからオプション Info を選択します。
- 式 item.Values(0).Value.ToString を Message フィールドに追加します。
[メッセージをログ] アクティビティの下に [1 行を書き込み] アクティビティを追加します。
- Text (テキスト) フィールドに値 "" を追加します。
プロセスを実行します。ロボットは Intelligent OCR アクティビティを使用して、データを手動で処理し、結果を表示します。

この例を ZIP ファイルとしてダウンロードするには、こちらのリンクにアクセスしてください。

このページは役に立ちましたか?

前へアプリアクションを使用してドキュメントを検証する

次へインテリジェントフォーム抽出器を使用したアンカーベースのデータ抽出