- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ContentValidationData クラス
- EvaluatedBusinessRulesForFieldValue クラス
- EvaluatedBusinessRuleDetails クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- FieldValue クラス
- FieldValueResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- ルール クラス
- RuleResult クラス
- RuleSet クラス
- RuleSetResult クラス
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- FieldValueDetails クラス
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- BasicDataPoint クラス - プレビュー
- ExtractionResultHandler クラス - プレビュー
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント検証成果物を作成
- ドキュメント検証成果物を取得
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- Document Understanding プロジェクト抽出器トレーナー
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- ドキュメントを墨消し
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- マシン ラーニング抽出器
- マシン ラーニング抽出器トレーナー
- マシン ラーニング分類器
- マシン ラーニング分類器トレーナー
- 生成 AI 分類器
- 生成 AI 抽出器
- 認証を構成する
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
Document Understanding アクティビティ
このページでは、[ ドキュメントをデジタル化]、[ データ抽出スコープ]、[ 検証ステーションを提示] などのアクティビティを含むワークフローの作成方法を示します。
これらのアクティビティは、同じ種類のドキュメントからのデータの抽出と検証を自動化する場合に使用できます。これらの種類のタスクに適しているのは、請求書や発注書です。
次のワークフローでは、請求書で [ ドキュメントをデジタル化 ] アクティビティを使用し、その後 [ 検証ステーションを提示 ] アクティビティを使用して情報を検証します。このワークフローで選択されている OCR エンジンは UiPath® Document OCR ですが、他の OCR エンジンに置き換えることができます。選択された請求書ドキュメントに基づいて作成されるシンプルなタクソノミーが使用されます。タクソノミーの作成方法について詳しくは 、「タクソノミーの概要 」をご覧ください。
ワークフローを作成する
-
Studio を開いて、新しいプロセスを作成します。プロセスの既定の名前は Main です。
-
ワークフロー デザイナーに [シーケンス] コンテナーをドラッグします。
-
[シーケンス] コンテナーを選択し、次の変数を作成します。
- 変数名:
taxonomy; - 変数の型: DocumentTaxonomy
- 既定値: なし
- 変数名:
-
[シーケンス] コンテナー内に [タクソノミーを読み込み] アクティビティを追加します。
[Taxonomy] フィールドに変数
taxonomyを追加します。 -
[シーケンス] コンテナー内の [タクソノミーを読み込み] アクティビティの後に、[繰り返し (コレクションの各要素)] アクティビティを追加します。
- 式
docを [繰り返し (コレクションの各要素)] フィールドに追加します。 - 式
directory.GetFiles("TestData\InputDocs\")を [入力] フィールドに追加します。 - [プロパティ] パネルの [TypeArgument (引数の型)] ドロップダウン リストから [文字列] を選択します。
- 式
-
[繰り返し (コレクションの各要素)] アクティビティの [本文] コンテナーを選択し、次の表に示す変数を作成します。
表 1.作成する変数
変数の型 既定値 docNameGenericValue N/A domDocument N/A text文字列 N/A extractionResultsExtractionResult N/A validatedResultsExtractionResult N/A -
[本体] コンテナー内に [代入] アクティビティを追加します。
- [左辺値 (To)/宛先] フィールドに変数
docNameを追加します。 - [右辺値 (Value)] フィールドに式
System.IO.Path.GetFileNameWithoutExtension(doc)を追加します。
- [左辺値 (To)/宛先] フィールドに変数
-
[代入] アクティビティの後に [1 行を書き込み] アクティビティを追加します。
[テキスト] フィールドに
"Digitizing "+docNameを追加します。 -
[1 行を書き込み] アクティビティの後に [ドキュメントをデジタル化] アクティビティを追加します。
- [ドキュメントパス] を
docに設定します。 - [ドキュメント テキスト] フィールドに変数
textを追加します。 - [ドキュメント オブジェクト モデル] フィールドに変数
domを追加します。
- [ドキュメントパス] を
-
[ドキュメントをデジタル化] アクティビティ内に OCR エンジンをドラッグします。この例では、UiPath Document OCR が使用されています。
-
[ドキュメントをデジタル化] アクティビティの後に [1 行を書き込み] アクティビティを追加します。
[テキスト] フィールドに
docName+" was digitized."を追加します。 -
[1 行を書き込み] アクティビティの後に [1 行を書き込み] アクティビティを追加します。
[テキスト] フィールドに
"Opening the Validation Station"を追加します。 -
[1 行を書き込み] アクティビティの後に [トライ キャッチ] アクティビティを追加します。
-
[Try] セクションに [シーケンス] コンテナーを追加します。
-
[シーケンス] コンテナー内に [検証ステーションを提示] アクティビティを追加します。
- [ドキュメントパス] フィールドの値として
docを追加します。 - [ドキュメント テキスト] フィールドに変数
textを追加します。 - [ドキュメント オブジェクト モデル] フィールドに変数
domを追加します。 - [Taxonomy] フィールドに変数
taxonomyを追加します。 - [自動抽出結果] フィールドに変数
extractedResultsを追加します。 - [承認された抽出結果] フィールドに変数
validatedResultsを追加します。
- [ドキュメントパス] フィールドの値として
-
[検証ステーションを提示] アクティビティの後に、[テキスト ファイルに書き込み] アクティビティを追加します。
-
プロセスを実行します。ロボットは自動的にデータを抽出し、ドキュメントを分類し、指定されたフィールドを抽出し、検証用のデータを準備し、抽出されたドキュメントを表示します。
この例の ZIP アーカイブをダウンロードするには、こちらのリンクにアクセスしてください。
検証ステーションを使用する
ワークフローを実行すると、検証ステーション ウィザードが開きます。ここでは、[トークン] オプションまたは [カスタム領域] オプションを使用して、抽出された情報を検証したり、自分で情報を抽出したりできます。タクソノミーでフィールドを複数値として設定すると、そのフィールドでは複数の値を抽出できます。これは、複数の住所や異なる通貨が含まれるドキュメントの場合に便利です。