- リリース ノート
- Document Processing Contracts について
- プレビュー版リリース
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
検証ステーション
検証ステーション ウィザードを使用すると、データの抽出と検証を簡単に行うことができます。以下に、[ドキュメントをデジタル化]、[データ抽出スコープ]、[検証ステーションを提示] などのアクティビティを含むワークフローの作成に関する詳細を示します。
これらのアクティビティは、同じ種類のドキュメントからのデータの抽出と検証を自動化する必要がある場合に利用できます。これらの種類のタスクに適しているのは、請求書や発注書です。
以下のワークフローでは、請求書で [ドキュメントをデジタル化] アクティビティを使用し、その後 [検証ステーションを提示] アクティビティを使用して情報を検証します。このワークフローで選択されている OCR エンジンは UiPath ドキュメント OCR ですが、他の OCR エンジンに置き換えても構いません。
また、タクソノミーは、使用する請求書ドキュメントに基づいて作成されるシンプルなタクソノミーです。タクソノミーの作成方法の詳細については、こちらをご覧ください。
ワークフローを作成する
サンプルと同等のオートメーション プロセスは以下のように構築できます。
- Studio を開いて、新しいプロセスを作成します。プロセスの既定の名前は Main です。
- ワークフロー デザイナーに [シーケンス] コンテナーをドラッグします。
-
[シーケンス] コンテナーを選択し、次の変数を作成します。
変数名
変数の型
既定値
taxonomy
DocumentTaxonomy
-
[シーケンス] コンテナー内に [タクソノミーを読み込み] アクティビティをドラッグします。
- [Taxonomy] フィールドに変数
taxonomy
を追加します。
- [Taxonomy] フィールドに変数
-
[タクソノミーを読み込み] アクティビティの下に [繰り返し (コレクションの各要素)] アクティビティをドラッグします。
- 式
doc
を [繰り返し (コレクションの各要素)] フィールドに追加します。 - 式
directory.GetFiles("TestData\InputDocs\")
を [入力] フィールドに追加します。 - [プロパティ] パネルの [TypeArgument (引数の型)] ドロップダウン リストから [文字列] を選択します。
- 式
-
[繰り返し (コレクションの各要素)] アクティビティの [本体] コンテナーを選択し、次の変数を作成します。
変数名
変数の型
既定値
docName
GenericValue
dom
Document
text
文字列
extractionResults
ExtractionResult
validatedResults
ExtractionResult
-
[本体] コンテナー内に [代入] アクティビティを追加します。
- [左辺値 (To)/宛先] フィールドに変数
docName
を追加します。 - [右辺値 (Value)] フィールドに式
System.IO.Path.GetFileNameWithoutExtension(doc)
を追加します。
- [左辺値 (To)/宛先] フィールドに変数
-
[代入] アクティビティの下に [1 行を書き込み] アクティビティを追加します。
- 式
"Digitizing "+docName
を [テキスト] フィールドに追加します。
- 式
-
[1 行を書き込み] アクティビティの下に [ドキュメントをデジタル化] アクティビティを追加します。
- [ドキュメントパス] を
doc
に設定します。 - [ドキュメント テキスト] フィールドに変数
text
を追加します。 - [ドキュメント オブジェクト モデル] フィールドに変数
dom
を追加します。
- [ドキュメントパス] を
- [ドキュメントをデジタル化] アクティビティ内に OCR エンジンをドラッグします。この例では、UiPath ドキュメント OCR が使用されています。
-
[ドキュメントをデジタル化] アクティビティの下に [1 行を書き込み] アクティビティを追加します。
- 式
docName+" was digitized."
を [テキスト] フィールドに追加します。
- 式
-
[1 行を書き込み] アクティビティの下に [1 行を書き込み] アクティビティを追加します。
- 式
"Opening the Validation Station"
を [テキスト] フィールドに追加します。
- 式
- [1 行を書き込み] アクティビティの下に [トライ キャッチ] アクティビティを追加します。
- [Try] セクションに [シーケンス] コンテナーを追加します。
-
[シーケンス] コンテナー内に [検証ステーションを提示] アクティビティを追加します。
- [ドキュメントパス] フィールドの値として
doc
を追加します。 - [ドキュメント テキスト] フィールドに変数
text
を追加します。 - [ドキュメント オブジェクト モデル] フィールドに変数
dom
を追加します。 - [Taxonomy] フィールドに変数
taxonomy
を追加します。 - [自動抽出結果] フィールドに変数
extractedResults
を追加します。 - [承認された抽出結果] フィールドに変数
validatedResults
を追加します。
- [ドキュメントパス] フィールドの値として
- [検証ステーションを提示] アクティビティの下に、[テキスト ファイルに書き込み] アクティビティを追加します。
- プロセスを実行します。ロボットは自動的にデータを抽出し、ドキュメントを分類し、指定されたフィールドを抽出し、検証用のデータを準備し、抽出されたドキュメントを表示します。
こちらからサンプルをダウンロードできます。
検証ステーションを使用する
ワークフローを実行すると、検証ステーション ウィザードが開きます。ここでは、[トークン] オプションまたは [カスタム領域] オプションを使用して、抽出された情報を検証したり、自分で情報を抽出したりできます。タクソノミーでフィールドを複数値として設定すると、そのフィールドでは複数の値を抽出できます。これは、複数の住所や異なる通貨が含まれるドキュメントの場合に便利です。
[トークン] オプションと [カスタム領域] オプションの切り替え方法を見てみましょう。
フィールドに値を追加する方法の例を以下に示します。
検証ステーションの使用方法やカスタマイズ方法の詳細は、こちらをご覧ください。