activities
latest
false
- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ドキュメントのデジタル化の手動検証
- インテリジェント フォーム抽出器を使用したアンカーベースのデータ抽出
- 検証ステーション
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
Document Understanding アクティビティ
最終更新日時 2024年12月5日
ドキュメントのデジタル化の手動検証
以下の例では、画像からデータを手動で抽出し、出力を別のファイルに表示する方法について説明します。これは、[ドキュメントをデジタル化] や [検証ステーションを提示] などのアクティビティを示します。これらのアクティビティは、UiPath.IntelligentOCR.Activities パッケージに含まれています。
注: このワークフローは UiPath.IntelligentOCR.Activities パッケージの古いバージョンを使用しています。
Steps:
- Studio を開いて、新しいプロセスを作成します。プロセスの既定の名前は Main です。
注: プロジェクト フォルダー内に必要なすべてのファイル (
.json
ファイルとすべての画像) を必ず追加してください。 - ワークフロー デザイナーに [シーケンス] コンテナーを追加して、次の表に示す変数を作成します。
表 1. 作成する変数 変数の型
既定値
Text
文字列
DOM
UiPath.DocumentProcessing.Contracts.Dom.Document
Data
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
DocumentTaxonomy
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
TaxonomyJSON
文字列
HumanValidated
UiPath.DocumentProcessing.Contracts.Results.ExtractionResult
- シーケンス内に [テキスト ファイルを読み込み] アクティビティをドラッグします。
- [プロパティ] パネルで [FileName] フィールドにファイルの名前 (この場合は、
"taxonomy.json"
) を追加します。 - Content (コンテンツ) フィールドに変数
TaxonomyJSON
を追加します。
- [プロパティ] パネルで [FileName] フィールドにファイルの名前 (この場合は、
- [テキスト ファイルを読み込み] アクティビティの後に [代入] アクティビティを追加します。
- [To] フィールドに変数
Data
を追加し、[Value] フィールドに式DocumentTaxonomy.Deserialize(TaxonomyJSON)
を追加します。このアクティビティは抽出用のタクソノミーを構築します。
- [To] フィールドに変数
- [代入] アクティビティの下に [ドキュメントをデジタル化] アクティビティを追加します。
- [プロパティ] パネルで [並列度] フィールドに値
1
を追加します。 - [ドキュメント パス] フィールドに式
"Input\Invoice01.tif"
を追加します。 - [ドキュメント オブジェクト モデル] フィールドに変数
DOM
を追加します。 - [ドキュメント テキスト] フィールドに変数
Text
を追加します。
- [プロパティ] パネルで [並列度] フィールドに値
- [ドキュメントをデジタル化] アクティビティ内に Google OCR エンジンを追加します。
- [プロパティ] パネルで [Image] フィールドに変数
Image
を追加します。 - [ExtractWords] オプションのチェック ボックスをオンにします。このオプションは、検出されたすべての単語の画面上の位置を抽出します。
- [Language] フィールドに式
"eng"
を追加します。 - Profile ドロップダウン リストからオプション
Legacy
を選択します。 - [Scale] フィールドに値
2
を追加します。
- [プロパティ] パネルで [Image] フィールドに変数
- [ドキュメントをデジタル化] アクティビティの後に [検証ステーションを提示] アクティビティを追加します。
- [プロパティ] パネルで [ドキュメント オブジェクト モデル] フィールドに変数
DOM
を追加します。 - [ドキュメント パス] フィールドに式
"Input\Invoice01.tif"
を追加します。 - [ドキュメント テキスト] フィールドに変数
Text
を追加します。 - [Taxonomy] フィールドに変数
Data
を追加します。 - [承認された抽出結果] フィールドに変数
HumanValidated
を追加します。
- [プロパティ] パネルで [ドキュメント オブジェクト モデル] フィールドに変数
- [検証ステーションを提示] アクティビティの下に [繰り返し (コレクションの各要素)] アクティビティを追加します。
- [プロパティ] パネルで TypeArgument ドロップダウン リストからオプション
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint
を選択します。 - 式
HumanValidated.ResultsDocument.Fields
を Value (値) フィールドに追加します。
- [プロパティ] パネルで TypeArgument ドロップダウン リストからオプション
- [繰り返し (コレクションの各要素)]アクティビティの [本体] 内に [メッセージをログ] アクティビティを追加します。
- [レベル] ドロップダウン リストからオプション
Info
を選択します。 - 式
item.FieldName
を Message フィールドに追加します。
- [レベル] ドロップダウン リストからオプション
- 最初の [メッセージをログ] アクティビティの下に [メッセージをログ] アクティビティを追加します。
- [レベル] ドロップダウン リストからオプション
Info
を選択します。 - 式
item.Values(0).Value.ToString
を Message フィールドに追加します。
- [レベル] ドロップダウン リストからオプション
- [メッセージをログ] アクティビティの下に [1 行を書き込み] アクティビティを追加します。
- Text (テキスト) フィールドに値
""
を追加します。
- Text (テキスト) フィールドに値
- プロセスを実行します。ロボットは Intelligent OCR アクティビティを使用して、データを手動で処理し、結果を表示します。
この例を
ZIP
ファイルとしてダウンロードするには、こちらのリンクにアクセスしてください。