- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
Document Understanding アクティビティ
データ抽出スコープ
UiPath.IntelligentOCR.Activities.DataExtraction.DataExtractionScope
ExtractionResult
変数に格納され、[抽出結果をエクスポート] アクティビティの入力値として使用できます。また、このアクティビティは、抽出器を設定ウィザードを備えており、タクソノミーで定義したドキュメントの種類から抽出対象とするフィールドを指定できます。
デザイナー パネル
入力
- ドキュメント パス - 検証するドキュメントへのパスです。このフィールドは、文字列と String 型変数のみをサポートします。
注: このプロパティ フィールドでサポートされているファイルは、
.png
、.gif
、.jpe
、.jpg
、.jpeg
、.tiff
、.tif
、.bmp
、.pdf
です。 - ドキュメント テキスト - String 型変数に格納されたドキュメント自体のテキストです。この値は、[ドキュメントをデジタル化] アクティビティから取得できます。方法について詳しくは、「ドキュメントをデジタル化」をご覧ください。このフィールドは、文字列と
String
型変数のみをサポートします。 - ドキュメント オブジェクト モデル - ドキュメントの検証に使用するドキュメント オブジェクト モデルです。このモデルは
Document
変数に格納され、[ドキュメントをデジタル化] アクティビティから取得できます。方法について詳しくは、「ドキュメントをデジタル化」をご覧ください。このフィールドではDocument
型の変数のみがサポートされています。 - タクソノミー - ドキュメントの処理に使用するタクソノミーです。
DocumentTaxonomy
変数に格納されます。このオブジェクトは、[タクソノミーを読み込み] アクティビティで使用します。このフィールドではDocumentTaxonomy
変数のみをサポートします。 - 分類結果 - 指定したドキュメント上で分類器アクティビティを実行した結果です。
ClassificationResult
オブジェクトに格納されます。このフィールドは、[ドキュメント種類 ID] を指定している場合には、任意になります。このフィールドでは、ClassificationResult
型の変数のみがサポートされています。 - ドキュメント種類 ID - タクソノミー マネージャーで特定されるドキュメントの種類の ID です。このフィールドは、[分類結果] でファイルを指定している場合には、任意になります。このフィールドは、文字列と
String
型変数のみをサポートします。
出力
- 抽出結果 - データ抽出処理の抽出結果です。
ExtractionResult
変数に格納されます。注: データ抽出のページ範囲として、元のファイルの一部分のみが指定されている場合、[データ抽出スコープ] はTEMP
プロジェクト フォルダーにファイルを生成した後、それを抽出器に渡します。この一時ファイルには、ドキュメント処理のために抽出器が受け取るべきページ範囲のみが含まれます。
プロパティ パネル
認証
このアクティビティの [認証] プロパティを使用すると、オンプレミスのロボットを使用して自動検証を実行できます。これらのプロパティを設定する前に、「認証を構成する」のページに記載された前提条件を満たしていることを確認してください。これらの手順が完了したら、アクティビティの [認証] プロパティの入力に進むことができます。
- 実行時の資格情報アセット - このフィールドは、ロボットがローカルの Orchestrator に接続されているとき、または別のテナントから接続されているときに、Document Understanding の自動検証機能にアクセスする必要がある場合に使用します。認証のための資格情報アセットは、次のいずれかの方法で入力できます。
- ドロップダウン リストから、UiPath® Robot が接続されている Orchestrator の目的の資格情報アセットを選択します。
- 自動検証機能にアクセスするための外部アプリケーションの資格情報を保存する Orchestrator 資格情報アセットへのパスを手動で入力します。
パスの形式は、
<OrchestratorFolderName>/<AssetName>
のようになります。
- 実行時のテナント URL - このフィールドは、[実行時の資格情報アセット] フィールドとともに使用します。自動検証を実行するためにロボットが接続するテナントの URL を入力します。URL の形式は、
https://<baseURL>/<OrganizationName>/<TenantName>
です。
共通
- 表示名 - アクティビティの表示名です。
入力
- 自動検証を適用 - 生成 AI による抽出のクロスチェックを使用して、信頼度を調整します。生成 AI によって確認された報告値の信頼度は 99% に引き上げられます。この機能を有効化すると、追加の AI ユニットが消費されます。
重要:
この機能は現在のところ監査プロセスの一部であり、レビューが完了するまで FedRAMP 承認の一部と見なすべきではありません。現在レビュー中の機能の完全なリストについては、こちらをご覧ください。
- 分類結果 - 指定したドキュメント上で分類器アクティビティを実行した結果です。
ClassificationResult
オブジェクトに格納されます。このフィールドは、[ドキュメント種類 ID] を指定している場合には、任意になります。このフィールドでは、ClassificationResult
型の変数のみがサポートされています。 - ドキュメント オブジェクト モデル - ドキュメントの検証に使用するドキュメント オブジェクト モデルです。このモデルは
Document
変数に格納され、[ドキュメントをデジタル化] アクティビティから取得できます。方法について詳しくは、「ドキュメントをデジタル化」をご覧ください。このフィールドではDocument
型の変数のみがサポートされています。 - ドキュメント パス - 検証するドキュメントへのパスです。このフィールドは、文字列と String 型変数のみをサポートします。
注: このプロパティ フィールドでサポートされているファイルは、
.png
、.gif
、.jpe
、.jpg
、.jpeg
、.tiff
、.tif
、.bmp
、.pdf
です。 - ドキュメント テキスト - String 型変数に格納されたドキュメント自体のテキストです。この値は、[ドキュメントをデジタル化] アクティビティから取得できます。方法について詳しくは、「ドキュメントをデジタル化」をご覧ください。このフィールドは、文字列と
String
型変数のみをサポートします。 - ドキュメント種類 ID - タクソノミー マネージャーで特定されるドキュメントの種類の ID です。このフィールドは、[分類結果] でファイルを指定している場合には、任意になります。このフィールドは、文字列と
String
型変数のみをサポートします。 - 可能な場合は値を書式化 - 値に派生部分が報告されている場合、データ抽出スコープによって上書きされないことを指定し、派生部分が含まれていない場合、データ抽出スコープが計算を試みます。オプションが False に設定されている場合、値が書式化されません。
- 自動検証の信頼度のしきい値 - 生成 AI による検証で使用する信頼度のしきい値です。このしきい値を下回る信頼度のフィールド値のみが検証されます。値が確認されると、値の信頼度はこのしきい値に設定されます。
重要:
この機能は現在のところ監査プロセスの一部であり、レビューが完了するまで FedRAMP 承認の一部と見なすべきではありません。現在レビュー中の機能の完全なリストについては、こちらをご覧ください。
- タクソノミー - ドキュメントの処理に使用するタクソノミーです。
DocumentTaxonomy
変数に格納されます。このオブジェクトは、[タクソノミーを読み込み] アクティビティで使用します。このフィールドではDocumentTaxonomy
変数のみをサポートします。
その他
- プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
出力
- 抽出結果 - データ抽出処理の抽出結果です。
ExtractionResult
変数に格納されます。注: データ抽出のページ範囲として、元のファイルの一部分のみが指定されている場合、[データ抽出スコープ] はTEMP
プロジェクト フォルダーにファイルを生成した後、それを抽出器に渡します。この一時ファイルには、ドキュメント処理のために抽出器が受け取るべきページ範囲のみが含まれます。
[データ抽出スコープ] を介してアクセスできる 抽出器を設定ウィザードを使用すると、各ドキュメントの種類およびフィールドに適用する抽出器を選択できます。
アクティビティの本体から、[抽出器を設定] を選択します。ウィザードのボタンは、少なくとも 1 つの抽出アクティビティを [データ抽出スコープ] アクティビティの本体にドラッグすると使用可能になります。このウィザードには、タクソノミーで定義されたすべてのドキュメントの種類とそれぞれのフィールドが表示され、それぞれに使用する抽出器を選択できます。
ドキュメントの種類はそれぞれ展開可能です。ウィザードで対応する各フィールドを表示して、抽出に選択できます。
R2D2
というエイリアスを割り当て、[マシン ラーニング抽出器トレーナー] で同じエイリアスを使用できます。これは抽出器のトレーニングという目的を持ち、これにより抽出器とトレーナーの間にリンクが形成されます。各抽出器は一意のエイリアスを持ちますが、トレーナーは、複数で同じエイリアスを共有できます。
この機能をサポートする抽出器の [抽出器機能を取得または更新します。] を選択して、タクソノミーのフィールドと利用可能な抽出器フィールドを簡単にマッピングし、抽出器フィールドが変更された場合には更新できます。
列の各フィールドの横にあるチェックボックスをオンにすると、[データ抽出スコープ] は、その特定のフィールドを抽出器に要求します。チェックボックスがオフの場合、[データ抽出スコープ] は、そのフィールドの値を抽出器に要求しません。
各フィールドの横にあるテキスト フィールドでは、タクソノミーで定義したフィールドを、抽出器の内部タクソノミーで定義されているフィールドとマッピングできます (存在する場合)。標準フィールドの場合は、テキスト入力に、抽出器の内部タクソノミーからターゲット フィールドの識別子を追加します。表フィールドの場合は、親の表フィールドが表レベルでマッピングされ、対応する列が個別にマッピングされます。
ウィザードの列数は、スコープ アクティビティで示される抽出器の数によって異なります。各列の名前は、それぞれの抽出器アクティビティの表示名です。
アクティビティで複数の抽出器を使用する場合、スコープ内の抽出器の順序によって優先順位が定義されます。たとえば、3 つの抽出器について考えてみましょう。[抽出器 1] が許容値 (最小信頼度レベルを上回る値) を返すと、[抽出器 2] と [抽出器 3] の実行時にこのフィールドは要求されません。この特定のフィールドに対して [抽出器 1] と [抽出器 2] が最小信頼度レベルを下回る値を返した場合、または何も返さなかった場合、[抽出器 3] からの結果が信頼度許容条件を満たせば、この結果が考慮されます。
[データ抽出スコープ] アクティビティは、Document Understanding のソリューションに含まれます。詳細については、『Document Understanding ガイド』をご覧ください。