activities
latest
false
- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Document Understanding アクティビティ
Last updated 2024年10月4日
ドキュメント分類スコープ
UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope
分類器アクティビティのスコープを提供し、ドキュメント分類の実行に必要なすべてのファイルを提供します。1つ以上の分類器、およびそれらの間のブローカーを許可し、子分類アクティビティにすべてのパラメーターが確実に転送されるようにします。
プロパティ パネル
共通
- 表示名 - アクティビティの表示名です。
入力
- DocumentObjectModel - The Document Object Model (DOM) you want to use to validate the document against. This model is stored in a
Document
variable and can be retrieved from the Digitize Document activity. Visit Digitize Document to learn how to use the activity. This field supports onlyDocument
variables. - ドキュメント パス - 検証するドキュメントへのパスです。このフィールドは、文字列と
String
型変数のみをサポートします。注: このプロパティ フィールドでサポートされているファイルは、.png
、.gif
、.jpe
、.jpg
、.jpeg
、.tiff
、.tif
、.bmp
、.pdf
です。 - DocumentText - The text of the document itself, stored in a
String
variable. You can retrieve this value from the Digitize Document activity. Visit Digitize Document to learn how to use this activity. This field supports only strings andString
variables. - タクソノミー - ドキュメントの処理に使用するタクソノミーです。
DocumentTaxonomy
変数に格納されます。このフィールドではDocumentTaxonomy
変数のみサポートされています。
その他
- プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
出力
- ClassificationResults - 指定したファイル上で分類器ファイルを実行した結果です。
IReadOnlyList<ClassificationResult>
オブジェクトに格納されます。このフィールドではIReadOnlyList<ClassificationResult>
変数のみをサポートします。
The ClassificationResult object contains the following information:
- DocumentTypeId - タクソノミーで一致したドキュメントの種類に対応する ID です。
- DocumentId - 処理されたドキュメントのファイル名です。
- ContentType - 処理されたドキュメントに含まれるコンテンツの種類です。
- Confidence - Classification confidence, displayed as a numeric value between
0
and1
. - OcrConfidence - OCR confidence for the characters that are part of the reported reference, displayed as a numeric value between
0
and1
. - 参照 - 分類の証拠となるものです。ドキュメントのテキスト版 (
TextStartIndex
とTextLength
) だけでなく、Document Object Model (Tokens
、および証拠の選択元である各ページの強調表示ボックス) にも該当します。 - DocumentBounds - ドキュメントのどの部分に対して分類が行われたのかに関する情報です。
StartPage
(Int32
、0 ベース)、PageCount
(Int32
)、TextStartIndex
(Int32
、0 ベース)、TextLength
(Int32
) を含みます。 -
ClassifierName - [ドキュメント分類スコープ] アクティビティにより自動入力されます。現在の 分類結果 をレポートする分類器の名前です。
注:ClassificationResults
のすべてのコンテンツは、信頼度の降順で並べ替えられています。すなわち、最上位のコンテンツは、信頼度が最も高いことを表します。
[分類器を設定] ウィザードを使用して、分類器を各ドキュメントの種類に適用する方法と許容される結果を設定できます。
以下の手順に従ってウィザードを設定します。
- ワークフローに [ドキュメント分類スコープ] アクティビティを追加します。
- Add one or more classifier activities inside the Classify Document Scope activity.
- Give your classifiers suggestive names.
- Order the classifiers within the scope, from left to right, in the order of acceptance priority.
- Configure your classifiers selecting Configure Classifiers.
You can now see the Wizard図 1. 分類器を設定ウィザードの概要
- Select the check boxes for the classifier and document type pairs you want to activate. Leaving a document type unchecked for a certain classifier can appear in one of the following scenarios:
- The classifier is not trained or configured to identify that particular document type
- The classifier does not perform as expected for that particular document type, and if such results are returned by the classifier, they should be ignored.
- If a classifier has its own taxonomy, then use the text boxes next to each check box to set the correct Taxonomy mapping between the two taxonomies. For example, if Classifier1 has been configured to return class
INV
for an invoice, but your project taxonomy contains a document type called "Incoming Invoice", then the box corresponding to "Incoming Invoice" and that particular Classifier1 should contain the stringINV
. - Set a Minimum Confidence threshold, from 0 to 100, for each classifier in the Classify Document Scope. Any classification result with a confidence lower than this threshold will not be stored in the Classify Document Scope activity output.
Tip: Most document types generate a prediction with a confidence level. Setting this property prevents false positives by only considering the predictions with a confidence level above the threshold. You can identify an optimal confidence level by testing various documents within your workflow, recording the results in an Excel spreadsheet, for example, and then analyze what threshold value is the most accurate. Apply the threshold by adjusting the Minimum Confidence property in your current scope.
- Select Save once all the classifiers are configured.
Figure 2. The Configure Classifiers wizard configured to use a different classifier for each document type
The Classify Document Scope activity is part of the Document Understanding solutions. Visit the Document Understanding Guide for more information.