activities
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Document Understanding アクティビティ
Last updated 2024年10月4日

ドキュメント分類スコープ

UiPath.IntelligentOCR.Activities.DocumentClassification.ClassifyDocumentScope

説明

分類器アクティビティのスコープを提供し、ドキュメント分類の実行に必要なすべてのファイルを提供します。1つ以上の分類器、およびそれらの間のブローカーを許可し、子分類アクティビティにすべてのパラメーターが確実に転送されるようにします。

プロジェクトの対応 OS

Windows - レガシ | Windows

構成

プロパティ パネル

共通
  • 表示名 - アクティビティの表示名です。
入力
  • DocumentObjectModel - The Document Object Model (DOM) you want to use to validate the document against. This model is stored in a Document variable and can be retrieved from the Digitize Document activity. Visit Digitize Document to learn how to use the activity. This field supports only Document variables.
  • ドキュメント パス - 検証するドキュメントへのパスです。このフィールドは、文字列と String 型変数のみをサポートします。
    注: このプロパティ フィールドでサポートされているファイルは、.png.gif.jpe.jpg.jpeg.tiff.tif.bmp.pdfです。
  • DocumentText - The text of the document itself, stored in a String variable. You can retrieve this value from the Digitize Document activity. Visit Digitize Document to learn how to use this activity. This field supports only strings and String variables.
  • タクソノミー - ドキュメントの処理に使用するタクソノミーです。DocumentTaxonomy 変数に格納されます。このフィールドでは DocumentTaxonomy 変数のみサポートされています。
その他
  • プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
出力
  • ClassificationResults - 指定したファイル上で分類器ファイルを実行した結果です。IReadOnlyList<ClassificationResult> オブジェクトに格納されます。このフィールドでは IReadOnlyList<ClassificationResult> 変数のみをサポートします。

The ClassificationResult object contains the following information:

  • DocumentTypeId - タクソノミーで一致したドキュメントの種類に対応する ID です。
  • DocumentId - 処理されたドキュメントのファイル名です。
  • ContentType - 処理されたドキュメントに含まれるコンテンツの種類です。
  • Confidence - Classification confidence, displayed as a numeric value between 0 and 1.
  • OcrConfidence - OCR confidence for the characters that are part of the reported reference, displayed as a numeric value between 0 and 1.
  • 参照 - 分類の証拠となるものです。ドキュメントのテキスト版 (TextStartIndexTextLength) だけでなく、Document Object Model (Tokens、および証拠の選択元である各ページの強調表示ボックス) にも該当します。
  • DocumentBounds - ドキュメントのどの部分に対して分類が行われたのかに関する情報です。StartPage (Int32、0 ベース)、PageCount (Int32)、TextStartIndex (Int32、0 ベース)、TextLength (Int32) を含みます。
  • ClassifierName - [ドキュメント分類スコープ] アクティビティにより自動入力されます。現在の 分類結果 をレポートする分類器の名前です。

    注: ClassificationResults のすべてのコンテンツは、信頼度の降順で並べ替えられています。すなわち、最上位のコンテンツは、信頼度が最も高いことを表します。

分類器を設定ウィザードを使用する

[分類器を設定] ウィザードを使用して、分類器を各ドキュメントの種類に適用する方法と許容される結果を設定できます。

以下の手順に従ってウィザードを設定します。

  1. ワークフローに [ドキュメント分類スコープ] アクティビティを追加します。
  2. Add one or more classifier activities inside the Classify Document Scope activity.
    1. Give your classifiers suggestive names.
    2. Order the classifiers within the scope, from left to right, in the order of acceptance priority.
    3. Configure your classifiers selecting Configure Classifiers.
      You can now see the Wizard
      図 1. 分類器を設定ウィザードの概要

  3. Select the check boxes for the classifier and document type pairs you want to activate. Leaving a document type unchecked for a certain classifier can appear in one of the following scenarios:
    • The classifier is not trained or configured to identify that particular document type
    • The classifier does not perform as expected for that particular document type, and if such results are returned by the classifier, they should be ignored.
  4. If a classifier has its own taxonomy, then use the text boxes next to each check box to set the correct Taxonomy mapping between the two taxonomies. For example, if Classifier1 has been configured to return class INV for an invoice, but your project taxonomy contains a document type called "Incoming Invoice", then the box corresponding to "Incoming Invoice" and that particular Classifier1 should contain the string INV.
  5. Set a Minimum Confidence threshold, from 0 to 100, for each classifier in the Classify Document Scope. Any classification result with a confidence lower than this threshold will not be stored in the Classify Document Scope activity output.
    Tip: Most document types generate a prediction with a confidence level. Setting this property prevents false positives by only considering the predictions with a confidence level above the threshold. You can identify an optimal confidence level by testing various documents within your workflow, recording the results in an Excel spreadsheet, for example, and then analyze what threshold value is the most accurate. Apply the threshold by adjusting the Minimum Confidence property in your current scope.
  6. Select Save once all the classifiers are configured.
    Figure 2. The Configure Classifiers wizard configured to use a different classifier for each document type

Document Understanding との連携

The Classify Document Scope activity is part of the Document Understanding solutions. Visit the Document Understanding Guide for more information.

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.