- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ContentValidationData クラス
- EvaluatedBusinessRulesForFieldValue クラス
- EvaluatedBusinessRuleDetails クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- FieldValue クラス
- FieldValueResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- ルール クラス
- RuleResult クラス
- RuleSet クラス
- RuleSetResult クラス
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- FieldValueDetails クラス
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- BasicDataPoint クラス - プレビュー
- ExtractionResultHandler クラス - プレビュー
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント検証成果物を作成
- ドキュメント検証成果物を取得
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- Document Understanding プロジェクト抽出器トレーナー
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- ドキュメントを墨消し
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- マシン ラーニング抽出器
- マシン ラーニング抽出器トレーナー
- マシン ラーニング分類器
- マシン ラーニング分類器トレーナー
- 生成 AI 分類器
- 生成 AI 抽出器
- 認証を構成する
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded

Document Understanding アクティビティ
インテリジェント キーワード分類器
UiPath.IntelligentOCR.Activities.DocumentClassification.IntelligentKeywordClassifier
説明
This activity enables any user to classify and split document packages into individual document types. You can only use it together with the Classify Document Scope activity.
プロジェクトの対応 OS
Windows - レガシ | Windows
構成
デザイナー パネル
-
ラーニング ファイルのパス - 分類器データを含むファイルへのフル パスです。このフィールドは、文字列と
String型の変数のみをサポートします。注:一度に設定できるのは、上記のパラメーターのうち 1 つだけです。[ラーニング データ] 文字列または [ラーニング ファイルのパス] 文字列のいずれかを使用できます。
[ラーニング ファイルのパス] は分類器データを取得する場所から場所を指定します。
[ラーニング データ] は、その分類器の実際の情報が含まれています。
-
Endpoint - The URL to UiPath® server. By default, the endpoint is
https://du.uipath.com/svc/intelligentkeywords. For more information about endpoints, visit Document Understanding Public Endpoints. -
API キー - アカウントの API キーを指定します。ローカルのプロジェクト設定または Document Understanding フレームワークで定義されている場合、[API キー] フィールドは自動的に事前入力されます。
プロパティ パネル
共通
- 表示名 - アクティビティの表示名です。
入力
-
API キー - アカウントの API キーを指定します。ローカルのプロジェクト設定または Document Understanding フレームワークで定義されている場合、[API キー] フィールドは自動的に事前入力されます。
-
Endpoint - The URL to UiPath® server. By default, the endpoint is
https://du.uipath.com/svc/intelligentkeywords. For more information about endpoints, visit Document Understanding Public Endpoints. -
ラーニング データ - シリアル化された分類器のデータを含む文字列です。このフィールドは、文字列と
String型の変数のみをサポートします。 -
ラーニング ファイルのパス - 分類器データを含むファイルへのフル パスです。このフィールドは、文字列と
String型の変数のみをサポートします。注:一度に設定できるのは、上記のパラメーターのうち 1 つだけです。[ラーニング データ] 文字列または [ラーニング ファイルのパス] 文字列のいずれかを使用できます。
[ラーニング ファイルのパス] は分類器データを取得する場所から場所を指定します。
[ラーニング データ] は、その分類器の実際の情報が含まれています。
-
Send documents - When enabled, it allows UiPath® to save the referenced document to improve the algorithm performance. Disabling this feature prevents UiPath® from storing the documents. Regardless of this setting, the algorithm's operation remains unaffected.
その他
- プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
注:
ベスト プラクティスは、その場所に空の
.jsonファイルを作成し、その名前を [ラーニング ファイルのパス] フィールドに使用することです。
分割
- PerformDocumentSplitting - If left unchecked, the model will not perform document splitting, only classification.
- UsePageNumbers - If checked, the mode will use the page numbers feature to decide where to split documents. Use it in case page numbers might improve splitting results.
For optimized splitting performance, use version 6.9.0 or higher.
[学習を管理] ウィザードの使用
[学習を管理] ウィザードにアクセスして、[インテリジェント キーワード分類器] アクティビティを設定します。このウィザードは、ドキュメント分類トレーニング フェーズで収集されたデータをレビューする際にも使用できます。それには、更新されたラーニング ファイルのパスでウィザードを開きます。
このウィザードを使用すると、[インテリジェント キーワード分類器] アクティビティでドキュメントの種類を識別しドキュメントを分類するために使用されるトレーニング データを設定および管理できます。ファイル パスを編集する必要性に合わせて作成されました。代わりに変数付きのラーニング データ オプションが使用される場合、特定のファイル パスを編集するか、この操作を中止するかを確認されます。
[学習を管理] ウィザードは、アクティビティをラーニング ファイルのパス文字列で設定した場合にのみ機能します。変数入力として設定されたラーニング ファイルのパスや、ラーニング データ文字列入力では動作しません。
-
Add an Intelligent Keyword Classifier or Intelligent Keyword Classifier Trainer activity to your workflow.
-
Configure your Intelligent Keyword Classifier activity by adding the path of a
.jsonfile. Take the following information into consideration, when configuring the classifier:- If no path is provided and the Manage Learning option is selected, then a pop-up is displayed, asking for a Learning File Path input. Once the path is provided, the wizard opens.
.jsonファイルではなく変数を追加できますが、ウィザードが LearningData 変数に学習パターンを適用することはできないため、編集できる特定のファイルのパスを要求します。
-
Select Manage Learning.
The Intelligent Keyword Classifier wizard window opens.
Figure 1. Overview of the Manage Learning section of the Intelligent Keyword Classifier wizard
![インテリジェント キーワード分類器ウィザードの [学習を管理] セクションの概要](https://dev-assets.cms.uipath.com/assets/images/activities/document-understanding-overview-of-the-manage-learning-section-of-the-intelligent-keyword-classifie-3ff6da52-db8bd8f4.webp)
-
If no path is provided and the Manage Learning option is selected, then a pop-up is displayed, asking for a LearningFilePath. Once the path is provided, the wizard opens.
Figure 2. The Warning pop-up displayed if no path is provided and the Manage Learning option is selected
注:.jsonファイルが使用できない場合でも、新しい.jsonファイルの名前をアクティビティに直接追加することができ、.jsonファイルが、指定されたフォルダー内に自動的に作成されます。
In the Manage Learning wizard you can see if a document type has been trained or not by the following labels displayed next to them: Trained on X files, or Start Training. The following screenshot shows a document type that has been trained, one that hasn't, and one that has been trained, and selected, so it can be viewed or deleted.
Figure 3. Document types and their training status within the Manage Learning section of the Intelligent Keyword Classifier
![インテリジェント キーワード分類器の [学習を管理] セクション内に表示されるドキュメントの種類とそのトレーニング ステータス](https://dev-assets.cms.uipath.com/assets/images/activities/document-understanding-document-types-and-their-training-status-within-the-manage-learning-section--437f7d19-79bce1c5.webp)
トレーニング データ
For document types that have not been trained yet, design-time training can be performed using the Start Training option. For document types that already have some training, you can either delete it to start over, by using the
remove option, or perform extra training (cumulative to the already existing one) using the edit
option.
Training files to be used must contain a single document type instance per file. Do not run design-time training on files that contain two or more document types, as your training data will be erroneous.
Once a new training has been initiated, a new screen is displayed asking for the training files and the OCR engine that should be used. The default OCR engine is UiPath® Document OCR. Each OCR engine comes with its own set of custom options.
Figure 4. The wizard that appears after selecting Start Training option
![[トレーニングを開始] オプションを選択した後に表示されるウィザード](https://dev-assets.cms.uipath.com/assets/images/activities/document-understanding-the-wizard-that-appears-after-selecting-start-training-option-178876-f7bdff4e-fd3d1fe2.gif)
以下の OCR エンジンは、回転されたドキュメントをサポートしていないため、そうしたドキュメントの処理には使用しないでください。
- Microsoft OCR
- Tesseract OCR
The Apply OCR on PDF option establishes if the OCR process should be applied or not to PDF documents. Three options are available in the dropdown list:
- True: If set to True, the OCR is applied to all PDF pages of the document.
- False: If set to False, only digitally typed text is extracted.
- Auto: The default value is Auto, determining if the document requires to apply the OCR algorithm depending on the input document.
If the UiPath.IntelligentOCR.Activities package has been updated to v5.1.0, then the ForceApplyOCR parameter has been replaced with the ApplyOcrOnPDF. Here is the compatibility between the old and new parameters:
- ForceApplyOCR = True is replaced by ApplyOcrOnPDF = Yes
- ForceApplyOCR = False is replaced by ApplyOcrOnPDF = Auto
- ForceApplyOCR = empty is replaced by ApplyOcrOnPDF = Auto
- ForceApplyOCR = Your defined variable is replaced by ApplyOcrOnPDF = Auto
トレーニング データをエクスポートする
トレーニング済みのドキュメントの種類から得られたトレーニング データだけをエクスポートすることができます。未トレーニングのドキュメントの種類は選択できません。
Figure 5. Document types in the Intelligent Keyword Classifier which have not been trained, hence the Export option is not available
![トレーニングされていないために [エクスポート] オプションが利用できない、インテリジェント キーワード分類器のドキュメントの種類](https://dev-assets.cms.uipath.com/assets/images/activities/document-understanding-document-types-in-the-intelligent-keyword-classifier-which-have-not-been-train-1e6ad8de-1bc04612.gif)
次の手順に従って、トレーニング データをエクスポートできます。
-
トレーニング済みのドキュメントの種類を選択します。
-
[エクスポート] を選択します。
If you have unsaved changes, the following message is displayed: "You cannot export while having unsaved changes. Do you want to automatically save before expoerting?". Select Yes to continue the exporting process.
Figure 6. The Save changes message that shows if you have any unsaved changes before exporting training data

-
トレーニング データのアーカイブを希望の名前で保存します。
エクスポートされたドキュメントの種類のトレーニング データ セットの数を示すメッセージが表示されます。たとえば、「4 個の単語ベクトルをエクスポートしました。」と表示されます。
Figure 7. Example of the message that displays how many document type training data sets were exported

-
Select OK to return to the main screen of the wizard.
トレーニング データをインポートする
次の手順に従って、トレーニング データをインポートできます。
-
[インポート] を選択します。
-
Select the training data archive and then select Open.
-
必要なドキュメントの種類を選択します。
Figure 8. Selected document types in the Import Word Vectors section
![[単語ベクトルをインポート] セクションで選択されたドキュメントの種類](https://dev-assets.cms.uipath.com/assets/images/activities/document-understanding-selected-document-types-in-the-import-word-vectors-section-178384-28873c85-09030f4a.webp)
-
[インポート] を選択します。
トレーニング データがインポートされます。
Figure 9. The previously selected document types for importing are displayed in the Manage Learning section
![以前にインポート対象として選択したドキュメントの種類が [学習を管理] セクションに表示された状態](https://dev-assets.cms.uipath.com/assets/images/activities/document-understanding-the-previously-selected-document-types-for-importing-are-displayed-in-the-ma-4074ad20-3d16871a.webp)
以下の表は、トレーニング データのインポート時にインポートの種類に基づいて表示されるメッセージについて説明しています。
Table 1. The messages that are displayed for various import types
| 表示されるメッセージ | |
|---|---|
| 新しいドキュメントの種類と単語ベクトル | このドキュメントの種類は、タクソノミーに追加されます。 |
| 新しい単語ベクトル (いずれも定義されたことがないもの) | メッセージは表示されません。 |
| 同一のドキュメントの種類と単語ベクトル | このドキュメントの種類の単語ベクトルは上書きされます。 |
Document Understanding との連携
The Intelligent Keyword Classifier activity is part of the Document Understanding solutions. Visit the Document Understanding Guide for more information.