- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
Document Understanding アクティビティ
マシン ラーニング抽出器トレーナー
UiPath.DocumentUnderstanding.ML.Activities.MachineLearningExtractorTrainer
検証ステーションで処理されたデータの集合を有効化して、Document Manager にインポートできるようにします。このアクティビティは、[抽出器トレーニング スコープ] アクティビティ内でのみ使用できます。
デザイナー パネル
ローカル ストレージ
- 出力フォルダー - 収集されたデータが保存されるディレクトリ。データが保存されたら、マシン ラーニング トレーニング ツールにインポートできます。
プロジェクトのプライベート データセットを選択
- データセット - トレーニング データをアップロードできるデータセットです。AI Center が有効化されているテナントにロボットが接続されている場合、AI Center にあるすべてのデータセットがドロップダウン メニューに表示されます。ここから検証済みドキュメントのアップロード先フォルダーを選択します。
- プロジェクト - トレーニング データをアップロードできるプロジェクトです。
注: プロジェクトとデータセットの選択は、Orchestrator に接続されている場合にのみ有効化されます。パブリック/プライベート データセットの詳細については、「データセットを管理する」をご覧ください。
パブリック データセット エンドポイントを入力
- データセット API キー - データセットの認証キーです。
- データセットのエンドポイント - トレーニング データをアップロードできるデータセットのエンドポイントです。データセットを公開すると、エンドポイントを介し API キーを使用して UiPath® の環境外からアクセスできるようになります。接続していない AI Center インスタンスにデータセットをアップロードする場合に使用します (例: AI Center が Automation Cloud 上にあり、ロボットがオンプレミスのテナントに接続されているハイブリッド デプロイの場合)。
プロパティ パネル
共通
- 表示名 - アクティビティの表示名です。
ローカル ストレージ
- 出力フォルダー - 収集されたデータが保存されるディレクトリ。データが保存されたら、マシン ラーニング トレーニング ツールにインポートできます。
その他
- プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
パブリック データセット エンドポイントを入力
- データセット API キー - データセットの認証キーです。
- データセットのエンドポイント - トレーニング データをアップロードできるデータセットのエンドポイントです。データセットを公開すると、エンドポイントを介し API キーを使用して UiPath® の環境外からアクセスできるようになります。接続していない AI Center インスタンスにデータセットをアップロードする場合に使用します (例: AI Center が Automation Cloud 上にあり、ロボットがオンプレミスのテナントに接続されているハイブリッド デプロイの場合)。
プロジェクトのプライベート データセットを選択
- データセット - トレーニング データをアップロードできるデータセットです。AI Center が有効化されているテナントにロボットが接続されている場合、AI Center にあるすべてのデータセットがドロップダウン メニューに表示されます。ここから検証済みドキュメントのアップロード先フォルダーを選択します。
-
プロジェクト - トレーニング データをアップロードできるプロジェクトです。
注: プロジェクトとデータセットの選択は、Orchestrator に接続されている場合にのみ有効化されます。パブリック/プライベート データセットの詳細については、「データセットを管理する」をご覧ください。
サーバー
- エラー発生時にリトライ - 一時的なエラー発生時にリトライします。このフィールドでは Boolean 値 ([True]、[False]) のみサポートされています。既定値は [True] です。
- タイムアウト (ミリ秒) - サーバーからの応答があるまで待機する時間をミリ秒で指定します。指定した時間が経過しても実行が完了しない場合には例外をスローします。既定値は 100000 ミリ秒 (100 秒) です。
[マシン ラーニング抽出器トレーナー] は、選択したディレクトリ内で、人間からのフィードバックを収集します。データを収集した後に ML モデルを再トレーニングするには、ディレクトリのコンテンツを圧縮して Document Manager にアップロードするだけで、データの収集やフィルター処理ができます。
[マシン ラーニング抽出器トレーナー] アクティビティを使用するには、次の手順を実行します。
- タクソノミー マネージャー ウィザードを使用して、ドキュメントの種類とフィールドを定義します。
- [マシン ラーニング抽出器トレーナー] を [抽出器トレーニング スコープ] アクティビティに追加します。
- 自動的に開く [マシン ラーニング抽出器] ウィザードで、[エンドポイント] フィールドに情報を入力します。いずれかのパブリック エンドポイントを選択できます。パブリック エンドポイントについて詳しくは、「パブリック エンドポイント」をご覧ください。
- 入力した値をアクティビティ (より正確にはエンドポイント) の入力引数としても使用する場合は、[アクティビティの引数を更新] チェックボックスをオンにします。
- [機能を取得] を選択します。
この操作の後、ウィザードが閉じます。
- [出力フォルダー] の値を入力します。
- [抽出器トレーニング スコープ] の [抽出器を設定] オプションを選択します。
ウィザードが表示されます。
図 1. [抽出器を設定] ウィザード
- これで、[マシン ラーニング抽出器トレーナー] を設定できるようになりました。適用先ドキュメントの種類を展開し、該当するフィールドの横のチェックボックスをオンにして、トレーニングするフィールドの選択を開始します。
- テキストボックスに手動で入力するか、表示されるドロップダウン リストから各フィールドにマッピングする適切なデータを選択します。ドロップダウン リストには、[マシン ラーニング抽出器トレーナー] が、[マシン ラーニング抽出器] ウィザードで入力されたエンドポイントを使用し、抽出機能として宣言した、すべてのフィールドが含まれます。
注: チェックボックスはオンにしてもテキストボックスは空のままにしておいた場合、テキストボックスにはローカルのタクソノミーのドキュメントの種類の ID が自動的に入力されます。変更は、保存後に適用されます。抽出器の内部タクソノミーへのアクセス権がない場合に、フィールド ID に長い文字列を使用したくない場合は、値を手動で入力することをお勧めします。
- 抽出器の最新機能を使用しているかどうかを確認するには、[抽出器機能を取得または更新] を選択して、[マシン ラーニング抽出器] ウィザードを開きます。
- ドロップダウン リストのオプションの 1 つを選択すると、そのフィールドが自動的に確認されます。
- 抽出結果に基づいて抽出器をトレーニングするには、抽出器として以前使用した [フレームワーク エイリアス] フィールドに、正確な英数字の値を設定します。
- すべてのフィールドを適切に設定したら、[保存] を選択します。
重要: 2 つの異なるフィールドに対して同じオプションを選択することはできません。
Document Understanding との連携
[マシン ラーニング抽出器トレーナー] アクティビティは、Document Understanding のソリューションに含まれます。詳細については、『Document Understanding ガイド』をご覧ください。