- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- Document Manager
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
ドキュメントをエクスポートする
[ファイルをエクスポート] ダイアログ ボックスを使用すれば、ML モデルのトレーニング用にデータを簡単にエクスポートできます。
管理バーの [エクスポート] ボタン をクリックします。
このダイアログ ボックスには 3 つのタブがあります。
[今すぐエクスポート] タブでは、以下を実行できます。
- Excel にダウンロード - データを Excel 形式でローカルにダウンロードします。
- ダウンロード - データをローカルにダウンロードします。
- AI Center にエクスポート - データを AI Center にエクスポートします。データがエクスポートされるフォルダーは、AI Center 内の export フォルダー ([データセット] > データセット名 > [export]) にあります。
注: [スキーマ] または [後方互換性のあるエクスポート] オプションを選択している場合は、[Excel にダウンロード] 機能を使用できません。
スキーマが定義されていない場合は、すべてのエクスポート オプションが無効化されて表示されます。
スキーマが定義されている場合は、エクスポート名の入力は必須です。入力しないと、[ダウンロード] ボタンと [エクスポート] ボタンが無効化されて表示されます。有効な名前は最大 24 文字で、特殊文字を含めることはできません。
スキーマに複数値フィールドが含まれている場合でも、スキーマをエクスポートまたはダウンロードできます。
以下のいずれかのオプションを選択してエクスポートできます。
- 現在の検索結果 - 事前定義されたキーワード/名前付きバッチまたはテキスト クエリによってフィルター処理された、ラベル付け済みドキュメントです。フィルターを適用しないと、現在のビューのラベル付け済みドキュメントがすべてエクスポートされます。
- ラベル付けされたデータすべて - ラベル付けされた、あらゆる種類のフィールドを 1 つ以上持つすべてのドキュメントです。より正確には、ラベル付けされたフィルターで処理されたドキュメントです。
- スキーマ - フィールドとその設定を含む zip ファイルです。別の Document Manager セッションにインポートできます。
- すべて - ラベルが適用されているかどうかに関係なく、すべてのドキュメントをエクスポートします。
[後方互換性のあるエクスポート] チェックボックスをオンにすると、従来のエクスポートの挙動を適用して、各ページを個別のドキュメントとしてエクスポートできます。既定のエクスポートでトレーニングしたモデルの評価結果が期待値より低い場合は、この機能をお試しください。ドキュメントを元の複数ページの形式でエクスポートする場合は、このチェックボックスをオフのままにします。
Document Manager の v2021.10 リリースでは、複数ページのドキュメントのラベル付けがサポートされており、各ページが個別にラベル付けされていた以前のリリースとは大幅に変更されています。複数ページのドキュメントのラベル付けおよびエクスポートを行う際は、各ドキュメントが 1 つの論理的なドキュメントであることを前提としています。たとえば、6 ページのドキュメントに 6 ページの請求書が 1 つ含まれていても問題はありませんが、2 ページずつの異なる請求書が 3 つ含まれていてはいけません。これは、評価セットの場合に特に重要です。
この要件は、後方互換性のあるエクスポートの場合は関係ありません。
データセットをエクスポートするには、10 個以上の異なるドキュメント内ですべてのフィールドがラベル付けされている必要があります。ラベル付けがされていないとエクスポートが失敗し、以下のメッセージが表示されます。
分類フィールドに関しては、各オプションが 1 つ以上のドキュメントでラベル付けされている必要もあります。ラベル付けがされていないとエクスポートが失敗し、以下のメッセージが表示されます。
評価セット データのみをエクスポートする場合は、すべての検証が無効化されます。