通知を受け取る

UiPath Document Understanding

UiPath Document Understanding

ドキュメントをエクスポートする

[ファイルをエクスポート] ダイアログ ボックスを使用すれば、ML モデルのトレーニング用にデータを簡単にエクスポートできます。

管理バーの [エクスポート] ボタン exportexport をクリックします。

このダイアログ ボックスには 3 つのタブがあります。

554554

今すぐエクスポート

[今すぐエクスポート] タブでは、以下を実行できます。

  • Download to Excel - Download the data locally in an Excel format.
  • Download - Download the data locally.
  • Export to AI Center - Export the data to AI Center. The exported folders can be found in AI Center under the export folder (Datasets > dataset_name > export).

📘

注:

The Download to Excel function cannot be used if Schema or Backwards-compatible export options are selected.

スキーマが定義されていない場合は、すべてのエクスポート オプションが無効化されて表示されます。

555555

スキーマが定義されている場合は、エクスポート名の入力は必須です。入力しないと、[ダウンロード] ボタンと [エクスポート] ボタンが無効化されて表示されます。有効な名前は最大 24 文字で、特殊文字を含めることはできません。
You can export or download a schema even if it includes multivalued fields.

以下のいずれかのオプションを選択してエクスポートできます。

  • 現在の検索結果 - 事前定義されたキーワード/名前付きバッチまたはテキスト クエリによってフィルター処理された、ラベル付け済みドキュメントです。フィルターを適用しないと、現在のビューのラベル付け済みドキュメントがすべてエクスポートされます。
  • ラベル付けされたデータすべて - ラベル付けされた、あらゆる種類のフィールドを 1 つ以上持つすべてのドキュメントです。より正確には、ラベル付けされたフィルターで処理されたドキュメントです。
  • スキーマ - フィールドとその設定を含む zip ファイルです。別の Document Manager セッションにインポートできます。
  • All - exports all documents, no matter if labels are applied or not.

[後方互換性のあるエクスポート] チェックボックスをオンにすると、従来のエクスポートの挙動を適用して、各ページを個別のドキュメントとしてエクスポートできます。既定のエクスポートでトレーニングしたモデルの評価結果が期待値より低い場合は、この機能をお試しください。ドキュメントを元の複数ページの形式でエクスポートする場合は、このチェックボックスをオフのままにします。

❗️

重要

Document Manager の v2021.10 リリースでは、複数ページのドキュメントのラベル付けがサポートされており、各ページが個別にラベル付けされていた以前のリリースとは大幅に異なります。複数ページのドキュメントのラベル付けおよびエクスポートを行う際は、各ドキュメントが 1 つの論理的なドキュメントであることを前提としています。たとえば、6 ページのドキュメントに 6 ページの請求書が 1 つ含まれていても問題はありませんが、2 ページずつの異なる請求書が 3 つ含まれていてはいけません。これは、評価セットの場合に特に重要です。

この要件は、 後方互換性のあるエクスポートの場合は関係ありません。

エクスポート時の検証


データセットをエクスポートするには、10 個以上の異なるドキュメント内ですべてのフィールドがラベル付けされている必要があります。ラベル付けがされていないとエクスポートが失敗し、以下のメッセージが表示されます。

472472 472472

分類フィールドに関しては、各オプションが 1 つ以上のドキュメントでラベル付けされている必要もあります。ラベル付けがされていないとエクスポートが失敗し、以下のメッセージが表示されます。

589589

評価セット データのみをエクスポートする場合は、すべての検証が無効化されます。

データセット フォーマット


Document Manager からエクスポートしたデータセットを含むフォルダーです。以下が含まれます。

  • schema.json: 抽出するフィールドとその種類を含むファイルです。
  • split.csv: トレーニング パイプラインの実行時に TRAIN または VALIDATE のいずれかで使用される、ドキュメントごとの分割を含むファイルです。
  • images: ラベル付けされたすべてのページの画像を含むフォルダーです。
  • latest: 各ページからのラベル付け済みデータを含む .json ファイルが格納されているフォルダーです。
14161416

スケジュール Public Preview

The Schedule Export feature is documented here.

ログ

[ログ] タブに、エクスポートに関する最新のログが表示されます。

エクスポートに成功すると、処理されたドキュメントの数とエクスポートにかかった時間がログに表示されます。

879879

スキーマのエクスポートに成功すると、エクスポートにかかった時間がログに表示されます。

792792

ファイルのエクスポート時には、エクスポートのステータスを確認できます。これは、大規模なエクスポートの場合に特に役立ちます。

879879

ログには、以下に示すようにエラー メッセージも表示されます。

879879

自動再トレーニングが成功すると、データセットの fine-tune フォルダーからのインポート ログも表示されます。

879879

約 1 か月前に更新


ドキュメントをエクスポートする


改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。