UiPath Documentation
document-understanding
2024.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding ガイド

最終更新日時 2026年4月6日

ドキュメントをインポートする

[データをインポート] ダイアログ ボックスを使用すると、ラベル付けするまたは変更する新しいドキュメントを簡単にインポートできます。

Select the Import button インポートのアイコン from the management bar.

ダイアログ ボックスには、次のコントロールが含まれます。

  • [バッチ名] テキスト フィールド - エクスポート名の入力は必須です。入力しないと、[ファイルを参照またはドロップ] セクションが無効化されて表示されます。有効な名前は最大 24 文字で、特殊文字を含めることはできません。

  • [これを評価セットにする] チェックボックス - オンにすると、そのデータセットは評価目的で使用されます。

  • Browse or drop files section - select Browse files to upload to navigate through your directory or simply drag and drop the files inside the frame.

  • Status section - select (load previous import log) to check to check the status of the latest import; when uploading data, in the Status section you receive an overview of your files and you are prompted to proceed with the import by selecting YES or abort the import by selecting CANCEL.

    [データをインポート] インターフェイスのスクリーンショット

インポートの種類

Document Manager でサポートされているインポートは次の 4 種類です。

  • スキーマのインポート
  • Raw documents import (max 2000 pages and 4000 MiB per import)
  • Document Manager dataset import (4000 MiB per import)
  • Validation Station dataset import (max 2000 pages and 4000 MiB per import)

スキーマのインポート

既存のセッションと同じスキーマを使用して新しい Document Manager セッションを起動する場合は、次の手順を実行します。

  1. Select the Export button from the management bar.
  2. [ファイルをエクスポート] ダイアログ ボックスで、[スキーマ] オプションのチェックボックスをオンにします。
  3. Select the Export button inside the dialog box. A .zip file is exported.
  4. Select the Import button from the management bar.
  5. Upload or drag & drop the .zip file directly into the new Document Manager session (do not unzip). In this step, you can also upload a predefined schema.
  6. Select YES in the Status section to proceed with the import. The schema is imported.

スキーマのインポートは複数値フィールドにも対応します。

重要:

複数値フィールドは v2022.10 以降のモデルにのみ対応している点にご留意ください。

未加工ドキュメントのインポート

ラベル付け用にインポートできるドキュメントの種類は .pdf.tiff.png.jpg です。

.zip ファイルは、未加工ドキュメントのインポートではサポートされていません。

インポートを行う前に OCR の設定を行う必要があります。

  1. Select the Import button インポートのアイコン. The Import data dialog box is displayed.
  2. [バッチ名] フィールドにバッチ名を入力します。これにより、後から [検索] ドロップダウンを使用して、これらのドキュメントを簡単にフィルター処理して見つけることができます。
    • このドキュメント バッチを ML モデルのトレーニングに使用する場合は、[これを評価セットにする] チェックボックスをオフのままにします。
    • このドキュメント バッチを ML モデルの評価 (例: パフォーマンスの測定) に使用する場合は、[これを評価セットにする] チェックボックスをオンにします。これにより、データがトレーニング パイプラインにより無視されるようになります。
  3. [ファイルを参照またはドロップ] セクションに、1 つのファイルまたはファイルのセットをアップロードするか、ドラッグ アンド ドロップします。
  4. Select YES. The file or set of files are imported.

Document Manager のデータセットのインポート

別の Document Manager セッションで以前にラベル付けされたデータセットをインポートするには、最初にエクスポートされた .zip ファイルを取得し、新しい Document Manager インスタンスに直接インポートする必要があります。

新しい Document Manager インスタンスが完全に空の場合 (データがなく、フィールドが定義されていない)、ラベル付けされたドキュメントとスキーマの両方がインポートされます。

新しい Data Manager インスタンスで既にフィールドが定義されている場合は、新しくインポートするデータセットにも同じフィールドか、それらのフィールドのサブセットが含まれている必要があります。そうでない場合、インポートは拒否されます。

Automation Cloud™ 環境からデータベースをエクスポートした後、オンプレミスのデプロイにインポートする場合は、以下の手順を実行する必要があります。

  1. データセット ファイルを展開します。
  2. アーカイブの scheman.json ファイルを編集します。
  3. json ファイルからすべての display_name プロパティを削除し、保存します。
  4. データセットを圧縮し、オンプレミス セッションにインポートします。
サイズの大きいデータセットを分割する

To import Document Manager datasets larger than 1GB or that have more than 1500 files, we recommend you to use this script which splits the .zip files into multiple .zip files that are smaller than 1GB and that have less than 1500 files.

検証ステーションのデータセットのインポート

As your RPA workflow processes documents using an existing ML model, some documents may require human validation using the Validation Station activity (available on attended bots or in the browser using Orchestrator Action Center).

The validated data generated in Validation Station can be exported using Machine Learning Extractor Trainer activity and can be used to train ML models.

注:

検証ステーションのデータセットのインポートでは、スキーマを定義する必要があります。

  1. [マシン ラーニング抽出器トレーナー] アクティビティのデータの出力先を <Trainer/Output/Folder> というパス (任意の空のフォルダー パスを使用) のフォルダーに設定します。
  2. [検証ステーションを提示] アクティビティと [マシン ラーニング抽出器トレーナー] アクティビティを含む RPA ワークフローを実行します。
  3. [マシン ラーニング抽出器トレーナー] アクティビティは、出力フォルダー内にドキュメント、メタデータ、予測の 3 つのサブフォルダーを作成します。
  4. <Trainer/Output/Folder> を圧縮して、.zip ファイルを取得します (例: TrainerOutputFolder.zip)。
  5. .zip ファイルを Document Manager にインポートします。Document Manager は、インポートされたファイルに [マシン ラーニング抽出器トレーナー] アクティビティによって作成されたデータが含まれていることを検出し、それに応じてデータをインポートします。

データセットで必要なフィールドが見つからない場合は、インポート ダイアログ ボックスにエラー メッセージが表示されます。

[データをインポート] インターフェイスのスクリーンショット

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得