UiPath Documentation
document-understanding
2024.10
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding modern projects user guide

最終更新日時 2026年4月6日

クラシック プロジェクトを移行する

AI Center に基づくプロジェクトを移行するには、このページの手順を使用します。プロジェクトの移行には、次の 2 つの主要な手順があります。

  1. AI Center に基づくプロジェクトからデータセットをエクスポートする
  2. エクスポートしたデータセットをモダン プロジェクトにインポートします。

現在の制限事項

  • 現在、3,000 ページを超えるデータセットのインポートはサポートされていません。最初の 3,000 ページのみが正常にインポートされ、それ以降のページはインポートに失敗します。たとえば、データセットが 2,999 ページで構成されている場合に、4 ページのドキュメントをインポートしようとすると、このプロセスは成功しません。
  • バッチ名および対応するバッチ結果は、現在は利用できません。データがバッチに編成されている場合、バッチ結果の情報はまだ表示されません。ただし、情報は保存されています。
  • AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。

AI Center に基づくプロジェクトからデータセットをエクスポートする

  1. Open AI Center and navigate to the Data Labeling page.

  2. Select the Data Labeling Session you want to migrate.

    [データのラベル付けアプリを新規作成] インターフェイスのスクリーンショット

  3. Once Document Manager is open, from the Filter documents drop-down list, select Training and validation set.

    Figure 1. Training and validation set

    [フィルター] フィールドのスクリーンショット

  4. [エクスポート] を選択します。

  5. Leave Current search results selected and fill in a name for your export job.

  6. [Download] を選択します。

    Figure 2. Download export

    [ファイルをエクスポート] インターフェイスのスクリーンショット

データセットをインポートする

  1. データのインポート先のプロジェクトに移動して、プロジェクトを開きます。

  2. Select Add document type and create a new custom document type.

    Figure 3. Add document type

    [ドキュメントの種類を追加] インターフェイスのスクリーンショット

  3. On the new custom document type, select Upload and choose the zip file of the classic project you exported. Wait for the upload to finish.

    注:

    AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。

    Figure 4. Upload processing

    アップロード処理の読み込みインターフェイスのスクリーンショット

アップロードが完了したら、ドキュメントをトレーニングで利用できます。

モデルのトレーニング

Once the dataset is imported, the model training starts. After the training is complete, the model score is displayed. To check detailed model scores, select the score, and then Detailed model scores.

[モデルの評価] インターフェイスのスクリーンショット

This action takes you to the Measure page where you can access detailed model metrics.

同じデータセットを使用して ML を 2 回トレーニングすると、モデルのメトリックがわずかに異なることに気付く場合があります。これは、以下のようないくつかの理由で発生する可能性があります。

  • Initialization: Machine learning uses optimization methods that need initial guesses to trigger the optimization algorithms. Different initial guesses during each training could lead to various outcomes due to the unpredictable nature of these algorithms.
  • Random state: Some algorithms use randomness in their operations. For instance, when training a neural network, procedures like stochastic gradient descent and mini-batch gradient descent introduce randomness. Therefore, even with identical initial model parameters and datasets, the performance of models may vary in different runs.
  • Regularization: Certain algorithms include a penalty term that encourages the model to maintain smaller weights. Due to the randomness involved, the model could operate with a different weight set each time.

ただし、このようにわずかな違いがあっても、必ずしもあるモデルに他のモデルと比べて優劣があることを意味するわけではないことに注意することが重要です。メトリックがわずかに異なっていても、非常に大きな違いでない限り、モデルがデータを理解する能力に基本的に変わりはありません。さらに、このプロセスを何度も繰り返して平均を取ると、同様のパフォーマンス メトリックが得られるはずです。

ドキュメントの種類マネージャーでベース モデルを変更する

クラシック プロジェクトとモダン プロジェクトのモデルの結果に大きな違いがある場合は、ベース モデルの違いが原因である可能性があります。ベース モデルを変更するには、次の手順に進みます。

  1. Select the three-dot menu from your custom document type and choose Document type manager.

    [ドキュメントの種類マネージャー] ボタンのスクリーンショット

  2. Navigate to the Settings tab.

  3. Select the desired model from the Base model drop-down list.

    [ベース モデル] ドロップダウン リストのスクリーンショット

  4. After making your selection, select Save. To exit, select Back.

エクスポートの種類

For classic projects, there are various methods for exporting data. Not all types of exported data are compatible for importing into modern projects. To compare the model results across both project types,filter documents by Training and validation set and select Choose search results to export the dataset. For more information on each option, check the following table.

Table 1. Types of export
エクスポートの種類 エクスポートされるデータ インポートしたデータのこの後の流れ
現在の検索結果 Exports the current filtered dataset. Use it together with the Training and validation set filter. Documents tagged as training are used to train the model. Documents tagged as validation are used to measure the model performance. Tip: To compare model results between two project types, always export and import the dataset as Train and validation .
ラベル付けされたデータすべて すべてのアノテーション済みのドキュメントをデータセットからエクスポートします。
  • トレーニング セット
  • 検証セット
  • 評価セット
  • Documents tagged as training are used to train the model.
  • Documents tagged as validation are used to measure the model performance.
  • Documents tagged as evaluation are ignored.
スキーマ フィールドのリストと、そのそれぞれの設定をエクスポートします。 スキーマが存在しない場合はインポートされます。スキーマがすでに定義されている場合、インポートは失敗します。
すべて アノテーション済みのドキュメントとアノテーション未実施のドキュメントをすべてエクスポートします。
  • Documents tagged as training are used to train the model.
  • Documents tagged as validation are used to measure the model performance.
  • Documents tagged as evaluation are ignored.
  • アノテーション未実施のドキュメントの事前アノテーションが行われ、未確認として扱われます。

スキーマをインポートする

スキーマをデータセットと共にモダン プロジェクトにインポートできます。スキーマをインポートするには、以下の手順を実行します。

  1. Create a custom document type in the Build section.
  2. スキーマが含まれる zip ファイルをインポートします。
注:
  • スキーマのインポートは、既存のスキーマを持たないカスタムのドキュメントの種類に限られます。
  • すでにスキーマが含まれるドキュメントの種類にスキーマをインポートした場合、インポートは失敗します。

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得