UiPath Documentation
document-understanding
latest
false

Document Understanding ガイド

最終更新日時 2026年4月29日

クラシック プロジェクトを移行する

クラシック プロジェクトまたは AI Center に基づくプロジェクトを移行するには、このページの手順を使用します。プロジェクトの移行には、次の 2 つの主要な手順があります。

  1. クラシック プロジェクトまたは AI Center に基づくプロジェクトからデータセットをエクスポートします。
  2. エクスポートしたデータセットをモダン プロジェクトにインポートします。

現在の制限事項

  • 現在、5,000 ページを超えるデータセットのインポートはサポートされていません。最初の 5,000 ページのみが正常にインポートされ、それ以降のページはインポートに失敗します。たとえば、データセットが 4,999 ページで構成されている場合に、4 ページのドキュメントをインポートしようとすると、このプロセスは成功しません。
  • バッチ名および対応するバッチ結果は、現在は利用できません。データがバッチに編成されている場合、バッチ結果の情報はまだ表示されません。ただし、情報は保存されています。
  • AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。

クラシック プロジェクトからデータセットをエクスポートする

  1. 移行するクラシック プロジェクトに移動し、プロジェクトを開きます。
  2. エクスポートするドキュメントの種類に移動し、[ドキュメントの種類を開く] を選択します。

図 1.ドキュメントの種類を開く

ドキュメントの種類が領収書のスクリーンショット

  1. [ドキュメントをフィルター処理] ドロップダウン リストから、[トレーニングと検証セット] を選択します。

図 2. トレーニングと検証セット

フィルター処理フィールドのスクリーンショット

  1. [エクスポート] を選択します。
  2. [現在の検索結果] を選択したままにして、エクスポート ジョブの名前を入力します。
  3. [Download] を選択します。

図 3. エクスポートをダウンロードする

[ファイルをエクスポート] インターフェイスのスクリーンショット

AI Center に基づくプロジェクトからデータセットをエクスポートする

  1. AI Center を開き、[データのラベル付け] ページに移動します。

  2. 移行するデータのラベル付けセッションを選択します。

    [データのラベル付けアプリを新規作成] インターフェイスのスクリーンショット

  3. Document Manager が開いたら、[ドキュメントをフィルター処理] ドロップダウン リストから [トレーニングと検証セット] を選択します。

図 4. トレーニングと検証セット

[フィルター] フィールドのスクリーンショット

  1. [エクスポート] を選択します。
  2. [現在の検索結果] を選択したままにして、エクスポート ジョブの名前を入力します。
  3. [Download] を選択します。

図 5. エクスポートをダウンロードする

[ファイルをエクスポート] インターフェイスのスクリーンショット

データセットをインポートする

  1. データのインポート先のプロジェクトに移動して、プロジェクトを開きます。
  2. [ドキュメントの種類を追加] を選択し、新しいカスタム ドキュメントの種類を作成します。

図 6. ドキュメントの種類を追加

[ドキュメントの種類を追加] インターフェイスのスクリーンショット

  1. 新しいカスタム ドキュメントの種類で [アップロード] を選択し、エクスポートしたクラシック プロジェクトの zip ファイルを選択します。アップロードが完了するまで待ちます。
    注:

    AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。

図 7. アップロード処理

アップロード処理の読み込みインターフェイスのスクリーンショット

アップロードが完了したら、ドキュメントをトレーニングで利用できます。

モデルのトレーニング

データセットがインポートされると、モデルのトレーニングが開始されます。トレーニングの完了後、モデルのスコアが表示されます。モデルの詳細なスコアを確認するには、スコアを選択して、[モデルの詳細なスコア] を選択します。

[モデルの評価] インターフェイスのスクリーンショット

この操作を行うと [測定] ページに移動し、モデルの詳細なメトリックにアクセスできます。

同じデータセットを使用して ML を 2 回トレーニングすると、モデルのメトリックがわずかに異なることに気付く場合があります。これは、以下のようないくつかの理由で発生する可能性があります。

  • 初期化: 機械学習では、最適化アルゴリズムをトリガーするために初期推測が必要な最適化手法を使用します。これらのアルゴリズムは予測不可能な性質であるため、トレーニングごとに初期推測が異なり、さまざまな結果につながる可能性があります。
  • ランダムなステート: 一部のアルゴリズムでは、その処理にランダム性を使用します。たとえば、ニューラル ネットワークをトレーニングする場合、確率的勾配降下法やミニバッチ勾配降下法のような手順でランダム性が取り入れられます。そのため、モデルの初期パラメーターとデータセットが同一であっても、実行ごとにモデルのパフォーマンスが異なる場合があります。
  • 正則化: 特定のアルゴリズムには、モデルがより小さな重みを維持するよう促進するペナルティ項が含まれています。ランダム性が関係するため、モデルは毎回異なる重みセットで動作する可能性があります。

ただし、このようにわずかな違いがあっても、必ずしもあるモデルに他のモデルと比べて優劣があることを意味するわけではないことに注意することが重要です。メトリックがわずかに異なっていても、非常に大きな違いでない限り、モデルがデータを理解する能力に基本的に変わりはありません。さらに、このプロセスを何度も繰り返して平均を取ると、同様のパフォーマンス メトリックが得られるはずです。

ドキュメントの種類マネージャーでベース モデルを変更する

クラシック プロジェクトとモダン プロジェクトのモデルの結果に大きな違いがある場合は、ベース モデルの違いが原因である可能性があります。ベース モデルを変更するには、次の手順に進みます。

  1. カスタムのドキュメントの種類から 3 点リーダー メニューを選択し、[ドキュメントの種類マネージャー] を選択します。

    [ドキュメントの種類マネージャー] ボタンのスクリーンショット

  2. [設定] タブに移動します。

  3. [ベース モデル] ドロップダウン リストから目的のモデルを選択します。

    [ベース モデル] ドロップダウン リストのスクリーンショット

  4. 選択が完了したら、[保存] を選択します。終了するには、[戻る] を選択します。

エクスポートの種類

クラシック プロジェクトでは、さまざまな方法でデータをエクスポートできます。ただし、エクスポートしたデータの種類すべてが、モダン プロジェクトへのインポートに対応しているわけではありません。両方の種類のプロジェクトでモデルの結果を比較するには、[トレーニングと検証セット] でドキュメントをフィルター処理し、[現在の検索結果を選択] を選択してデータセットをエクスポートします。各オプションについて詳しくは、以下の表をご覧ください。

表 1.エクスポートの種類
エクスポートの種類 エクスポートされるデータ インポートしたデータのこの後の流れ
現在の検索結果 現在フィルター処理されているデータセットをエクスポートします。これを [トレーニングと検証セット] フィルターと併せて使用します。 「トレーニング」としてタグ付けされたドキュメントは、モデルのトレーニングに使用されます。「検証」としてタグ付けされたドキュメントは、モデルのパフォーマンスの測定に使用されます。ヒント: 2 つのプロジェクトの種類の間でモデルの結果を比較するには、必ずデータセットを 「トレーニングと検証 セット」としてエクスポートしてインポートします。
ラベル付けされたデータすべて すべてのアノテーション済みのドキュメントをデータセットからエクスポートします。
  • トレーニング セット
  • 検証セット
  • 評価セット
  • トレーニング」としてタグ付けされたドキュメントは、モデルのトレーニングに使用されます。
  • 検証」としてタグ付けされたドキュメントは、モデルのパフォーマンスの測定に使用されます。
  • 評価」としてタグ付けされたドキュメントは無視されます。
スキーマ フィールドのリストと、そのそれぞれの設定をエクスポートします。 スキーマが存在しない場合はインポートされます。スキーマがすでに定義されている場合、インポートは失敗します。
すべて アノテーション済みのドキュメントとアノテーション未実施のドキュメントをすべてエクスポートします。
  • トレーニング」としてタグ付けされたドキュメントは、モデルのトレーニングに使用されます。
  • 検証」としてタグ付けされたドキュメントは、モデルのパフォーマンスの測定に使用されます。
  • 評価」としてタグ付けされたドキュメントは無視されます。
  • アノテーション未実施のドキュメントの事前アノテーションが行われ、未確認として扱われます。

スキーマをインポートする

スキーマをデータセットと共にモダン プロジェクトにインポートできます。スキーマをインポートするには、以下の手順を実行します。

  1. [構築] セクションでカスタムのドキュメントの種類を作成します。
  2. スキーマが含まれる zip ファイルをインポートします。
    注:
    • スキーマのインポートは、既存のスキーマを持たないカスタムのドキュメントの種類に限られます。
    • すでにスキーマが含まれるドキュメントの種類にスキーマをインポートした場合、インポートは失敗します。

オートメーション ワークフローを移行する

RPA オートメーションでクラシック DU プロジェクトからモダン プロジェクトに移行するには、1 つの変更が必要です。[データ抽出スコープ] 内の [ML 抽出器] アクティビティを「Document Understanding プロジェクト抽出器」に置き換えます。他のアクティビティを変更する必要はありません。デジタル化、検証、トレーニングのアクティビティに変更はありません。

注:

ワークフローでドキュメント分類を使用している場合は、既存の分類器を Document Understanding プロジェクト分類器にも置き換えます。以下の 「分類を移行 する」をご覧ください。

[ML 抽出器] アクティビティを置き換えます

  1. Studio プロジェクトで、[ データ抽出スコープ] アクティビティを開きます。
  2. 既存の [ML 抽出器] アクティビティを削除します。
  3. [データ抽出スコープ] 内に Document Understanding プロジェクト抽出器を追加します。
  4. [ 抽出器機能を取得または更新 ] を選択して、構成ウィザードを開きます。
  5. [ 設計時の資格情報] に、 アプリ IDアプリ シークレットテナント URL を入力します。
  6. [ プロジェクトを取得 ] を選択して、利用可能なモダン プロジェクトのリストを読み込みます。
  7. [プロジェクト] で、ドロップダウン リストから目的のモダン プロジェクトを選択します。
  8. [ バージョン] で、プロジェクトのデプロイ済みバージョンを選択します。または、特定のバージョンにリンクされている タグ を選択します。バージョンとタグは相互に排他的です。
  9. [機能を取得] を選択します。
  10. [アクティビティの引数を更新] がオンになっていることを確認します。
注:

別のテナントのプロジェクトに接続する場合は、アクティビティの [認証 ] プロパティ ( [実行時の資格情報アセット ] と [ 実行時のテナント URL ]) を、ウィザードで使用した資格情報と一致するように設定します。

構成について詳しくは、「 Document Understanding プロジェクト抽出器」をご覧ください。

分類を移行する

オートメーションでドキュメント分類を使用する場合は、既存の分類器を [ドキュメント分類スコープ] 内の Document Understanding プロジェクト分類器に置き換えます。設定手順は抽出器と同様です。 分類器を設定ウィザードを開き、設計時の資格情報を入力し、プロジェクトとバージョンまたはタグを選択して、[ 機能を取得] を選択します。

構成について詳しくは、「 Document Understanding プロジェクト分類器」をご覧ください。

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得