- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- パブリック エンドポイント
- 1040 (米国の個人所得税修正申告書) - ドキュメントの種類
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ドキュメントの種類
- (米国の個人所得税申告書のスケジュール D) - ドキュメントの種類
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ドキュメントの種類
- 1040x (米国の個人所得税修正申告書) - ドキュメントの種類
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム) - ドキュメントの種類
- 4506T (米国の納税申告証明依頼書) - ドキュメントの種類
- 709 (米国の贈与税申告書) - ドキュメントの種類
- 941× (米国の雇用主による四半期連邦税修正申告書) - ドキュメントの種類
- 9465 (米国の分割納付申請書) - ドキュメントの種類
- ACORD125 (企業向け保険契約申込書) - ドキュメントの種類
- ACORD126 (企業総合賠償責任保険) - ドキュメントの種類
- ACORD131 (アンブレラ/エクセス保険) - ドキュメントの種類
- ACORD140 (商業保険申込書の財物補償条項) - ドキュメントの種類
- ACORD25 (賠償責任保険証明書) - ドキュメントの種類
- Bank Statements (銀行預金残高証明書) - ドキュメントの種類
- BillsOfLading (船荷証券) - ドキュメントの種類
- Certificate of Incorporation (会社存在証明書) - ドキュメントの種類
- Certificate of Origin (原産地証明書) - ドキュメントの種類
- Checks (小切手) - ドキュメントの種類
- Children's Product Certificate (子供向け製品証明書) - ドキュメントの種類
- CMS 1500 (米国の医療保険請求フォーム) - ドキュメントの種類
- EU Declaration of Conformity (EU 適合宣言書) - ドキュメントの種類
- Financial Statements (財務諸表) - ドキュメントの種類
- FM1003 (米国の統一住宅ローン申請書) - ドキュメントの種類
- I9 (米国の就労資格証明書) - ドキュメントの種類
- ID Cards (ID カード) - ドキュメントの種類
- Invoices (請求書) - ドキュメントの種類
- Invoices2 (請求書 2) - ドキュメントの種類
- InvoicesAustralia (請求書 - オーストラリア) - ドキュメントの種類
- Invoices China (請求書 - 中国) - ドキュメントの種類
- Invoices Hebrew (請求書 - ヘブライ語) - ドキュメントの種類
- Invoices India (請求書 - インド) - ドキュメントの種類
- Invoices Japan (請求書 - 日本) - ドキュメントの種類
- Invoices Shipping (船積送り状) - ドキュメントの種類
- Packing Lists (梱包明細書) - ドキュメントの種類
- Pay slips (給与明細) - ドキュメントの種類
- Passports (パスポート) - ドキュメントの種類
- Purchase Orders (発注書) - ドキュメントの種類
- Receipts (領収書) - ドキュメントの種類
- Receipts2 (領収書 2) - ドキュメントの種類
- Receipts Japan (領収書 - 日本) - ドキュメントの種類
- Remittance Advices (送金通知書) - ドキュメントの種類
- UB-04 (健康保険請求フォーム) - ドキュメントの種類
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) - ドキュメントの種類
- Utility Bills (公共料金の請求書) - ドキュメントの種類
- Vehicle Titles (自動車の権利書) - ドキュメントの種類
- W2 (米国の源泉徴収票) - ドキュメントの種類
- W9 (米国の納税申告書) - ドキュメントの種類
- サポートされている言語
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- ログ
- ライセンスと請求ロジック
- 使い方
- トラブルシューティング

Document Understanding modern projects user guide
クラシック プロジェクトを移行する
AI Center に基づくプロジェクトを移行するには、このページの手順を使用します。プロジェクトの移行には、次の 2 つの主要な手順があります。
- AI Center に基づくプロジェクトからデータセットをエクスポートする
- エクスポートしたデータセットをモダン プロジェクトにインポートします。
現在の制限事項
- 現在、3,000 ページを超えるデータセットのインポートはサポートされていません。最初の 3,000 ページのみが正常にインポートされ、それ以降のページはインポートに失敗します。たとえば、データセットが 2,999 ページで構成されている場合に、4 ページのドキュメントをインポートしようとすると、このプロセスは成功しません。
- バッチ名および対応するバッチ結果は、現在は利用できません。データがバッチに編成されている場合、バッチ結果の情報はまだ表示されません。ただし、情報は保存されています。
- AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。
AI Center に基づくプロジェクトからデータセットをエクスポートする
-
Open AI Center and navigate to the Data Labeling page.
-
Select the Data Labeling Session you want to migrate.
![[データのラベル付けアプリを新規作成] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-create-new-data-labeling-app-interface-439093-93048ce0-22a0d6ec.webp)
-
Once Document Manager is open, from the Filter documents drop-down list, select Training and validation set.
Figure 1. Training and validation set
![[フィルター] フィールドのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-filters-field-393844-51e5a0e7-482320b5.webp)
-
[エクスポート] を選択します。
-
Leave Current search results selected and fill in a name for your export job.
-
[Download] を選択します。
Figure 2. Download export
![[ファイルをエクスポート] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-export-files-interface-393852-4e05dbd6-3fd7ff83.webp)
データセットをインポートする
-
データのインポート先のプロジェクトに移動して、プロジェクトを開きます。
-
Select Add document type and create a new custom document type.
Figure 3. Add document type
![[ドキュメントの種類を追加] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-add-document-type-interface-393862-4826c197-351d3964.webp)
-
On the new custom document type, select Upload and choose the zip file of the classic project you exported. Wait for the upload to finish.
注:AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。
Figure 4. Upload processing

アップロードが完了したら、ドキュメントをトレーニングで利用できます。
モデルのトレーニング
Once the dataset is imported, the model training starts. After the training is complete, the model score is displayed. To check detailed model scores, select the score, and then Detailed model scores.
![[モデルの評価] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-model-rating-interface-387790-f651b046-c4cd898f.webp)
This action takes you to the Measure page where you can access detailed model metrics.
同じデータセットを使用して ML を 2 回トレーニングすると、モデルのメトリックがわずかに異なることに気付く場合があります。これは、以下のようないくつかの理由で発生する可能性があります。
- Initialization: Machine learning uses optimization methods that need initial guesses to trigger the optimization algorithms. Different initial guesses during each training could lead to various outcomes due to the unpredictable nature of these algorithms.
- Random state: Some algorithms use randomness in their operations. For instance, when training a neural network, procedures like stochastic gradient descent and mini-batch gradient descent introduce randomness. Therefore, even with identical initial model parameters and datasets, the performance of models may vary in different runs.
- Regularization: Certain algorithms include a penalty term that encourages the model to maintain smaller weights. Due to the randomness involved, the model could operate with a different weight set each time.
ただし、このようにわずかな違いがあっても、必ずしもあるモデルに他のモデルと比べて優劣があることを意味するわけではないことに注意することが重要です。メトリックがわずかに異なっていても、非常に大きな違いでない限り、モデルがデータを理解する能力に基本的に変わりはありません。さらに、このプロセスを何度も繰り返して平均を取ると、同様のパフォーマンス メトリックが得られるはずです。
ドキュメントの種類マネージャーでベース モデルを変更する
クラシック プロジェクトとモダン プロジェクトのモデルの結果に大きな違いがある場合は、ベース モデルの違いが原因である可能性があります。ベース モデルを変更するには、次の手順に進みます。
-
Select the three-dot menu from your custom document type and choose Document type manager.
![[ドキュメントの種類マネージャー] ボタンのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-document-type-manager-button-453478-88d65369-f87c16b3.webp)
-
Navigate to the Settings tab.
-
Select the desired model from the Base model drop-down list.
![[ベース モデル] ドロップダウン リストのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-base-model-drop-down-list-453487-55f7ae51-cd86acda.webp)
-
After making your selection, select Save. To exit, select Back.
エクスポートの種類
For classic projects, there are various methods for exporting data. Not all types of exported data are compatible for importing into modern projects. To compare the model results across both project types,filter documents by Training and validation set and select Choose search results to export the dataset. For more information on each option, check the following table.
| エクスポートの種類 | エクスポートされるデータ | インポートしたデータのこの後の流れ |
|---|---|---|
| 現在の検索結果 | Exports the current filtered dataset. Use it together with the Training and validation set filter. | Documents tagged as training are used to train the model. Documents tagged as validation are used to measure the model performance. Tip: To compare model results between two project types, always export and import the dataset as Train and validation . |
| ラベル付けされたデータすべて | すべてのアノテーション済みのドキュメントをデータセットからエクスポートします。
|
|
| スキーマ | フィールドのリストと、そのそれぞれの設定をエクスポートします。 | スキーマが存在しない場合はインポートされます。スキーマがすでに定義されている場合、インポートは失敗します。 |
| すべて | アノテーション済みのドキュメントとアノテーション未実施のドキュメントをすべてエクスポートします。 |
|
スキーマをインポートする
スキーマをデータセットと共にモダン プロジェクトにインポートできます。スキーマをインポートするには、以下の手順を実行します。
- Create a custom document type in the Build section.
- スキーマが含まれる zip ファイルをインポートします。
- スキーマのインポートは、既存のスキーマを持たないカスタムのドキュメントの種類に限られます。
- すでにスキーマが含まれるドキュメントの種類にスキーマをインポートした場合、インポートは失敗します。