- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- パブリック エンドポイント
- 1040 (米国の個人所得税修正申告書) - ドキュメントの種類
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ドキュメントの種類
- (米国の個人所得税申告書のスケジュール D) - ドキュメントの種類
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ドキュメントの種類
- 1040x (米国の個人所得税修正申告書) - ドキュメントの種類
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム) - ドキュメントの種類
- 4506T (米国の納税申告証明依頼書) - ドキュメントの種類
- 709 (米国の贈与税申告書) - ドキュメントの種類
- 941× (米国の雇用主による四半期連邦税修正申告書) - ドキュメントの種類
- 9465 (米国の分割納付申請書) - ドキュメントの種類
- ACORD125 (企業向け保険契約申込書) - ドキュメントの種類
- ACORD126 (企業総合賠償責任保険) - ドキュメントの種類
- ACORD131 (アンブレラ/エクセス保険) - ドキュメントの種類
- ACORD140 (商業保険申込書の財物補償条項) - ドキュメントの種類
- ACORD25 (賠償責任保険証明書) - ドキュメントの種類
- Bank Statements (銀行預金残高証明書) - ドキュメントの種類
- BillsOfLading (船荷証券) - ドキュメントの種類
- Certificate of Incorporation (会社存在証明書) - ドキュメントの種類
- Certificate of Origin (原産地証明書) - ドキュメントの種類
- Checks (小切手) - ドキュメントの種類
- Children's Product Certificate (子供向け製品証明書) - ドキュメントの種類
- CMS 1500 (米国の医療保険請求フォーム) - ドキュメントの種類
- EU Declaration of Conformity (EU 適合宣言書) - ドキュメントの種類
- Financial Statements (財務諸表) - ドキュメントの種類
- FM1003 (米国の統一住宅ローン申請書) - ドキュメントの種類
- I9 (米国の就労資格証明書) - ドキュメントの種類
- ID Cards (ID カード) - ドキュメントの種類
- Invoices (請求書) - ドキュメントの種類
- Invoices2 (請求書 2) - ドキュメントの種類
- InvoicesAustralia (請求書 - オーストラリア) - ドキュメントの種類
- Invoices China (請求書 - 中国) - ドキュメントの種類
- Invoices Hebrew (請求書 - ヘブライ語) - ドキュメントの種類
- Invoices India (請求書 - インド) - ドキュメントの種類
- Invoices Japan (請求書 - 日本) - ドキュメントの種類
- Invoices Shipping (船積送り状) - ドキュメントの種類
- Packing Lists (梱包明細書) - ドキュメントの種類
- Pay slips (給与明細) - ドキュメントの種類
- Passports (パスポート) - ドキュメントの種類
- Purchase Orders (発注書) - ドキュメントの種類
- Receipts (領収書) - ドキュメントの種類
- Receipts2 (領収書 2) - ドキュメントの種類
- Receipts Japan (領収書 - 日本) - ドキュメントの種類
- Remittance Advices (送金通知書) - ドキュメントの種類
- UB-04 (健康保険請求フォーム) - ドキュメントの種類
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) - ドキュメントの種類
- Utility Bills (公共料金の請求書) - ドキュメントの種類
- Vehicle Titles (自動車の権利書) - ドキュメントの種類
- W2 (米国の源泉徴収票) - ドキュメントの種類
- W9 (米国の納税申告書) - ドキュメントの種類
- サポートされている言語
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- ログ
- ライセンスと請求ロジック
- 使い方
- トラブルシューティング

Document Understanding modern projects user guide
ドキュメントのアノテーションを行う
After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.
![[フィールド] メニューのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-fields-menu-419307-8f0902d6-5cc855c5.webp)
予測はドキュメント内のテキストに下線付きで示され、削除できません。予測が間違っていて、特定のフィールドに一致させることができない場合は、無視してかまいません。トレーニング プロセスでは、確認済みのフィールドのみがトレーニングに使用され、下線は考慮されません。
アノテーションを追加で行っていくうちに、予測の下線部分が徐々に入力内容と一致していきます。下線部分とユーザーがアノテーションを行ったフィールドとの間に最初からほとんど不整合がない場合もあります。ただし、さらにアノテーションを行ってモデルが改善されていくと、下線部分は、ユーザーが提供したデータとより正確に一致するようになります。
次の画像では、配送先住所の予測に誤りがあり、人名まで含まれています。
![[フィールド名] メニューのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-field-name-menu-419322-25e1dfea-d0a80541.webp)
これを修正するには、配送先住所を確認するだけです。名前に関連する下線付きのテキストを削除する必要はありません。アノテーションを続行してこのようなエラーを修正していくと、下線付きのテキストが確認済みのフィールドと一致しないケースが減っていきます。
モデルのトレーニングをトリガーするには、40 以上の操作が必要です。たとえば、ドキュメントが 20 個ある場合、ドキュメント 1 個につき 2 つ以上のフィールドに注釈を付ける必要があるため、合計で 40 の操作が必要になります。
To optimize model perfomance, follow the suggestions from the Recommendations section. These suggestions are designed to improve the overall performance of your model.
![[アノテーション] ページのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-annotation-page-396659-01db5a3c-ba6053dd.webp)
予測されたドキュメントを検証する
After all documents are uploaded and predicted, your goal is to either validate or modify the pre-annotated fields. For a document where all fields are accurately predicted, select Confirm to approve all fields at once. A document, once confirmed, will be signified with a green shield symbol in the document list.
![[アノテーション] ページのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-annotation-page-396668-eaed1109-4d2a7212.webp)
If a document is only partially confirmed, it will be marked with an empty shield symbol in the document list. This symbolizes that the annotation process for this particular document is In Progress. Your end aim should be to make sure that all documents are Confirmed.
検証中に、次のシナリオが発生する可能性があります。
- 予測は正確であり、検証する必要がある
- 予測に誤りがあり、フィールドがドキュメントに存在する
- 予測に誤りがあり、フィールドがドキュメントに存在しない
- 予測がない
予測は正確であり、検証する必要がある
If the prediction is accurate, you can confirm it by either selecting the underlined text and selecting Confirm or checking the confirmation checkbox for the field. The optimal method, however, is to press the hotkey assigned to the field (“N” in this scenario).
![[アノテーション] ページのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-annotation-page-396672-4bfaed7d-12c57911.webp)
予測に誤りがあり、フィールドがドキュメントに存在する
If the prediction is incorrect, select the correct text from the document and the appropriate field from the dropdown, then select Confirm.
表を操作するときに、誤って予測された値を無視するよう選択できます。これらの値はモデルのトレーニングに使用されなくなります。また、再トレーニングされたモデルは、今後の反復処理でこれらの値を予測しないように学習します。
予測に誤りがあり、フィールドがドキュメントに存在しない
If there prediction is incorrect and the field is missing from the document, select the three-dot icon ⁝ next to the field name and select Mark as missing.
You can also mark wrong fields as missing. For example, if you do not have a Vendor Address in your document but during processing a different field was pre-labeled as Vendor Address, you can just mark it as missing during validation.
![[アノテーション] ページのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-annotation-page-396676-ff9904f8-113b926a.webp)
予測がない
Fields that have no prediction are displayed as empty cells. You can mark these cells as missing one by one, or in bulk by selecting the Confirm button.
ドキュメントの種類の設定
You can change the document type settings from the Annotate view.
To do so, select the three-dot icon ⁝ on the right side of the document type name and select Settings.
![[設定] ボタンのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-settings-button-407113-58acea35-1b9764d1.webp)
次の設定を変更できます。
- Base model: Dataset size estimations used in the Recommended Actions depend on the base model used to train. Using the most similar base model to your Document Type will reduce the amount of annotation work required.
- Number of languages: Dataset size estimation used in the Recommended Actions depend on the number of languages in the dataset. More languages generally require annotating more data.