- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- パブリック エンドポイント
- 1040 (米国の個人所得税修正申告書) - ドキュメントの種類
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ドキュメントの種類
- (米国の個人所得税申告書のスケジュール D) - ドキュメントの種類
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ドキュメントの種類
- 1040x (米国の個人所得税修正申告書) - ドキュメントの種類
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム) - ドキュメントの種類
- 4506T (米国の納税申告証明依頼書) - ドキュメントの種類
- 709 (米国の贈与税申告書) - ドキュメントの種類
- 941× (米国の雇用主による四半期連邦税修正申告書) - ドキュメントの種類
- 9465 (米国の分割納付申請書) - ドキュメントの種類
- ACORD125 (企業向け保険契約申込書) - ドキュメントの種類
- ACORD126 (企業総合賠償責任保険) - ドキュメントの種類
- ACORD131 (アンブレラ/エクセス保険) - ドキュメントの種類
- ACORD140 (商業保険申込書の財物補償条項) - ドキュメントの種類
- ACORD25 (賠償責任保険証明書) - ドキュメントの種類
- Bank Statements (銀行預金残高証明書) - ドキュメントの種類
- BillsOfLading (船荷証券) - ドキュメントの種類
- Certificate of Incorporation (会社存在証明書) - ドキュメントの種類
- Certificate of Origin (原産地証明書) - ドキュメントの種類
- Checks (小切手) - ドキュメントの種類
- Children's Product Certificate (子供向け製品証明書) - ドキュメントの種類
- CMS 1500 (米国の医療保険請求フォーム) - ドキュメントの種類
- EU Declaration of Conformity (EU 適合宣言書) - ドキュメントの種類
- Financial Statements (財務諸表) - ドキュメントの種類
- FM1003 (米国の統一住宅ローン申請書) - ドキュメントの種類
- I9 (米国の就労資格証明書) - ドキュメントの種類
- ID Cards (ID カード) - ドキュメントの種類
- Invoices (請求書) - ドキュメントの種類
- Invoices2 (請求書 2) - ドキュメントの種類
- InvoicesAustralia (請求書 - オーストラリア) - ドキュメントの種類
- Invoices China (請求書 - 中国) - ドキュメントの種類
- Invoices Hebrew (請求書 - ヘブライ語) - ドキュメントの種類
- Invoices India (請求書 - インド) - ドキュメントの種類
- Invoices Japan (請求書 - 日本) - ドキュメントの種類
- Invoices Shipping (船積送り状) - ドキュメントの種類
- Packing Lists (梱包明細書) - ドキュメントの種類
- Pay slips (給与明細) - ドキュメントの種類
- Passports (パスポート) - ドキュメントの種類
- Purchase Orders (発注書) - ドキュメントの種類
- Receipts (領収書) - ドキュメントの種類
- Receipts2 (領収書 2) - ドキュメントの種類
- Receipts Japan (領収書 - 日本) - ドキュメントの種類
- Remittance Advices (送金通知書) - ドキュメントの種類
- UB-04 (健康保険請求フォーム) - ドキュメントの種類
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) - ドキュメントの種類
- Utility Bills (公共料金の請求書) - ドキュメントの種類
- Vehicle Titles (自動車の権利書) - ドキュメントの種類
- W2 (米国の源泉徴収票) - ドキュメントの種類
- W9 (米国の納税申告書) - ドキュメントの種類
- サポートされている言語
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- ログ
- ライセンスと請求ロジック
- 使い方
- トラブルシューティング

Document Understanding modern projects user guide
開発
このセクションでは、次の操作を行うことができます。
- ドキュメントをアップロードし、自動的に分類します。
- ドキュメントをドキュメントの種類に直接アップロードします。
- プロジェクトからファイルを管理します (ファイルの追加・削除)。
- ドキュメントのアノテーションを行います。
- フィールドを追加または削除します。
- 推奨事項を実行しながら分類モデルと抽出モデルをトレーニングする、ガイド付きエクスペリエンスを利用します。
ドキュメントのアノテーションを行う
After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.

For more in-depth information on how to annotate your documents, check the Annotate documents how-to page.
レビューが必要な例外
検証ステーションで検証されたドキュメントを使用して、モデルのパフォーマンスをさらに向上させることができます。
If there are any changes after the validation step, the Exceptions for review button is displayed for the impacted document type.
Figure 1. Exceptions for review button
![[レビューが必要な例外] ボタン](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-exceptions-for-review-button-558977-79cbd5cf-885ad631.webp)
For more in-depth information on how to retrain your models, check the Retrain extractors how-to page.
フィールドの設定を編集する
You can edit the settings for multiple fields from Document type manager.
To get to there, select the three-dot icon ⋮ next to the document type you want to edit and select Document type manager from the menu.
Figure 2. Select Document type manager
![[構築] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-build-interface-397568-a0c2bd5d-4c671a38.webp)
新しいフィールドを編集または追加する
To add a new field, select Add field and fill in the needed information. You can add or edit the following options for each field:
-
Field name: the unique name for the field.
-
Content type: the content type of the field:
- String: used for company names or addresses, as well as payment terms, or for any other field where you want to build the parsing or formatting logic manually, in the RPA workflow.
- Number: used for amounts or quantities, with intelligent parsing of the decimal/thousands separators.
- Date: parse, format and unify the output using the YYYY-MM-DD format.
- Phone: use for phone number. Formatting removes letters and parentheses, and replaces spaces with dashes.
- ID Number: used for alphanumeric codes, numbers of IDs. It's similar to the string content type, but removes any characters coming before the
:character. If the Id number you need to extract can contain:characters, usestringcontent type instead to avoid data loss.
-
Shortcut: the shortcut key for the field. One key or a combination of two keys is allowed.
-
Advanced settings: the available options differ depending on the Content type of the selected field. Select the Advanced settings button for the desired field to edit: Figure 3. Document type advanced settings
![[ドキュメントの種類マネージャー] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-document-type-manager-interface-397717-0fc44406-2a54c720.webp)
- Field ID: the unique id for the field.
- Post processing:
- first_span: if the model predicts more than one instance of a field in a document, make it return the first one.
- longest_value: if the model predicts more than one instance of a field in a document, make it return the value consisting of the largest number of characters.
- highest_confidence: if the model predicts more than one instance of a field in a document, make it return the value with the highest confidence.Scoring: the measure used to determine the accuracy when running evaluations of model predictions is only available for fields with content type String:
- exact_match: prediction will only be deemed to be correct (score of 1) if it exactly matches the true value. If it differs by even a single character, then it is deemed to be incorrect (score of 0). This is the default setting for all fields except for String fields.
- levenshtein: prediction will be deemed to be partially correct according to the Levenshtein distance between the prediction and the true value. For example, if a 10 letter value is predicted correctly except for the last 2 characters, then the score of that prediction is be 0.8.
- Date format: this field is only available for fields with content type Date and it indicates how ambiguous dates are parsed and returned:
- 自動
- US style: YYYY-DD-MM
- Non-US style: YYYY-MM-DD
- Multi-line: fields which span multiple text lines (addresses or descriptions) need to have this checked, otherwise only the first line is returned.
- Multi-value: field returns a list with all the values detected in the document.
トレーニングを再トリガーする前に新しいプロジェクト バージョンをパブリッシュした場合、ドキュメントの種類の設定に加えた変更は新しいプロジェクト バージョンに反映されません。
Workaround: To avoid this, retrain the document type after making modifications to the document type fields. You can do this by tagging or confirming additional documents for that type before publishing a new version.
モデルの設定
You can change the document type settings from the Model settings view. To do so, select Model settings.
Figure 4. Model settings
![[ドキュメントの種類マネージャー] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-document-type-manager-interface-397727-d4e43f18-e9813422.webp)
次の設定を変更できます。
- Base model: Dataset size estimations used in the Recommended Actions depend on the base model used to train. Using the most similar base model to your Document Type will reduce the amount of annotation work required.
- Number of languages: Dataset size estimation used in the Recommended Actions depend on the number of languages in the dataset. More languages generally require annotating more data.
フィールド名を検索
You can search through the available field names. To do so, use the search bar from the top left corner of the Document type manager interface. For a more efficient search, use the Filter feature to filter by Content type.
Figure 5. Search field names
![[フィールド名を検索] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-search-field-names-interface-397706-a3f9f32e-53247db4.webp)
フィールドを削除する
Select the Delete next to the field you want to delete.
Figure 6. Delete a field
![[ドキュメントの種類マネージャー] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-document-type-manager-interface-397732-81002ca9-321632ca.webp)
You can also select several (or all) fields and delete them at once. To do so, select the check mark next to the fields you want to delete and then click Delete.
Figure 7. Delete several fields at once
![[ドキュメントの種類マネージャー] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-document-type-manager-interface-397736-bd9f52a1-977d023e.webp)
ドキュメントを検索する
You can search uploaded documents by document name. To do so, use the search bar from the left corner of the Build section. For a more efficient search, use the Filter feature to filter by:
- ドキュメントの種類: ドロップダウン リストから目的のドキュメントの種類を選択します。
- アップロード日: ドキュメントがアップロードされた日付の期間を選択します。
- ステータス:ドキュメントのステータスを選択します。
- タグ: フィルター処理するタグを選択します。
Figure 8. Filter documents
![[ドキュメントをフィルター処理] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-filter-documents-interface-519431-b0e582ca-692bea9e.webp)
プロジェクトとモデルのスコア
You can check your project's overall score from the top right corner. This score factors in the classifier and extractor scores for all document types. Select Project score to display the Measure section. You can check more in-depth performance measurements in that section.
ドキュメントの種類ごとのスコアは、[ドキュメントの種類] セクションで個別に確認できます。このスコアでは、モデルの全体的なパフォーマンスに加えてデータセットのサイズと品質も考慮されます。
You need to upload at least 10 documents to get a project score. For a document type score, you need at least 10 documents under the same document type.

スコア タグを選択すると、使用しているモデルに関するモデルの評価を確認できます。モデルの評価は、分類モデルのパフォーマンスを視覚化するのに役立つ機能です。評価は、次のように 0 から 100 までのモデルのスコアとして表されます。
- 不良 (0-49)
- 平均的 (50-69)
- 良好 (70-89)
- 優秀 (90-100)
Select Detailed model scores to go to the Measure section for detailed information.
![[モデルの評価] インターフェイスのスクリーンショット](https://dev-assets.cms.uipath.com/assets/images/document-understanding/document-understanding-screenshot-of-the-model-rating-interface-387790-f651b046-c4cd898f.webp)