- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- パブリック エンドポイント
- 1040 (米国の個人所得税修正申告書) - ドキュメントの種類
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ドキュメントの種類
- (米国の個人所得税申告書のスケジュール D) - ドキュメントの種類
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ドキュメントの種類
- 1040x (米国の個人所得税修正申告書) - ドキュメントの種類
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム) - ドキュメントの種類
- 4506T (米国の納税申告証明依頼書) - ドキュメントの種類
- 709 (米国の贈与税申告書) - ドキュメントの種類
- 941× (米国の雇用主による四半期連邦税修正申告書) - ドキュメントの種類
- 9465 (米国の分割納付申請書) - ドキュメントの種類
- ACORD125 (企業向け保険契約申込書) - ドキュメントの種類
- ACORD126 (企業総合賠償責任保険) - ドキュメントの種類
- ACORD131 (アンブレラ/エクセス保険) - ドキュメントの種類
- ACORD140 (商業保険申込書の財物補償条項) - ドキュメントの種類
- ACORD25 (賠償責任保険証明書) - ドキュメントの種類
- Bank Statements (銀行預金残高証明書) - ドキュメントの種類
- BillsOfLading (船荷証券) - ドキュメントの種類
- Certificate of Incorporation (会社存在証明書) - ドキュメントの種類
- Certificate of Origin (原産地証明書) - ドキュメントの種類
- Checks (小切手) - ドキュメントの種類
- Children's Product Certificate (子供向け製品証明書) - ドキュメントの種類
- CMS 1500 (米国の医療保険請求フォーム) - ドキュメントの種類
- EU Declaration of Conformity (EU 適合宣言書) - ドキュメントの種類
- Financial Statements (財務諸表) - ドキュメントの種類
- FM1003 (米国の統一住宅ローン申請書) - ドキュメントの種類
- I9 (米国の就労資格証明書) - ドキュメントの種類
- ID Cards (ID カード) - ドキュメントの種類
- Invoices (請求書) - ドキュメントの種類
- Invoices2 (請求書 2) - ドキュメントの種類
- InvoicesAustralia (請求書 - オーストラリア) - ドキュメントの種類
- Invoices China (請求書 - 中国) - ドキュメントの種類
- Invoices Hebrew (請求書 - ヘブライ語) - ドキュメントの種類
- Invoices India (請求書 - インド) - ドキュメントの種類
- Invoices Japan (請求書 - 日本) - ドキュメントの種類
- Invoices Shipping (船積送り状) - ドキュメントの種類
- Packing Lists (梱包明細書) - ドキュメントの種類
- Pay slips (給与明細) - ドキュメントの種類
- Passports (パスポート) - ドキュメントの種類
- Purchase Orders (発注書) - ドキュメントの種類
- Receipts (領収書) - ドキュメントの種類
- Receipts2 (領収書 2) - ドキュメントの種類
- Receipts Japan (領収書 - 日本) - ドキュメントの種類
- Remittance Advices (送金通知書) - ドキュメントの種類
- UB-04 (健康保険請求フォーム) - ドキュメントの種類
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) - ドキュメントの種類
- Utility Bills (公共料金の請求書) - ドキュメントの種類
- Vehicle Titles (自動車の権利書) - ドキュメントの種類
- W2 (米国の源泉徴収票) - ドキュメントの種類
- W9 (米国の納税申告書) - ドキュメントの種類
- サポートされている言語
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- ログ
- ライセンスと請求ロジック
- 使い方
- トラブルシューティング

Document Understanding modern projects user guide
Measure
You can check the overall status of your project and check the areas with improvement potential from the Measure section.
プロジェクトの評価
The main measurement on the page is the overall Project score.
This measurement factors in the classifier and extractor scores for all document types. The score of each factor corresponds to the model rating and can be viewed in Classification Measure and Extraction Measure respectively.
モデルの評価は、分類モデルのパフォーマンスを視覚化するのに役立つ機能です。評価は、次のように 0 から 100 までのモデルのスコアとして表されます。
- 不良 (0-49)
- 平均的 (50-69)
- 良好 (70-89)
- 優秀 (90-100)
モデルのスコアに関係なく、トレーニングを停止するタイミングはプロジェクトのニーズに応じてユーザーが決定します。モデルが「優秀」と評価されていても、すべてのビジネス要件を満たすとは限りません。
分類の評価
分類スコアでは、モデルのパフォーマンスに加えてデータセットのサイズと品質も考慮されます。
The Classification score is only available if you have more than one document type created.
If you select Classification, two tabs are displayed on the right side:
- Factors: Provides recommendations on how to improve the performance of your model. You can get recommendations on dataset size or trained model performance for each document type.
- Metrics: Provides useful metrics, such as the number of train and test documents, precision, accuracy, recall, and F1 score for each document type.

抽出の評価
The Extraction score factors in the overall performance of the model as well as the size and quality of the dataset. This view is split into document types. You can also go straight to the Annotate view of each document type by selecting Annotate.
If you select any of the available document types from the Extraction view, three tabs are displayed on the right side:
- Factors: Provides recommendations on how to improve the performance of your model. You can get recommendations on dataset size (number of uploaded documents, number of annotated documents) or trained model performance (fields accuracy) for the selected document type.
- Dataset: Provides information about the documents used for training the model, the total number of imported pages, and the total number of labelled pages.
- Metrics: Provides useful information and metrics, such as the field name, the number of training status, and accuracy for the selected document type. You can also access advanced metrics for your extraction models using the Download advanced metrics button. This feature allows you to download an Excel file with detailed metrics and model results per batch.

データセット診断
The Dataset tab helps you build effective datasets by providing feedback and recommendations of the steps needed to achieve good accuracy for the trained model.

管理バーに表示されるデータセットのステータス レベルには、以下の 3 種類があります。
- 赤 - ラベル付けされたトレーニング データの追加が必要です。
- オレンジ - ラベル付けされたトレーニング データの追加が推奨されます。
- 緑 - ラベル付けされたトレーニング データが必要量に達しています。
セッションでフィールドが作成されていない場合は、データセットのステータス レベルは灰色になります。
モデルを比較
You can compare the performance of two versions of a classification or extraction model from the Measure section.
分類モデルの比較
To compare the performance of two versions of a classification model, first navigate to the Measure section. Then, select Compare model for the classification model you are interested in.
各列の上部にあるドロップダウン リストから、比較するバージョンを選択できます。既定では、現在のバージョン (利用可能な最新バージョンを示します) が左側で選択され、最新のパブリッシュ済みのバージョンが右側で選択されます。
Figure 1. Classification model comparison

分類モデルの比較は、以下の 4 つの主要なメトリックに依存します。
- 適合率: 陽性と予測されたインスタンスの合計数に対する、正しく予測された陽性のインスタンスの割合です。適合率の高いモデルでは偽陽性が少なくなります。
- 精度: インスタンスの合計数のうちの、正しい予測数 (真陽性と真陰性の両方を含む) の割合です。
- 再現率: 正しく特定された実際の陽性のケースの割合です。
- F1 スコア: 適合率と再現率の調和平均です。上記の 2 つのメトリックのバランスを取ることを目的としています。偽陽性と偽陰性のトレードオフとして機能します。
The order of document types displayed is the one used in the latest version from the comparison. If a document type is not available in one of the compared versions, the values for each measure are replaced with N/A.
If a field was removed in the current version but it was available in the older version before the Compare model feature was available, the name is replaced with Unknown.
抽出モデルの比較
To compare the performance of two versions of an extraction model, first navigate to the Measure section. Then, select Compare model for the extraction model you are interested in.
各列の上部にあるドロップダウン リストから、比較するバージョンを選択できます。既定では、現在のバージョン (利用可能な最新バージョンを示します) が左側で選択され、最新のパブリッシュ済みのバージョンが右側で選択されます。
Figure 2. Extraction model comparison

抽出モデルの比較は、以下の主要なメトリックに依存します。
- フィールド名: アノテーション フィールドの名前です。
- コンテンツの種類: フィールドのコンテンツの種類です。
- 文字列
- Number
- 日付
- 電話番号
- ID 番号
- 評価: 抽出フィールドのパフォーマンスを視覚化するのに役立つ、モデルのスコアです。
- 精度: モデルが行う予測の合計数のうちの、正しいものの割合です。
The order of field names displayed is the one used in the latest version from the comparison. If a field name is not available in one of the compared versions, the values for each measure are replaced with N/A.
If a field was removed in the current version but it was available in the older version before the Compare model feature was available, the name is replaced with Unknown.
You can also compare the field score for tables from the Table section.
You can download the advanced metrics file for each version from the comparison page from the Download advanced metrics button.