- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- パブリック エンドポイント
- 1040 (米国の個人所得税修正申告書) - ドキュメントの種類
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ドキュメントの種類
- (米国の個人所得税申告書のスケジュール D) - ドキュメントの種類
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ドキュメントの種類
- 1040x (米国の個人所得税修正申告書) - ドキュメントの種類
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム) - ドキュメントの種類
- 4506T (米国の納税申告証明依頼書) - ドキュメントの種類
- 709 (米国の贈与税申告書) - ドキュメントの種類
- 941× (米国の雇用主による四半期連邦税修正申告書) - ドキュメントの種類
- 9465 (米国の分割納付申請書) - ドキュメントの種類
- ACORD125 (企業向け保険契約申込書) - ドキュメントの種類
- ACORD126 (企業総合賠償責任保険) - ドキュメントの種類
- ACORD131 (アンブレラ/エクセス保険) - ドキュメントの種類
- ACORD140 (商業保険申込書の財物補償条項) - ドキュメントの種類
- ACORD25 (賠償責任保険証明書) - ドキュメントの種類
- Bank Statements (銀行預金残高証明書) - ドキュメントの種類
- BillsOfLading (船荷証券) - ドキュメントの種類
- Certificate of Incorporation (会社存在証明書) - ドキュメントの種類
- Certificate of Origin (原産地証明書) - ドキュメントの種類
- Checks (小切手) - ドキュメントの種類
- Children's Product Certificate (子供向け製品証明書) - ドキュメントの種類
- CMS 1500 (米国の医療保険請求フォーム) - ドキュメントの種類
- EU Declaration of Conformity (EU 適合宣言書) - ドキュメントの種類
- Financial Statements (財務諸表) - ドキュメントの種類
- FM1003 (米国の統一住宅ローン申請書) - ドキュメントの種類
- I9 (米国の就労資格証明書) - ドキュメントの種類
- ID Cards (ID カード) - ドキュメントの種類
- Invoices (請求書) - ドキュメントの種類
- InvoicesAustralia (請求書 - オーストラリア) - ドキュメントの種類
- Invoices China (請求書 - 中国) - ドキュメントの種類
- Invoices Hebrew (請求書 - ヘブライ語) - ドキュメントの種類
- Invoices India (請求書 - インド) - ドキュメントの種類
- Invoices Japan (請求書 - 日本) - ドキュメントの種類
- Invoices Shipping (船積送り状) - ドキュメントの種類
- Packing Lists (梱包明細書) - ドキュメントの種類
- Pay slips (給与明細) - ドキュメントの種類
- Passports (パスポート) - ドキュメントの種類
- Purchase Orders (発注書) - ドキュメントの種類
- Receipts (領収書) - ドキュメントの種類
- Receipts Japan (領収書 - 日本) - ドキュメントの種類
- Remittance Advices (送金通知書) - ドキュメントの種類
- UB-04 (健康保険請求フォーム) - ドキュメントの種類
- Utility Bills (公共料金の請求書) - ドキュメントの種類
- Vehicle Titles (自動車の権利書) - ドキュメントの種類
- W2 (米国の源泉徴収票) - ドキュメントの種類
- W9 (米国の納税申告書) - ドキュメントの種類
- サポートされている言語
- Insights のダッシュボード
- データおよびセキュリティ
- ライセンス
- 使い方
- トラブルシューティング

Document Understanding モダン プロジェクト ユーザー ガイド
ドキュメントのアノテーションを行う
プロジェクトが正常に作成され、ドキュメントを特定のドキュメントの種類にアップロードすると、ドキュメントに自動的にアノテーションが行われます。これは、ドキュメントの種類のスキーマに基づいて、生成 AI のモデルと専門家されたモデルを組み合わせて行なわれます。このスキーマでは、特定のドキュメントの種類から抽出するフィールドが明確に定義されています。ドキュメントの種類のスキーマを確認するには、[アノテーション] ページに移動して [フィールド] セクションを確認します。
Predictions are indicated with underlines on the text within the document and they can't be deleted. If they are incorrect and cannot be matched to a particular field, you can ignore them. During the training process, only confirmed fields are used for training, while the underlines are not taken into account.
As you continue to add more annotations, the prediction underlines should progressively align with your input. There may be a few inconsistencies between underlines and user-annotated fields at the beginning. However, as you make more annotations and the model improves, the underlines should line up more precisely with the user-supplied data.
In the following image, the Shipping Address has been incorrectly predicted to include the person's name.
これを修正するには、配送先住所を確認するだけです。名前に関連する下線付きのテキストを削除する必要はありません。アノテーションを続行してこのようなエラーを修正していくと、下線付きのテキストが確認済みのフィールドと一致しないケースが減っていきます。
You can change the extractions view mode using the Extractions view menu. To access this, select the three-dot icon ⁝ on the right side of the document type name and select Extractions view.
Filtered values consist of predictions, which are read-only, and annotations, which can be edited by the user.
- Merge by column: model predictions are displayed in columns that do not have any annotations. Choose this for smaller tables where you can view and validate the whole column.
- Merge by row: model predictions are displayed in rows that do not have any annotations. Choose this when you have larger tables and you want to validate row by row.
- Only confirmed: only extracted values for user confirmed annotations are displayed.
- Only predicted: only display model predictions. Updated automatically when model is retrained and is not editable.
- Show side panel: display the panel on the left side with annotation fields.
- Show table: display the table annotation panel.
After all documents are uploaded and predicted, your goal is to either validate or modify the pre-annotated fields. For a document where all fields are accurately predicted, select Confirm to approve all fields at once. A document, once confirmed, will be signified with a green shield symbol in the document list.
ドキュメントが部分的にしか確認されていない場合は、ドキュメント リストで空の盾の記号が付きます。この記号は、この特定のドキュメントのアノテーション プロセスが進行中であることを示します。最終的な目標は、すべてのドキュメントを確認済みにすることです。
- Prediction is correct and should be validated.
- Prediction is not correct and the field is present on the document.
- Prediction is not correct and the field is missing from the document.
- There is no prediction.
If the prediction is incorrect, select the correct text from the document and the appropriate field from the dropdown, then select Confirm.
When working with tables, you can choose to ignore incorrectly predicted values. These values will not be used for model training, and the retrained model will learn to avoid predicting them in future iterations.
ドキュメントの種類の設定は、[アノテーションを行う] ビューから変更できます。
To do so, select the three-dot icon ⁝ on the right side of the document type name and select Settings.
- ベース モデル: [推奨されるアクション] に表示されるデータセットのサイズの推定値は、トレーニングに使用されるベース モデルによって異なります。対象のドキュメントの種類に最も類似したベース モデルを使用すると、必要とされるアノテーション作業量が減ります。
- 言語の数: [推奨されるアクション] に表示されるデータセットのサイズの推定値は、データセットに含まれる言語の数によって異なります。一般には、言語の数が多いほど、より多くのデータのアノテーションを行う必要があります。