- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- 詳細
- パブリック エンドポイント
- 1040 (米国の個人所得税修正申告書) - ドキュメントの種類
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ドキュメントの種類
- (米国の個人所得税申告書のスケジュール D) - ドキュメントの種類
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ドキュメントの種類
- 1040x (米国の個人所得税修正申告書) - ドキュメントの種類
- 3949a (米国の課税・徴収漏れに関する情報提供フォーム) - ドキュメントの種類
- 4506T (米国の納税申告証明依頼書) - ドキュメントの種類
- 709 (米国の贈与税申告書) - ドキュメントの種類
- 941× (米国の雇用主による四半期連邦税修正申告書) - ドキュメントの種類
- 9465 (米国の分割納付申請書) - ドキュメントの種類
- ACORD125 (企業向け保険契約申込書) - ドキュメントの種類
- ACORD126 (企業総合賠償責任保険) - ドキュメントの種類
- ACORD131 (アンブレラ/エクセス保険) - ドキュメントの種類
- ACORD140 (商業保険申込書の財物補償条項) - ドキュメントの種類
- ACORD25 (賠償責任保険証明書) - ドキュメントの種類
- Bank Statements (銀行預金残高証明書) - ドキュメントの種類
- BillsOfLading (船荷証券) - ドキュメントの種類
- Certificate of Incorporation (会社存在証明書) - ドキュメントの種類
- Certificate of Origin (原産地証明書) - ドキュメントの種類
- Checks (小切手) - ドキュメントの種類
- Children's Product Certificate (子供向け製品証明書) - ドキュメントの種類
- CMS 1500 (米国の医療保険請求フォーム) - ドキュメントの種類
- EU Declaration of Conformity (EU 適合宣言書) - ドキュメントの種類
- Financial Statements (財務諸表) - ドキュメントの種類
- FM1003 (米国の統一住宅ローン申請書) - ドキュメントの種類
- I9 (米国の就労資格証明書) - ドキュメントの種類
- ID Cards (ID カード) - ドキュメントの種類
- Invoices (請求書) - ドキュメントの種類
- Invoices2 (請求書 2) - ドキュメントの種類
- InvoicesAustralia (請求書 - オーストラリア) - ドキュメントの種類
- Invoices China (請求書 - 中国) - ドキュメントの種類
- Invoices Hebrew (請求書 - ヘブライ語) - ドキュメントの種類
- Invoices India (請求書 - インド) - ドキュメントの種類
- Invoices Japan (請求書 - 日本) - ドキュメントの種類
- Invoices Shipping (船積送り状) - ドキュメントの種類
- Packing Lists (梱包明細書) - ドキュメントの種類
- Pay slips (給与明細) - ドキュメントの種類
- Passports (パスポート) - ドキュメントの種類
- Purchase Orders (発注書) - ドキュメントの種類
- Receipts (領収書) - ドキュメントの種類
- Receipts2 (領収書 2) - ドキュメントの種類
- Receipts Japan (領収書 - 日本) - ドキュメントの種類
- Remittance Advices (送金通知書) - ドキュメントの種類
- UB-04 (健康保険請求フォーム) - ドキュメントの種類
- US Mortgage Closing Disclosures (米国のローン契約締結開示説明書) - ドキュメントの種類
- Utility Bills (公共料金の請求書) - ドキュメントの種類
- Vehicle Titles (自動車の権利書) - ドキュメントの種類
- W2 (米国の源泉徴収票) - ドキュメントの種類
- W9 (米国の納税申告書) - ドキュメントの種類
- サポートされている言語
- Insights のダッシュボード
- ライセンスと請求ロジック
- 使い方
- 表、および表の行をグループ化する
- チェックボックスと署名
- アノテーションのベスト プラクティス
- ドキュメントの自動分類
- 抽出器を再トレーニングする
- 分類器をトレーニングする
- トラブルシューティング

Document Understanding モダン プロジェクト ユーザー ガイド
アノテーションのベスト プラクティス
linkアノテーション プロセスを開始する前に、特定の種類のドキュメントに必要なすべてのフィールドを網羅したリストを作成することが重要です。混同を防ぐため、各フィールドは明確に定義してください。好みに応じて、サンプル ドキュメントを例として使用してアノテーションを行ったり、各フィールドを説明する詳細な表を作成したりできます。
一般的なガイドライン
link- 列フィールド
- 標準フィールド
あるフィールドが、同じドキュメント内に同じ値で複数回出現することが分かった場合は、そのフィールドの各インスタンスにアノテーションを行います。たとえば、請求書番号がドキュメントの上部と下部の両方に出現する場合は、両方のインスタンスにアノテーションを行う必要があります。
値が異なる場合は、正しい値にのみアノテーションを行う必要があります。これは、同じベンダーの異なるドキュメントやバリエーションの間で値が異なる場合にも当てはまる可能性があります。このような状況では、まれに違う値がある場合はその値を無視してでも、常にベンダーの一貫性を優先することが重要です。
重要な原則は、類似するレイアウトにアノテーションを行う場合に一貫性を維持することです。これにより、クリーンで均一なデータが保証されます。
さらに、アノテーション済みのデータがすべて完全であることを確認します。住所に含まれる単語やその他の重要な情報が見落とされないようにダブルチェックしてください。
Date: 28-11-2022
に日付としてアノテーションを行った場合、Date:
は必ず削除してください。これにより、情報を簡潔かつ正確に保つことができます。
表に関するガイドライン
link複数の表を操作する場合は、すべての表の列ごとに専用の列フィールドが必要であることに注意してください。このプロセスは、データを正確かつ効果的にキャプチャするために重要です。
/
を使用します。これにより、それらのフィールドが関連付けられ、より効率的に表を処理できるようになります。
/
を選択するだけです。こうすることで、行が複数のページにまたがっていても、シームレスに読み取ることができます。