document-understanding
latest
false
- 概要
- 基本情報
- アクティビティ
- Insights のダッシュボード
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- トラフィック制限
- OCR の設定
- パイプライン
- OCR サービス
- サポートされている言語
- ディープ ラーニング
- ライセンス
データ抽出の検証の概要
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。
Document Understanding ガイド
Last updated 2024年11月14日
データ抽出の検証の概要
自動データ抽出後の任意の (ただし、強く推奨される) 手順として、抽出したデータの検証があります。
これは人間によるレビュー手順で、この手順では Knowledge Workers が自動的に抽出された結果をレビューし、必要に応じて修正できます。
データ抽出の検証を使用することで、現在利用可能な構造化されたデータが 100% 正しいことが保証されます。
以下の場合は、データ抽出の検証コンポーネントを使用することが強く推奨されます。
- データに 100% の精度が必要な場合
-
他の信頼できる情報源から自動抽出された情報をダブルチェックする方法がほかにない場合
- たとえば、データベースに存在する既に確認済みの名前またはアドレスと等しい特定の名前またはアドレスをチェックできるなど。
-
データの一貫性に使用できる十分な合成チェックがない場合
-
たとえば、明細項目の合計を確認したり、ID 番号のチェックサムが正しいことを確認できるなど。
注:100% の精度が必要な場合は、可能であれば、検証手順を追加することを強くお勧めします。
すべてのドキュメントに検証手順を追加するわけにはいかない場合は、以下のようにします。
- できるだけ多くの情報をダブルチェックします。
- ビジネスのユース ケースで特定フィールドに対して許容できる特定の信頼度閾値を決定します。
- 特定の値の抽出信頼度と OCR 信頼度の両方を必ず確認してから、決定を行います。
-
自動的に抽出されたデータの検証は、検証ステーションを使用した人間による入力によって行われます。
検証ステーションは、以下のどちらとしても使用できます。
- [検証ステーションを提示] アクティビティを使用した Attended アクティビティとして
- [ドキュメント検証アクションを作成] アクティビティおよび [ドキュメント検証アクション完了まで待機し再開] アクティビティを使用した Action Center タスクとして