- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- Receipts Japan - ML package
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- パブリック エンドポイント
- サポートされている言語
- Insights のダッシュボード
- データおよびセキュリティ
- ライセンス
- 使い方
Document Understanding モダン プロジェクト ユーザー ガイド
生成 AI 機能
生成 AI は AI 技術の一形態であり、マシン ラーニング (ML) モデルを利用して新しいコンテンツ、データ、情報を作成および生成します。
生成 AI のほとんどのタスクにおいて鍵となるのは、大規模言語モデル (LLM) です。LLM は、膨大な量のテキスト データでトレーニングされ、人間が作成するようなテキストを生成することを目的に設計された ML モデルです。また、文や段落を人間のように作成することにより、プロンプトを理解して応答することもできます。
これらの生成モデルは、主に構築ステップでのドキュメントの自動アノテーション プロセス中に適用され、タクソノミーの設計を迅速化し、モデルの効率的なトレーニングを支援します。
Document Understanding での事前アノテーションは、ドキュメントの種類のスキーマに基づいて、生成 AI モデルと専門化されたモデルを組み合わせて行われます。このスキーマでは、特定のドキュメントの種類から抽出するフィールドが明確に定義されています。
生成 AI によるアノテーションの仕組みと、プロジェクトでの効率的な使用方法について詳しくは、「ドキュメントのアノテーションを行う」をご覧ください。
生成 AI による抽出は Document UnderstandingTM 内の重要な機能であり、生成 AI モデルの能力を利用します。これらのモデルはアクティビティを使用して設定し、主に実行時にデータ抽出に使用します。
生成 AI による抽出では、非構造化ドキュメントまたは半構造化ドキュメントから特定の情報を解読して抽出できます。たとえば、請求書をスキャンして、日付、請求金額、会社名などの詳細を正確に取得できます。これにより、さまざまな種類のドキュメントから情報を高速・効率的かつ非常に正確に収集できます。
- Document Understanding アクティビティ パッケージ:
- [ドキュメント データを抽出]、生成 AI 抽出器を選択した後の [プロンプト] パラメーター
- Document Understanding ML アクティビティ パッケージ:
- Intelligent OCR アクティビティ パッケージ:
- [データ抽出スコープ]、[自動検証を適用] パラメーター
Document Understanding API を使用して生成 AI による抽出機能を活用することもできます。
生成 AI による分類では、AI モデルを使用して、ドキュメントがアップロードされたらすぐに自動的にドキュメントを分類します。
この自動分類プロセスでは、ML モデルを利用してドキュメントの内容を「読み取り」、そのコンテキストを理解し、定義済みのカテゴリに分類します。これにより、システムは複数の種類のドキュメントを効率的に処理および整理できます。
生成 AI による分類は、非構造化ドキュメントまたは半構造化ドキュメントを正確に分類することにより、ドキュメント処理ワークフローの改善、時間の節約、および全体的なドキュメント管理の強化を実現します。
Document Understanding API を使用して生成 AI 分類機能を活用することもできます。
生成 AI による検証は Document Understanding の特徴的な機能で、検証プロセス中に重要な役割を果たします。この機能は主に、抽出ステップの後に、特殊なモデルを使用して行われた抽出の信頼度スコアを検証するために使用されます。
ドキュメント抽出の ML モデルの信頼度スコアが低い場合は、生成 AI による検証を使用して出力をクロスチェックします。この検証プロセスでは、特殊な ML モデルと生成 AI モデルの両方が連携して精度を保証します。
両方のモデルで同じ出力が生成される場合、人間による検証をバイパスできるため、検証の時間効率が大幅に向上します。このプロセスにより、ドキュメント検証ステップで貴重な時間を節約できるだけでなく、第 2 の生成 AI モデルを使用して出力を相互検証することでモデルのパフォーマンスも向上させ、より高いレベルの精度が保証されます。
- Document Understanding アクティビティ パッケージ:
- [ドキュメント データを抽出]、[自動検証] パラメーター
- Intelligent OCR アクティビティ パッケージ:
- [データ抽出スコープ]、[自動検証を適用] パラメーターと [自動検証の信頼度のしきい値] パラメーター
Document Understanding API を使用して生成 AI による検証機能を活用することもできます。