- 概要
- モデルを構築する
- モデルを使用する
- ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- パブリック エンドポイント
- サポートされている言語
- データおよびセキュリティ
- ライセンスと請求ロジック
- 使い方
生成 AI 機能
この機能は現在、監査プロセスの一部であり、レビューが完了するまで FedRAMP 承認の一部とは見なされません。 現在レビュー中の機能の完全なリストは 、こちらをご覧ください 。
生成 AI は AI 技術の一形態であり、マシン ラーニング (ML) モデルを利用して新しいコンテンツ、データ、情報を作成および生成します。
生成 AI のほとんどのタスクにおいて鍵となるのは、大規模言語モデル (LLM) です。LLM は、膨大な量のテキスト データでトレーニングされ、人間が作成するようなテキストを生成することを目的に設計された ML モデルです。また、文や段落を人間のように作成することにより、プロンプトを理解して応答することもできます。
これらの生成モデルは、主に 構築 ステップでのドキュメントの自動アノテーション プロセスで適用され、タクソノミーの設計を加速し、モデルの効率的なトレーニングに役立ちます。
Document Understanding での事前アノテーションは、ドキュメントの種類のスキーマに基づいて、生成モデルと特殊なモデルを組み合わせて使用します。 このスキーマにより、特定のドキュメントの種類から抽出するフィールドが明確に定義されています。
生成 AI によるアノテーションの仕組みと、プロジェクトでの効率的な使用方法について詳しくは、「 ドキュメントにアノテーションを行う 」をご覧ください。
Generative extraction is a crucial feature within Document UnderstandingTM that uses the power of generative AI models. These models are configured using activities and are primarily used at runtime for data extraction.
生成 AI による抽出では、非構造化ドキュメントまたは半構造化ドキュメントの特定の情報を解読して抽出できます。 たとえば、請求書をスキャンして、日付、請求金額、会社名などの詳細を正確に取得できます。 これにより、さまざまな種類のドキュメントから高速、効率的、高精度な情報を収集できます。
- Document Understanding アクティビティ パッケージ:
- ドキュメント データを抽出 、 生成 AI 抽出器 を選択した後の プロンプト パラメーター。
- Document Understanding ML アクティビティ パッケージ:
- Intelligent OCR アクティビティ パッケージ:
- [データ抽出スコープ]、[ 自動検証を適用] パラメーター
Document Understanding API を使用して生成 AI による抽出機能を活用することもできます。
生成 AI による分類では、AI モデルを使用して、ドキュメントがアップロードされた直後に自動的に分類されます。
この自動分類プロセスでは、ML モデルを利用してドキュメントの内容を「読み取り」、そのコンテキストを理解し、定義済みのカテゴリに分類します。 これにより、システムは複数の種類のドキュメントを効率的に処理および整理できます。
生成 AI による分類は、非構造化ドキュメントまたは半構造化ドキュメントを正確に分類することにより、ドキュメント処理ワークフローの改善、時間の節約、および全体的なドキュメント管理の強化を実現します。
Document Understanding API を使用して生成 AI 分類機能を活用することもできます。
生成 AI による検証は、検証プロセス中に重要な役割を果たす Document Understanding の特徴的な機能です。 この機能は主に、抽出手順の後に、特殊なモデルを使用して行われた抽出の信頼度スコアを検証するために使用されます。
ドキュメント抽出に対する ML モデルの信頼度スコアが低い場合は、生成 AI による検証を使用して出力がクロスチェックされます。 この検証プロセスでは、精度を確保するために、特殊な ML モデルと生成 AI モデルの両方が連携して動作します。
両方のモデルで同じ出力が生成される場合、人間による検証をバイパスできるため、検証の時間効率が大幅に向上します。 このプロセスにより、ドキュメントの検証手順の貴重な時間を節約できるだけでなく、セカンダリ生成モデルを使用して出力を相互検証することでモデルのパフォーマンスも向上し、より高いレベルの精度が保証されます。
- Document Understanding アクティビティ パッケージ:
- ドキュメント データを抽出、 自動検証 パラメーター
- Intelligent OCR アクティビティ パッケージ:
- [データ抽出スコープ]、[ 自動検証を適用] 、[ 自動検証の信頼度のしきい値] パラメーター
Document Understanding API を使用して生成 AI による検証機能を活用することもできます。