- 概要
- 基本情報
- モデルを構築する
- モデルを使用する
- ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- パブリック エンドポイント
- サポートされている言語
- Insights のダッシュボード
- データおよびセキュリティ
- ライセンス
- 使い方
生成 AI 機能
生成 AI は AI 技術の一形態であり、マシン ラーニング (ML) モデルを利用して新しいコンテンツ、データ、情報を作成および生成します。
生成 AI のほとんどのタスクにおいて鍵となるのは、大規模言語モデル (LLM) です。LLM は、膨大な量のテキスト データでトレーニングされ、人間が作成するようなテキストを生成することを目的に設計された ML モデルです。また、文や段落を人間のように作成することにより、プロンプトを理解して応答することもできます。
Primarily applied during the automatic annotation process of documents in the Build step, these generative models accelerate taxonomy design and help in training models efficiently.
Pre-annotation in Document Understanding is done using a combination of generative and specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type.
To get a deeper understanding of how Generative Annotation works and how you can use it efficiently in your projects, check the Annotate documents page.
Generative extraction is a crucial feature within Document UnderstandingTM that uses the power of generative AI models. These models are configured using activities and are primarily used at runtime for data extraction.
Generative extraction is capable of deciphering and extracting specific information from unstructured or semi-structured documents. For instance, it can scan through an invoice and accurately retrieve details such as the date, billed amount, and company name. This enables fast, efficient, and highly accurate information gathering from various types of documents.
- Document Understanding activities package:
- Extract Document Data, Prompt parameter after choosing the Generative extractor.
- Document Understanding ML activities package:
- IntelligentOCR activities package:
- Data Extraction Scope, ApplyAutoValidation parameter.
You can also use Document Understanding APIs to leverage generative extraction features.
Generative classification uses AI models to automatically classify documents immediately after they are uploaded.
This automatic classification process leverages ML models to 'read' the content of a document, understand its context, and consequently classify it into predefined categories. This way, the system can handle and organize multiple types of documents efficiently.
By accurately classifying unstructured or semi-structured documents, Generative Classification improves the document processing workflow, saves time, and enhances the overall document management.
You can also use Document Understanding APIs to leverage generative classification features.
Generative validation is a distinctive feature in Document Understanding that plays an important role during the validation process. This feature is primarily used after the extraction step to validate the confidence score for the extraction made using specialized models.
When a ML model's confidence score for a document extraction is low, generative validation is used to cross-check the output. This validation process involves both the specialized and generative ML models working together to ensure accuracy.
If both models yield the same output, human validation can be bypassed, leading to a significant enhancement in the time efficiency of validation. This process not only saves valuable time in the document validation step but also improves the performance of your models by employing a secondary generative model to cross-verify the output, ensuring a higher level of accuracy.
- Document Understanding activities package:
- Extract Document Data, Auto-validation parameter
- IntelligentOCR activities package:
- Data Extraction Scope, ApplyAutoValidation and AutoValidationConfidenceThreshold parameters
You can also use Document Understanding APIs to leverage generative validation features.