Document Understanding ガイド

デリバリー:

最終更新日時 2025年4月10日

生成 AI 機能

生成 AI は AI 技術の一形態であり、マシンラーニング (ML) モデルを利用して新しいコンテンツ、データ、情報を作成および生成します。

生成 AI のほとんどのタスクにおいて鍵となるのは、大規模言語モデル (LLM) です。LLM は、膨大な量のテキストデータでトレーニングされ、人間が作成するようなテキストを生成することを目的に設計された ML モデルです。また、文や段落を人間のように作成することにより、プロンプトを理解して応答することもできます。

生成 AI によるアノテーション

これらの生成モデルは、主に構築ステップでのドキュメントの自動アノテーションプロセス中に適用され、タクソノミーの設計を迅速化し、モデルの効率的なトレーニングを支援します。

Document Understanding での事前アノテーションは、ドキュメントの種類のスキーマに基づいて、生成 AI モデルと専門化されたモデルを組み合わせて行われます。このスキーマでは、特定のドキュメントの種類から抽出するフィールドが明確に定義されています。

生成 AI によるアノテーションの仕組みと、プロジェクトでの効率的な使用方法について詳しくは、「ドキュメントのアノテーションを行う」をご覧ください。

生成 AI による抽出

生成 AI による抽出は Document Understanding^TM 内の重要な機能であり、生成 AI モデルの能力を利用します。これらのモデルはアクティビティを使用して設定し、主に実行時にデータ抽出に使用します。

生成 AI による抽出では、非構造化ドキュメントまたは半構造化ドキュメントから特定の情報を解読して抽出できます。たとえば、請求書をスキャンして、日付、請求金額、会社名などの詳細を正確に取得できます。これにより、さまざまな種類のドキュメントから情報を高速・効率的かつ非常に正確に収集できます。

対応機種

Generative Predefined プロジェクトで利用可能な生成 AI 抽出器は、以下の表に示すドキュメントに使用できます。

注: 現在、Automation Cloud^TM (公共部門向け) 環境 (FedRamp) では、Long Document Complex Layout 抽出器と Short Document Complex Layout 抽出器は利用できません。

表 1. 生成 AI 抽出器でサポートされるシナリオ
抽出器	推奨シナリオ	プロバイダー	利用可能なリージョン
Long Document Simple Layout Extractor	主にテキストと見出しで構成される長文のドキュメントにお勧めです。たとえば、賃貸契約書、マスターサービス契約などのドキュメントに使用できます。	Azure OpenAI	英国、オーストラリア、インド、カナダ
Long Document Complex Layout Extractor	画像、手書き文字、フォーム要素などの複雑なレイアウトや、フローティング吹き出しボックスなどの独自のレイアウトを含む長文のドキュメントにお勧めします。保険証券など、一般的に複雑なレイアウトである長文のドキュメントに使用できます。	Azure OpenAI	米国、欧州連合、日本、シンガポール
Short Document Complex Layout Extractor	画像、手書き文字、フォーム要素、またはフローティング吹き出しボックスなどの複雑なレイアウトを含む短いドキュメント (最大 20 ページ) にお勧めします。政府発行の ID や医療の問診票など、一般的に短いものの複雑なレイアウトであるドキュメントに使用できます。	Azure OpenAI	米国、欧州連合、日本、シンガポール

¹ マルチモーダルのサポートとは、テキスト、画像、手書き文字など、複数の種類のデータ入力を抽出可能であることを指します。

生成 AI による分類

生成 AI による分類では、AI モデルを使用して、ドキュメントがアップロードされたらすぐに自動的にドキュメントを分類します。

この自動分類プロセスでは、ML モデルを利用してドキュメントの内容を「読み取り」、そのコンテキストを理解し、定義済みのカテゴリに分類します。これにより、システムは複数の種類のドキュメントを効率的に処理および整理できます。

生成 AI による分類は、非構造化ドキュメントまたは半構造化ドキュメントを正確に分類することにより、ドキュメント処理ワークフローの改善、時間の節約、および全体的なドキュメント管理の強化を実現します。

生成 AI による検証

生成 AI による検証は Document Understanding の特徴的な機能で、検証プロセス中に重要な役割を果たします。この機能は主に、抽出ステップの後に、特殊なモデルを使用して行われた抽出の信頼度スコアを検証するために使用されます。

ドキュメント抽出の ML モデルの信頼度スコアが低い場合は、生成 AI による検証を使用して出力をクロスチェックします。この検証プロセスでは、特殊な ML モデルと生成 AI モデルの両方が連携して精度を保証します。

両方のモデルで同じ出力が生成される場合、人間による検証をバイパスできるため、検証の時間効率が大幅に向上します。このプロセスにより、ドキュメント検証ステップで貴重な時間を節約できるだけでなく、第 2 の生成 AI モデルを使用して出力を相互検証することでモデルのパフォーマンスも向上させ、より高いレベルの精度が保証されます。