Document Understanding

document-understanding

2024.10

false

Document Understanding API ガイド

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

概要

RPA によるアプローチの代替手段としての Document Understanding API の機能 (デジタル化、分類、抽出のエンドポイントなど)

Document Understanding^TM API は、RPA によるアプローチの代替手段として使用できます。API 呼び出しを開始すると、以下の操作を行うことができます。

ユースケースに応じて、非同期 API または同期 API を選択できます。

非同期 API は、次の場合に使用します。

5 ページを超える、サイズの大きいドキュメントを処理する必要がある場合。
複数の操作を同時に処理する必要がある場合。非同期 API では同時処理が可能なので、アイドル時間を回避してシステムのスループットを向上できます。つまり、ドキュメントを送信したら、応答を待たずに別のタスクに進むことができます。
処理が必要なデータセットが大きく、かなりの時間がかかる場合。

同期 API は、次の場合に使用します。

非同期 API には、次のステータスが適用されます。

分類および抽出 API は、同期消費および非同期消費のどちらでも利用可能です。同期消費では、複数ページのドキュメントがサポートされます (最大 5 ページ)。一方、非同期消費では、start メソッドを介して要求を送信し、ポーリングを介して結果を取得します。

Document Understanding API を使用して、RPA の場合と同じ方法で機能にアクセスします。API を使用する場合、RPA などの任意のプログラミング/スクリプト言語を使用できます (呼び出しは HTTP を使用して実行するため)。

API には Swagger を介してアクセスできます。Document Understanding^TM サービスのツールバーで、[Rest API] ドロップダウンの [Framework] をクリックします。

機能を試す場合は、Swagger をサンドボックスとして使用します。

定義済みのモデルまたはカスタムビルドモデルを使用するよう選択できます。カスタムビルドモデルは、Document Understanding の使用時にユーザーが作成したモデルです。一方で、定義済みのモデルは既に使用できる状態になっており、定義済みのすぐに使えるモデルが含まれています。

重要:

Digitization エンドポイントの呼び出しにより受信したデータは、7 日間保持されます。この間は、受信したドキュメント ID でこの結果を利用できます。その後は、新しいデジタル化要求を送信する必要があります。

重要:

非同期の Classification エンドポイントおよび Extraction エンドポイントの呼び出しにより受信したデータは、1 日間 (24 時間) 保持されます。

操作に応じて、Document Understanding API 呼び出しでは次のクラスが使用されます。

次へ認証と認可