Document Understanding - トラフィック制限

document-understanding

latest

false

Document Understanding クラシックユーザーガイド

重要 :

このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。新しいコンテンツの翻訳は、およそ 1 ～ 2 週間で公開されます。

トラフィック制限

Document Understanding の抽出および分類 ML パッケージのトラフィックとコンピューティングの制限 (ドキュメントサイズ、ページ数、スループットの制約を含む)

抽出および分類 ML パッケージは、大量のコンピューティングリソースを必要とします。これはつまり、ドキュメントのサイズや 1 分あたりのドキュメント数のスループットが大きくなるにつれて、いくつかの制限が発生することを意味します。

100 ページを超えるドキュメントでは、計算または待機時間に関する制限が発生し、ML スキルが不安定になったり、HTTP エラーが返されたりする可能性があります。ドキュメントのテキスト密度や画像の解像度の範囲は動的かつ広く、テキスト密度 (ページあたりの単語数) は必要な計算資源と RAM リソース、および待機時間に影響するため、正確な上限値を定義するのは困難です。さらに、ML スキルの能力は、デプロイに使用されるハードウェアのサイズによって異なります。これは AI Center によって制御されます。たとえば、ML スキルは GPU または CPU にデプロイできます。ハードウェアの種類は、ML スキルの能力と処理速度に大きく影響します。

スループットに関しては、ML スキルが一度に処理できるドキュメントは 1 つだけです。つまり、次のドキュメントを送信するには、そのドキュメントの処理が完了するまで待つ必要があります。ドキュメントが大きいほど、時間単位あたりに処理できるドキュメント数は少なくなります。

これらの問題を軽減するため、非常に大きなドキュメントを処理する必要がある場合は、対象のデータがより小さなページのサブセットに含まれているケースが多いということ、およびインテリジェントキーワード分類器を使用してこのサブセットを分割できる可能性があることに留意します。これは非常に効果的な戦略かもしれません。ML スキルのエラー/失敗/タイムアウトをなくし、スループットと応答性を向上させ、偽陽性を減らして検出精度を上げ、AI ユニットの不必要な消費をなくしてコストを削減できるからです。

このページは役に立ちましたか?

前へパブリックエンドポイント

次へOCR の設定