Document Understanding ガイド

デリバリー:

Automation Cloud Automation Cloud Public Sector Automation Suite Standalone

最終更新日時 2024年11月11日

ハードウェア要件

GPU で Document Understanding ML パッケージを実行すると、パッケージに含まれる、トレーニングプロセスを加速させるための最適化機能が働きます。

相互運用性マトリクス

結果として GPU と CPU でのトレーニング速度の差が縮まり、GPU でのトレーニング速度は CPU の 5 倍になりました (以前は 10 倍から 20 倍高速でした)。また、CPU で最大 5000 ページまでトレーニングできるようになりました (以前は最大 500 ページ)。

GPU で Document Understanding モデルのトレーニングを問題なく実行するには、11 GB 以上のビデオ RAM を搭載した GPU が必要です。

ML パッケージ、CUDA、GPU ドライバーの対応バージョンを確認するには、以下の表を使用します。

ML パッケージのバージョン	CUDA のバージョン	NVIDIA ドライバー (最も低い対応バージョン)	ハードウェア世代
2022.10	CIDA 11.3	R450.80.03	Ampere、Turing、Volta、Pascal、Maxwell、Kepler
2022.4	CUDA 11.3	R450.36.06	Ampere、Turing、Volta、Pascal、Maxwell、Kepler

CUDA には後方互換性があるため、既存の CUDA アプリケーションは引き続き新しいバージョンの CUDA で使用できます。

互換性について詳しくは、こちらをご覧ください。

CPU と GPU の使用

Document Understanding フレームワークを使用すると、OCR エンジンを使用してテキストを読み取り、ドキュメントを分類し、ドキュメントから情報を抽出できます。分類タスクや抽出タスクを CPU で実行する一方、OCR は GPU で実行することをお勧めします (ただし、GPU が利用できない場合のために CPU バージョンも用意されています)。

オンプレミスのデプロイは、Automation Suite とそのハードウェア要件を使用して行います。

抽出器と分類器の両方に同じ種類の仮想マシンを使用できます。唯一の違いはインフラストラクチャのサイズです。OCR エンジンは GPU 仮想マシンで使用することをお勧めします。ML パッケージ、CUDA のバージョン、GPU ドライバーのバージョンの相互運用性については、「相互運用性マトリクス」のセクションをご覧ください。

実際の例を見ながらハードウェア要件の理解を深めていきましょう。

サービス	ハードウェア要件	機能
抽出器	2 コアの CPU と 8 GB の RAM を搭載した仮想マシンを使用	トラフィックが完全に一定 (スパイクなし) だとすると、25,000 ページ/日または 500 万ページ/年を処理できます。
分類器	2 コアの CPU と 8 GB の RAM を搭載した仮想マシンを使用	トラフィックが完全に一定 (スパイクなし) だとすると、40,000 ドキュメント/日または 800 万ドキュメント/年を処理できます。
OCR	GPU 仮想マシンでの使用を推奨	50,000 ページ/日を処理できます。