- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 1040 Schedule C (米国の個人所得税申告書のスケジュール C) - ML パッケージ
- 1040 Schedule D (米国の個人所得税申告書のスケジュール D) - ML パッケージ
- 1040 Schedule E (米国の個人所得税申告書のスケジュール E) - ML パッケージ
- 1040x (米国の個人所得税修正申告書) - ML パッケージ
- 3949a - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 709 (米国の贈与税申告書) - ML パッケージ
- 941x (米国の雇用主による四半期連邦税修正申告書) - ML パッケージ
- 9465 (米国の分割納付申請書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- Invoices Hebrew (請求書 - ヘブライ語) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- UB-04 (健康保険請求フォーム) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- ディープ ラーニング
- Insights のダッシュボード
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- アクティビティ
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
ハードウェア要件
GPU で Document UnderstandingTM ML パッケージを実行すると、パッケージに含まれる、トレーニング プロセスを加速させるための最適化機能が働きます。
結果として GPU と CPU でのトレーニング速度の差が縮まり、GPU でのトレーニング速度は CPU の 5 倍になりました (以前は 10 倍から 20 倍高速でした)。また、CPU で最大 5000 ページまでトレーニングできるようになりました (以前は最大 500 ページ)。
GPU で Document Understanding モデルのトレーニングを問題なく実行するには、11 GB 以上のビデオ RAM を搭載した GPU が必要です。
ML パッケージ、CUDA、GPU ドライバーの対応バージョンを確認するには、以下の表を使用します。
ML パッケージのバージョン |
CUDA のバージョン |
cuDNN のバージョン |
NVIDIA ドライバー (最も低い対応バージョン) |
ハードウェア世代 |
---|---|---|---|---|
2023.10 |
CUDA 11.8 または最新バージョン |
cuDNN 8.2.0 または最新バージョン |
R450.80.04 |
Ampere、Turing、Volta、Pascal、Maxwell、Kepler |
CUDA には後方互換性があるため、既存の CUDA アプリケーションは引き続き新しいバージョンの CUDA で使用できます。
互換性について詳しくは、こちらをご覧ください。
Document Understanding フレームワークを使用すると、OCR エンジンを使用してテキストを読み取り、ドキュメントを分類し、ドキュメントから情報を抽出できます。分類タスクや抽出タスクを CPU で実行する一方、OCR は GPU で実行することをお勧めします (ただし、GPU が利用できない場合のために CPU バージョンも用意されています)。
オンプレミスのデプロイは、Automation Suite とそのハードウェア要件を使用して行います。
抽出器と分類器の両方に同じ種類の仮想マシンを使用できます。唯一の違いはインフラストラクチャのサイズです。OCR エンジンは GPU の仮想マシンで使用することをお勧めします。ML パッケージ、CUDA のバージョン、GPU ドライバーのバージョンの相互運用性については、「相互運用性マトリクス」のセクションをご覧ください。
実際の例を見ながらハードウェア要件の理解を深めていきましょう。
ML パッケージ | ハードウェア要件 | 機能 |
---|---|---|
抽出器パッケージ (Invoices (請求書)、Receipts (領収書)、PurchaseOrders (発注書) など) | 2 コアの CPU と 8 GB の RAM を搭載した仮想マシンを使用 | トラフィックが完全に一定 (スパイクなし) だとすると、25,000 ページ/日または 500 万ページ/年を処理できます。 |
分類器パッケージ (DocumentClassifier (ドキュメント分類)) | 2 コアの CPU と 8 GB の RAM を搭載した仮想マシンを使用 | トラフィックが完全に一定 (スパイクなし) だとすると、40,000 ドキュメント/日または 800 万ドキュメント/年を処理できます。 |
OCR | CPU で実行する場合は、8 GB 以上の RAM が必要です。GPU で実行する場合、要件はありません。 | 50,000 ページ/日を処理できます。 |
OCR_CPU | 4 GB 以上の RAM が必要です。 | 50,000 ページ/日を処理できます。 |
例: 年に 1,000 万ページを処理する場合、抽出器用に 4 コアの CPU と 16 GB の RAM を備えた仮想マシンが 1 台、分類器用に同じ仕様の仮想マシンがもう 1 台、および OCR エンジン用に NVIDIA GPU コアを備えた 3 台目の仮想マシンが必要です。
抽出器と分類器の両方に 1 台の仮想マシンのみを使用することもできます。この場合、8 コアの CPU と 32 GB の RAM を持つ仮想マシンが 1 台必要です。