- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- Document Manager
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ディープ ラーニング
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Document Understanding ガイド
インストールして使用する
このページでは、Document UnderstandingTM のデプロイと構成の方法を説明します。さらに、Automation Suite の Document UnderstandingTM の使用方法に関する特別な指示についても説明します。
Document Understanding は AI Center に依存している製品であるため、Document Understanding をインストールする場合は、必ず AI Center もインストールする必要があります。
また、Document Understanding を使用する前に Orchestrator をアクティブ化する必要があります。
Document Understanding のインストールを開始する前に、シングルノードおよびマルチノードの Automation Suite のすべての要件を満たしていることをこちらで確認してください。
以下のいずれかのシナリオでは、Document Understanding に GPU を使用することを強くお勧めします。
-
AI Center で Document Understanding モデル (DocumentUnderstanding (ドキュメントの理解) - 一般モデル、Invoices (請求書)、Receipts (領収書) など) を再トレーニングする場合。
GPU でのトレーニングと比較して、CPU でのトレーニング速度は 5 倍から 7 倍遅く、モデルのパフォーマンスは低下します。
-
AI Center で UiPathDocumentOCR (非エッジ バージョン) を実行して 1 年間に 200 万ページを超えるページを処理する場合。
GPU を使用しない場合は、パフォーマンスの低下により、製品エクスペリエンスに影響が生じる可能性があります。
GPU のプロビジョニング方法について詳しくは、「GPU がサポートされた専用のエージェント ノードを追加する」をご覧ください。
Document Understanding を使用するには、SQL Server でフルテキスト検索機能が有効化されている必要があります。有効化されていない場合は、明示的なエラー メッセージが表示されずにインストールに失敗します。
Document Understanding 構成ファイルについては、こちらをご覧ください。
以下のパブリック URL を使用して、フォーム抽出器とインテリジェント キーワード分類器にアクセスします。
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
プレースホルダーを実際の環境の情報に置き換えます。たとえば <FQDN>/du_/svc/formextractor
をワークフローで使用する場合は https://servicefabricserver.domain.com/du_/svc/formextractor
とします。
インストール後の操作として、Document Understanding を有効化または無効化できます。詳しくは、こちらをご覧ください。
OCR - 中国語、日本語、韓国語エンドポイントをオフライン環境で使用する場合は、こちらの手順に従ってオフライン バンドルをインストールし、バンドルのインストール後に ArgoCD で OCR を有効化する必要があります。
- Document Understanding で OCR - 中国語、日本語、韓国語 を使用する場合は、アクティビティが OCR のパブリック エンドポイントと Document Understanding の API キーを使用して設定されていることを確認してください。
- OCR - 中国語、日本語、韓国語は、Automation Suite にデプロイされた Document Understanding でのみサポートされています。外部の Orchestrator に接続された AI Center にデプロイされた Document Understanding ではサポートされていません。
ArgoCD で OCR を有効化するときに従う必要がある手順を以下に示します。
- ArgoCD にアクセスします。
- Document Understanding フレームワークを開きます。
- [Parameters] タブをクリックして、
du-cjk-ocr.enabled
に移動します。 - [Edit] ボタンをクリックし、値を
TRUE
に設定して、[Save] ボタンをクリックします。
{Cluster_FQDN}/du_/cjk-ocr/
として構築されます。
Document Understanding に関連する問題については、こちらをご覧ください。