- 概要
- Document Understanding Process
- クイック スタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- 概要
- Document Understanding - ML パッケージ
- DocumentClassifier (ドキュメント分類) - ML パッケージ
- OCR 機能を持つ ML パッケージ
- 1040 (米国の個人所得税申告書) - ML パッケージ
- 4506T (米国の納税申告証明依頼書) - ML パッケージ
- 990 (米国の所得税非課税団体申告書) - ML パッケージ (プレビュー)
- ACORD125 (企業向け保険契約申込書) - ML パッケージ
- ACORD126 (企業総合賠償責任保険) - ML パッケージ
- ACORD131 (アンブレラ/エクセス保険) - ML パッケージ
- ACORD140 (商業保険申込書の財物補償条項) - ML パッケージ
- ACORD25 (賠償責任保険証明書) - ML パッケージ
- Bank Statements (銀行預金残高証明書) - ML パッケージ
- BillsOfLading (船荷証券) - ML パッケージ
- Certificate of Incorporation (会社存在証明書) - ML パッケージ
- Certificate of Origin (原産地証明書) - ML パッケージ
- Checks (小切手) - ML パッケージ
- Children's Product Certificate (子供向け製品証明書) - ML パッケージ
- CMS 1500 (米国の医療保険請求フォーム) - ML パッケージ
- EU Declaration of Conformity (EU 適合宣言書) - ML パッケージ
- Financial Statements (財務諸表) - ML パッケージ
- FM1003 (米国の統一住宅ローン申請書) - ML パッケージ
- I9 (米国の就労資格証明書) - ML パッケージ
- ID Cards (ID カード) - ML パッケージ
- Invoices (請求書) - ML パッケージ
- InvoicesAustralia (請求書 - オーストラリア) - ML パッケージ
- InvoicesChina (請求書 - 中国) - ML パッケージ
- InvoicesIndia (請求書 - インド) - ML パッケージ
- InvoicesJapan (請求書 - 日本) - ML パッケージ
- Invoices Shipping (船積送り状) - ML パッケージ
- Packing Lists (梱包明細書) - ML パッケージ
- Passports (パスポート) - ML パッケージ
- Payslips (給与明細) - ML パッケージ
- Purchase Orders (発注書) - ML パッケージ
- Receipts (領収書) - ML パッケージ
- RemittanceAdvices (送金通知書) - ML パッケージ
- Utility Bills (公共料金の請求書) - ML パッケージ
- Vehicle Titles (自動車の権利書) - ML パッケージ
- W2 (米国の源泉徴収票) - ML パッケージ
- W9 (米国の納税申告書) - ML パッケージ
- その他のすぐに使える ML パッケージ
- パブリック エンドポイント
- ハードウェア要件
- パイプライン
- Document Manager
- OCR サービス
- ディープ ラーニング
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- アクティビティ
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
インストールして使用する
このページでは、Document Understanding のデプロイと構成の方法を説明します。さらに、Automation Suite の Document Understanding の使用方法に関する特別な指示についても説明します。
Document Understanding は AI Center に依存している製品であるため、Document Understanding をインストールする場合は、必ず AI Center もインストールする必要があります。
また、Document Understanding を使用する前に Orchestrator をアクティブ化する必要があります。
Document Understanding のインストールを開始する前に、シングルノードおよびマルチノードの Automation Suite のすべての要件を満たしていることをこちらで確認してください。
以下のいずれかのシナリオでは、Document Understanding に GPU を使用することを強くお勧めします。
-
AI Center で Document Understanding モデル (DocumentUnderstanding (ドキュメントの理解) - 一般モデル、Invoices (請求書)、Receipts (領収書) など) を再トレーニングする場合。
GPU でのトレーニングと比較して、CPU でのトレーニング速度は 5 倍から 7 倍遅く、モデルのパフォーマンスは低下します。
-
AI Center で UiPathDocumentOCR (非エッジ バージョン) を実行して 1 年間に 200 万ページを超えるページを処理する場合。
GPU を使用しない場合は、パフォーマンスの低下により、製品エクスペリエンスに影響が生じる可能性があります。
GPU のプロビジョニング方法について詳しくは、「GPU がサポートされた専用のエージェント ノードを追加する」をご覧ください。
Document Understanding を使用するには、SQL Server でフルテキスト検索機能が有効化されている必要があります。有効化されていない場合は、明示的なエラー メッセージが表示されずにインストールに失敗します。
オンライン環境での Document Understanding のインストールについて詳しくは、以下のページをご覧ください。
インストール プロセスは、他のサービスとほとんど同じです。唯一の要件は、AI Center と Document Understanding が有効化されていることです。
- 対話型インストーラーを使用する場合は、手順に従って両方の製品を選択してください。
-
対話型インストーラーを使用しない場合は、インストール前の構成ファイルまたはインストール後の ArgoCD で、AI Center と Document Understanding が有効化されていることを確認してください。
構成ファイルのサンプルについては「Document Understanding 構成ファイル」をご覧ください。
オフライン環境での Document Understanding のインストールについて詳しくは、以下のページをご覧ください。
オフライン環境で Document Understanding を正常にインストールするには、以下の変更が必要です。
-
インストール前の構成ファイルまたはインストール後の ArgoCD で、AI Center と Document Understanding が有効化されていることを確認します。手書き文字機能を使用する場合は、構成ファイルでこの機能が有効化されていることも確認します。
構成ファイルのサンプルについては「Document Understanding 構成ファイル」をご覧ください。
-
Document Understanding バンドルがダウンロードされ、インストールされていることを確認します。
Document Understanding バンドルのダウンロードとインストールについて詳しくは、「ML パッケージのオフライン インストール」をご覧ください。
Document Understanding 構成ファイルについては、こちらをご覧ください。
以下のパブリック URL を使用して、フォーム抽出器とインテリジェント キーワード分類器にアクセスします。
<FQDN>/du_/svc/formextractor
<FQDN>/du_/svc/intelligentkeywords
<FQDN>
プレースホルダーを実際の環境の情報に置き換えます。たとえば <FQDN>/du_/svc/formextractor
をワークフローで使用する場合は https://servicefabricserver.domain.com/du_/svc/formextractor
とします。
インストール後の操作として、Document Understanding を有効化または無効化できます。詳しくは、こちらをご覧ください。
OCR - 中国語、日本語、韓国語エンドポイントをオフライン環境で使用する場合は、こちらの手順に従ってオフライン バンドルをインストールし、バンドルのインストール後に ArgoCD で OCR を有効化する必要があります。
- Document Understanding で OCR - 中国語、日本語、韓国語 を使用する場合は、アクティビティが OCR のパブリック エンドポイントと Document Understanding の API キーを使用して設定されていることを確認してください。
- OCR - 中国語、日本語、韓国語は、Automation Suite にデプロイされた Document Understanding でのみサポートされています。外部の Orchestrator に接続された AI Center にデプロイされた Document Understanding ではサポートされていません。
ArgoCD で OCR を有効化するときに従う必要がある手順を以下に示します。
- ArgoCD にアクセスします。
- Document Understanding フレームワークを開きます。
- [Parameters] タブをクリックして、
du-cjk-ocr.enabled
に移動します。 - [Edit] ボタンをクリックし、値を
TRUE
に設定して、[Save] ボタンをクリックします。
{Cluster_FQDN}/du_/cjk-ocr/
として構築されます。
Document Understanding に関連する問題については、こちらをご覧ください。