通知を受け取る

UiPath Document Understanding

UiPath Document Understanding

OCR サービス

OCR サービスについて

OCR サービスは以下の目的で使用されます。

  • Data Manager にドキュメントをインポートするのに、データをラベル付けするとき。このステップで利用可能なサービスは、UiPath Document OCR (クラウドまたはオンプレミスでは無料)、Google Cloud OCR (クラウドのみ)、Microsoft Read OCR (クラウドまたはオンプレミス) です。
  • 実行時に RPA ワークフローからモデルを呼び出すとき。このステップで利用可能なサービスは、上記をはじめとする UiPath RPA プラットフォームに統合されているすべての OCR エンジンと、Abbyy Finereader、Microsoft OCR (レガシー)、Microsoft Project Oxford OCR、Tesseract です。

In production, we recommend calling the OCR using the Digitize Document activity in your workflow and passing the Document Object Model as input to the activity calling the ML model. For this purpose, you need to use the Machine Learning Extractor activity (Official feed).

テストをすばやく簡単に実施するために AI Center ([設定] ウィンドウ) で OCR を直接設定することもできますが、これは運用環境のデプロイでは推奨されません。

オンプレミスのデプロイ オプション

UiPath Document OCR は、以下の 4 つの方法でデプロイできます。

  • On the robot using a LocalServer activity package and the UiPath.OCR.Activities package version 3.1.0-preview or later - requires no internet access and no additional hardware but the Robot machine needs a CPU with AVX2 support.
    • これが既定のデプロイ方法になります。ボリュームが大きい場合は、さらにロボットを追加できます。
  • Linux GPU マシン上で動作するスタンドアロンの Docker コンテナー (以下を参照 - 100 万ページ/年を超えるボリュームの場合に推奨) - ライセンス付与/測定のためにインターネットへのアクセスが必要
    • 年あたり 200 から 300 万ページを超える大きなボリュームの場合には、これが既定のデプロイ方法になります。
  • Linux CPU マシン上で動作するスタンドアロン Docker コンテナー (以下を参照) - ライセンス付与/測定のためにインターネットへのアクセスが必要
    • AVX2 サポートのない CPU でロボット端末が動作する、または GPU を取得できないといった、特殊な状況でのみこの方法でデプロイします。
  • ML Skill in AI Center (see ML Packages section) (GPU strongly recommended) - Internet access not required on premises if AI Center installation is airgapped

要件

このセクションでは、OCR エンジンをインストールする場合のハードウェア要件とソフトウェア要件を詳しく説明します。

ハードウェア要件


必要なマシン: クラウド内の仮想マシンまたはオンプレミス ボックスまたはノート PC
オペレーティング システム: Windows (Windows 10) または Linux (Ubuntu/CentOS/RedHat)
コンピューティング エンジン: CPU または GPU
OCR: UiPath Document OCR CPU または UiPath Document OCR GPU

CPU Cores

RAM (GB)

Video RAM (GB)

HDD (GB)

UiPath CPU

8

8

50

UiPath GPU

1

4

8

50

ソフトウェア要件


The software requirements for OCR Engines are the same as for Data Manager.

ネットワーク構成


Data Manager needs access to OCR engine <IP>:<port_number>. OCR engine might be UiPath Document OCR on-premises, Google Cloud Vision OCR, Microsoft Read Azure or Microsoft Read on-premises.

Robots need access to OCR <IP>:<port_number>. Same OCR options as above.

OCR エンジンは、Azure 内で UiPath がホストするライセンス サーバー (ポート 443) にアクセスできる必要があります。

最小トライアルまたは概念実証の設定


トレーニング済みのすぐに使用できるモデルだけを提供する場合は、Windows 10 のノート PC で OCR エンジンを実行できます。Docker Desktop で 8G の RAM が利用可能であることを確認してください。

少量のデータ (100 件以下のドキュメント) のデモとしてカスタム モデルのトレーニングを試す場合は、4GB の RAM を上限とする環境で OCR エンジンを実行できます。このような少量のデータの場合は、OCR エンジンに対応する GPU が不要になる可能性があります。

前提条件

OCR エンジンは、Docker 上で実行されるコンテナー化されたアプリケーションです。OCR エンジンをオンプレミスの AI Center と同じマシンで実行することはできません。別々のマシンで実行するために、以下の前提条件インストーラー コマンドを使用して Docker を設定し、任意で NVIDIA ドライバーを設定できます。これらのスクリプトは、AI Center をインストールするマシンで実行しないでください。

The prerequisites for OCR Engines are the same as for Data Manager.

(任意) GPU マシンのインストール


Linux

Run this command:

curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env gpu

On some systems running the command twice or a system reboot might be required to install all requirements.
Azure Specific: In order to use the NV-series virtual machines you need to either install the NVIDIA driver before executing the above command, or you can use a Driver Extension from Azure to install the necessary NVIDIA driver according to that tier GPU model.

Azure VM

Azure の VM にインストールする場合は、以下のコマンドを使用します。

curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env gpu --cloud azure

インストール

UiPath Document OCR


UiPath Document OCR は UiPath 独自の OCR テクノロジーであり、ラテン文字の言語、すなわち英語、フランス語、ドイツ語、イタリア語、ポルトガル語、ルーマニア語、スペイン語で使用される文字をサポートしています。他の言語のテキストは、アクセント記号なしで認識されます。たとえば、ポーランド語の「Ł」は「L」と認識されます。UiPath Document OCR を使用して処理されたページは、Document Understanding の Enterprise ライセンスとともに購入されるページ クォータには含まれません。したがって、UiPath Document OCR は無料で使用できます。

UiPath Document OCR は、以下の種類のデプロイで利用可能です。

  • cloud public URLs - more details on the Public Endpoints page.
  • オンプレミスのスタンドアロン Docker コンテナー (インターネットへのアクセスが必要)
  • オンプレミス AI Center の標準デプロイでの ML スキルとしてのオンプレミス (インターネットへのアクセスが必要)
  • オンプレミス AI Center のエアギャップ デプロイでの ML スキルとしてのオンプレミス (インターネットへのアクセスは不要)
  1. UiPath Document OCR のスタンドアロン Docker コンテナーをインストールするには、以下のコマンドを実行します。
docker login aiflprodweacr.azurecr.io -u *** -p **
docker pull aiflprodweacr.azurecr.io/uipath-ocr:latest
  1. CPU を使用して実行します。
docker run -d -p 5000:80 aiflprodweacr.azurecr.io/uipath-ocr:latest LicenseAgreement=accept
  1. GPU を使用して実行します。
docker run -d -p 5000:80 --gpus all aiflprodweacr.azurecr.io/uipath-ocr:latest LicenseAgreement=accept
  1. AI Center で新しい ML パッケージを作成する場合は、画面下部に任意の OCR 設定セクションがあります。このセクションで、サーバー側の OCR エンジンの種類、OCR URL、および OCR キーを定義できます。OCR キーは、Automation Cloud アカウントの [ライセンス] セクションから取得する API キーです。この OCR 設定は、[サーバー側の OCR を使用] ボックスをチェックした場合に [マシン ラーニング抽出器] アクティビティによって使用されます。既定では、このボックスはオフになっています。その場合、抽出器は [ドキュメントをデジタル化] アクティビティで OCR を使用します。

🚧

AI Center と同じマシンでの実行

UiPath Document OCR コンテナーをオンプレミスの AI Center と同じマシンで実行することはできません。

Google Cloud OCR


The endpoint can be obtained from the Google Cloud Platform documentation. The ApiKey can be obtained from your Google Cloud Platform Console if you have a Google Cloud Vision service in your subscription.

Microsoft Read


🚧

Warning

Azure とオンプレミスの両方のコンテナー エンドポイントに適用できます。

Azure サービスの場合は、エンドポイントAPI キーの両方を入力する必要があります。

オンプレミスのコンテナー エンドポイントの場合、API キーは必要ありません。

Data Manager および AI Center Document Understanding ML パッケージで OCR サービスを構成する

以下の表に、サポートされている 6 種類の OCR エンジンを Data Manager と AI Center の両方で設定する方法を示します。

🚧

Warning

★削除★ ocr.method argument corresponds to the OCR Engine dropdown in the ML Package creation view in AI Center.

OCR Engine

ocr.method

ocr.key

ocr.url

UiPath

uipath

UiPath Automation Cloud
Document Understanding API Key
Enterprise Plan

http://<IP_addr>:<port_number>

Google

google

GCP Console API Key

https://vision.googleapis.com/v1/images:annotate

Microsoft Read 2.0 On-Prem

microsoft

None

http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

Microsoft Read 2.0 Azure

microsoft

API Key for your resource from Azure Portal

<Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze

Microsoft Read 3.2 On-Prem

microsoft

None

http://<IP_addr>:<port_number>/vision/v3.2/read/analyze

Microsoft Read 3.2 Azure

microsoft

API Key for your resource from Azure Portal

<Azure_resource_Endpoint>/vision/v3.2/read/analyze

5 か月前に更新


OCR サービス


改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。