通知を受け取る

UiPath Document Understanding

UiPath Document Understanding

OCR サービス

OCR サービスについて

OCR サービスは以下の目的で使用されます。

  • Data Manager にドキュメントをインポートするのに、データをラベル付けするとき。このステップで使用できるサービスは、UiPath Document OCR (クラウドまたはオンプレミスでは無料)、Google Cloud OCR (クラウドのみ)、Microsoft Read OCR (クラウドまたはオンプレミス)、Omnipage (オンプレミスのみ) です。
  • 実行時に RPA ワークフローからモデルを呼び出すとき。このステップで利用可能なサービスは、上記をはじめとする UiPath RPA プラットフォームに統合されているすべての OCR エンジンと、Abbyy Finereader、Microsoft OCR (レガシー)、Microsoft Project Oxford OCR、Tesseract です。

In production, we recommend calling the OCR using the Digitize Document activity in your workflow and passing the Document Object Model as input to the activity calling the ML model. For this purpose, you need to use the Machine Learning Extractor activity (Official feed).

テストをすばやく簡単に実施するために AI Center ([設定] ウィンドウ) で OCR を直接設定することもできますが、これは運用環境のデプロイでは推奨されません。

オンプレミスのデプロイ オプション

UiPath Document OCR では、3 つのデプロイ オプションを利用できます。

  • On the robot using a LocalServer activity package and the UiPath.OCR.Activities package version 3.1.0-preview or later - requires no internet access and no additional hardware but the Robot machine needs a CPU with AVX2 support.
    • これが既定のデプロイ方法になります。ボリュームが大きい場合は、さらにロボットを追加できます。
  • Linux GPU マシン上で動作するスタンドアロンの Docker コンテナー (以下を参照 - 100 万ページ/年を超えるボリュームの場合に推奨) - ライセンス付与/測定のためにインターネットへのアクセスが必要
    • 年あたり 200 から 300 万ページを超える大きなボリュームの場合には、これが既定のデプロイ方法になります。
  • Linux CPU マシン上で動作するスタンドアロン Docker コンテナー (以下を参照) - ライセンス付与/測定のためにインターネットへのアクセスが必要
    • AVX2 サポートのない CPU でロボット端末が動作する、または GPU を取得できないといった、特殊な状況でのみこの方法でデプロイします。
  • ML Skill in AI Center (see ML Packages section) (GPU strongly recommended) - Internet access not required on premises if AI Center installation is airgapped

要件

このセクションでは、OCR エンジンをインストールする場合のハードウェア要件とソフトウェア要件を詳しく説明します。

ハードウェア要件


必要なマシン: クラウド内の仮想マシンまたはオンプレミス ボックスまたはノート PC
オペレーティング システム: Windows (Windows 10) または Linux (Ubuntu/CentOS/RedHat)
コンピューティング エンジン: CPU または GPU
OCR: UiPath Document OCR CPU または UiPath Document OCR GPU または OmniPage OCR CPU

CPU Cores

RAM (GB)

Video RAM (GB)

HDD (GB)

UiPath CPU

8

8

50

UiPath GPU

1

4

8

50

OmniPage CPU

1

2

30

ソフトウェア要件


The software requirements for OCR Engines are the same as for Data Manager.

ネットワーク構成


Data Manager needs access to OCR engine <IP>:<port_number>. OCR engine might be UiPath Document OCR on-premises, Omnipage OCR on-premises, Google Cloud Vision OCR, Microsoft Read Azure, Microsoft Read on-premises.

Robots need access to OCR <IP>:<port_number>. Same OCR options as above, except for Omnipage, which is available in the Robots directly as an Activity Pack.

OCR エンジンは、Azure 内で UiPath がホストするライセンス サーバー (ポート 443) にアクセスできる必要があります。

最小トライアルまたは概念実証の設定


トレーニング済みのすぐに使用できるモデルだけを提供する場合は、Windows 10 のノート PC で OCR エンジンを実行できます。Docker Desktop で 8G の RAM が利用可能であることを確認してください。

少量のデータ (100 件以下のドキュメント) のデモとしてカスタム モデルのトレーニングを試す場合は、4GB の RAM を上限とする環境で OCR エンジンを実行できます。このような少量のデータの場合は、OCR エンジンに対応する GPU が不要になる可能性があります。

前提条件

OCR エンジンは、Docker 上で実行されるコンテナー化されたアプリケーションです。OCR エンジンをオンプレミスの AI Center と同じマシンで実行することはできません。別々のマシンで実行するために、以下の前提条件インストーラー コマンドを使用して Docker を設定し、任意で NVIDIA ドライバーを設定できます。これらのスクリプトは、AI Center をインストールするマシンで実行しないでください。

The prerequisites for OCR Engines are the same as for Data Manager.

(任意) GPU マシンのインストール


Linux

Run this command:

curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env gpu

On some systems running the command twice or a system reboot might be required to install all requirements.
Azure Specific: In order to use the NV-series virtual machines you need to either install the NVIDIA driver before executing the above command, or you can use a Driver Extension from Azure to install the necessary NVIDIA driver according to that tier GPU model.

Azure VM

Azure の VM にインストールする場合は、以下のコマンドを使用します。

curl -fsSL https://raw.githubusercontent.com/UiPath/Infrastructure/master/ML/du_prereq_installer.sh | sudo bash -s -- --env gpu --cloud azure

インストール

UiPath ドキュメント OCR (プレビュー)


UiPath Document OCR は UiPath 独自の OCR テクノロジーであり、ラテン文字の言語、すなわち英語、フランス語、ドイツ語、イタリア語、ポルトガル語、ルーマニア語、スペイン語で使用される文字をサポートしています。他の言語のテキストは、アクセント記号なしで認識されます。たとえば、ポーランド語の「Ł」は「L」と認識されます。UiPath Document OCR を使用して処理されたページは、Document Understanding の Enterprise ライセンスとともに購入されるページ クォータには含まれません。したがって、UiPath Document OCR は無料で使用できます。

UiPath Document OCR is available both on-premises as a docker container and in the cloud as a cloud service API with the URL: https://du.uipath.com/ocr. See the full description of the available URLs on the Public Endpoints page.

  1. UiPath Document OCR をインストールするには、以下のコマンドを実行します。
docker login aiflprodweacr.azurecr.io -u *** -p **
docker pull aiflprodweacr.azurecr.io/uipath-ocr:latest
  1. CPU を使用して実行します。
docker run -d -p 5000:80 aiflprodweacr.azurecr.io/uipath-ocr:latest LicenseAgreement=accept
  1. GPU を使用して実行します。
docker run -d -p 5000:80 --gpus all aiflprodweacr.azurecr.io/uipath-ocr:latest LicenseAgreement=accept
  1. AI Center で新しい ML パッケージを作成する場合は、画面下部に OCR 設定セクションがあります。このセクションで、OCR エンジンの種類、OCR URL、および OCR キーを定義できます。OCR キーは、Automation Cloud アカウントの [ライセンス] セクションから取得する API キーです。

🚧

AI Fabric と同じマシンでの実行

UiPath Document OCR コンテナーおよび OmniPage OCR コンテナーは、オンプレミスの AI Center と同じマシンでは実行できません。

OmniPage OCR


Omnipage Docker コンテナーは、Data Manager でのみ使用することを意図しています。これは、UiPath Document OCR でまだサポートされていない言語で、ドキュメントをインポートするためです。

以下のコマンドを実行します。

docker login aiflprodweacr.azurecr.io -u *** -p ***
docker pull aiflprodweacr.azurecr.io/omnipage-ocr:latest
docker run -d -p 5100:80 aiflprodweacr.azurecr.io/omnipage-ocr:latest LicenseAgreement=accept

Google Cloud OCR


The endpoint can be obtained from the Google Cloud Platform documentation. The ApiKey can be obtained from your Google Cloud Platform Console if you have a Google Cloud Vision service in your subscription.

Microsoft Read


🚧

Warning

Azure とオンプレミスの両方のコンテナー エンドポイントに適用できます。

Azure サービスの場合は、エンドポイントAPI キーの両方を入力する必要があります。

オンプレミスのコンテナー エンドポイントの場合、API キーは必要ありません。

Data Manager および AI Center Document Understanding ML パッケージで OCR サービスを構成する

以下の表に、サポートされている 6 種類の OCR エンジンを Data Manager と AI Center の両方で設定する方法を示します。

🚧

Warning

★削除★ ocr.method argument corresponds to the OCR Engine dropdown in the ML Package creation view in AI Center.

OCR Engine

ocr.method

ocr.key

ocr.url

UiPath

uipath

UiPath Automation Cloud
Document Understanding API Key
Enterprise Plan

http://<IP_addr>:<port_number>

OmniPage

omnipage

UiPath Automation Cloud
Document Understanding API Key
Enterprise Plan

http://<IP_addr>:<port_number>

Google

google

GCP Console API Key

https://vision.googleapis.com/v1/images:annotate

Microsoft Read 2.0 On-Prem

microsoft

None

http://<IP_addr>:<port_number>/vision/v2.0/read/core/Analyze

Microsoft Read 2.0 Azure

microsoft

API Key for your resource from Azure Portal

<Azure_resource_Endpoint>/vision/v2.0/read/core/asyncBatchAnalyze

Microsoft Read 3.1 On-Prem

microsoft

None

http://<IP_addr>:<port_number>/vision/v3.1/read/analyze

Microsoft Read 3.1 Azure

microsoft

API Key for your resource from Azure Portal

<Azure_resource_Endpoint>/vision/v3.1/read/analyze

5 か月前に更新


OCR サービス


改善の提案は、API リファレンスのページでは制限されています

改善を提案できるのは Markdown の本文コンテンツのみであり、API 仕様に行うことはできません。