- 概要
- Document Understanding Process
- クイックスタート チュートリアル
- フレームワーク コンポーネント
- ML パッケージ
- パイプライン
- データ マネージャー (Data Manager)
- OCR サービス
- OCR サービス
- Automation Suite にデプロイされた Document Understanding
- AI Center スタンドアロンにデプロイされた Document Understanding
- ライセンス
- 参照
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
OCR サービス
OCR サービスは以下の目的で使用されます。
- Document Manager にドキュメントをインポートしてデータのラベル付けを行う際に使用されます。この手順で使用できるエンジンは、UiPath Document OCR、Google Cloud Vision OCR、Microsoft Read OCR です。
- 実行時に RPA ワークフローからモデルを呼び出すとき。このステップで利用可能なエンジンは、上記をはじめとする UiPath RPA プラットフォームに統合されているすべてのエンジンと、Abbyy Finereader、Microsoft OCR (レガシ)、Microsoft Project Oxford OCR、Tesseract です。
運用環境では、ワークフロー内で [ドキュメントをデジタル化] アクティビティを使用して OCR を呼び出し、ML モデルを呼び出すアクティビティへの入力としてドキュメント オブジェクト モデルを渡すことをお勧めします。そのためには、[マシン ラーニング抽出器] アクティビティ (オフィシャル フィード) を使用する必要があります。
テストをすばやく簡単に実施するために AI Center ([設定] ウィンドウ) で OCR を直接設定することもできますが、これは運用環境のデプロイでは推奨されません。
以下の表に、Document Manager と AI Center の両方でサポートされている 6 種類の OCR エンジンの設定方法を示します。
ocr.method
引数は、AI Center の ML パッケージの作成ビューにある [OCR エンジン] ドロップダウンに対応しています。
OCR エンジン |
OCR メソッド |
OCR キー |
OCR の URL |
---|---|---|---|
UiPath |
UiPath Document OCR |
UiPath Automation Cloud Document Understanding の API キー Enterprise プラン |
|
|
Google Cloud Vision OCR |
GCP コンソールの API キー |
|
Microsoft Read 2.0 On-Prem |
Microsoft Read OCR |
None |
|
Microsoft Read 2.0 Azure |
Microsoft Read OCR |
Azure Portal からのリソースに対応する API キー |
|
Microsoft Read 3.2 On-Prem |
Microsoft Read OCR |
None |
|
Microsoft Read 3.2 Azure |
Microsoft Read OCR |
Azure Portal からのリソースに対応する API キー |
|