- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- Document Understanding Digitizer
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- 認証を構成する
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- 検証ステーションを提示
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
OmniPage OCR
UiPath.OmniPage.Activities
OmniPage OCR エンジンを使用して、指定した UI 要素または画像から文字列とその情報を抽出します。OmniPage OCR は、OCR エンジンの実装を必要とするすべてのアクティビティにおいて、他の OCR エンジンに代わるものです。OmniPage OCR と併用できるアクティビティには、[OCR で検出したテキストをクリック]、[OCRで検出したテキスト上でホバー]、[OCR で検出したテキストをダブルクリック]、[OCRでテキストを取得]、[OCRでテキスト位置を探す]、[ドキュメントをデジタル化]、[CV 画面スコープ]、[CV テキストを取得] などがあります。
プロパティ パネル
共通
- 表示名 - アクティビティの表示名です。
入力
- 画像 - 処理対象の画像です。このフィールドでは
Image
型の変数のみがサポートされています。
その他
- プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
オプション
- エンジン パック - 画像処理にどの埋め込みエンジンを使用するかを指定します。 次の 2 つのオプションがあります。 基本 - 幅広い言語をサポートします。 拡張 - アジアの言語、アラビア語、タイ語、ヘブライ語、ベトナム語の追加サポートを含みます。 Basic パックで利用可能なすべての言語のリストは、このページの最後にあります。
注: 拡張エンジンを使用するためには、手動で Package Manager から現在のプロジェクトに UiPath.OmniPage.Bundle.Extended パッケージをインストールする必要があります。
- ExtractWords - 選択されていると、検出されたすべての単語の画面上の位置を抽出します。
- 言語 - OCR エンジンが使用する言語です。既定のオプションは [自動] で、言語が自動的に検出されることを意味します。コンマで区切って指定することで、複数の言語を使用できます。
注:
複数の言語を同時に設定できます。たとえば、英語とフランス語両方のコンテンツを含む画像を処理するために "eng,fra" と設定できます。
日本語、韓国語、中国語の言語設定では、専用の認識エンジンが呼び出されることに注意してください。 これらの言語の 1 つだけを一度に選択し、アジア以外の言語と組み合わせないでください。
アジア言語に埋め込まれた短い英語のテキストは、認識言語を英語に設定していない場合でも認識できます。
- プロファイル - OCR の読み取りを向上させる目的で、指定した画像または UI 要素の前処理プロファイルを選択します。 次のオプションが利用できます。
- なし - 前処理プロファイルを適用しません。これが既定のオプションです。
- 画面 - リモート デスクトップ アプリケーションに適した前処理です。
- スキャン - スキャンされたファイルに適した前処理です。
- レガシ - 画像の前処理にエンジンの既定の設定を使用します。
- Scale - 選択した UI 要素または画像の倍率です。値が高いほど画像が拡大されます。これにより OCR の読み取りを向上させることができるため、画像が小さい場合にお勧めします。倍率を下げたい場合は 0 ~ 1 の間の値も指定できます。既定値は 1 です。
手記: Studio v19.10 でパッケージ UiPath.OmniPage.Activities v1.8.0 からこの OCR アクティビティを使用する場合は、バージョン 2.0.1 以降の UiPath.CoreIPC パッケージをインストールします。重要: 画像のサイズが大きいと、拡大縮小率が 1 より大きい場合にエラーが発生することがあります。
出力
- 結果 - OCR エンジンによって抽出されたテキストとそれらの画面上の位置です。
KeyValuePair<Rectangle,String>
に格納されます。このフィールドでは、KeyValuePair<Rectangle,String>
のみがサポートされています。 - テキスト - String 型変数で格納され、OCR エンジンによって抽出されたテキストです。このフィールドでは
String
型の変数のみがサポートされています。
以下の表に、OmniPage OCR でサポートされているすべての言語と、対応する言語コードのリストを示します。
言語コード | |
---|---|
アフリカーンス語 |
AFR |
アルバニア語 |
SQI |
アイマラ語 |
AYM |
バスク語 |
EUS |
ベンバ語 |
BEM |
ブラックフット語 |
BLA |
ブラジル ポルトガル語 |
QBP |
ブルトン語 |
BRE |
ブゴトゥ語 |
BGT |
ブルガリア語 |
BUL |
ベラルーシ語 |
BEL |
カタロニア語 |
CAT |
チャモロ語 |
CHA |
チェチェン語 |
CHE |
コルシカ語 |
COS |
クロアチア語 |
HRV |
クロウ語 |
CRO |
チェコ語 |
CES |
デンマーク語 |
DAN |
オランダ語 |
NLD |
英語 |
ENG |
エスキモー (イヌイット) 語 |
QES |
エスペラント語 |
EPO |
エストニア語 |
EST |
フェロー語 |
FAO |
フィジー語 |
FIJ |
フィンランド語 |
FIN |
フランス語 |
FRA |
フリジア語 |
FRY |
フリウリ語 |
FUR |
ゲール語 (アイルランド) |
GLE |
ゲール語 (スコットランド) |
GLA |
ガリシア語 |
GLG |
ガンダ語 |
LUG |
ドイツ語 |
DEU |
ギリシャ語 |
ELL |
グアラニ語 |
GRN |
ハニ語 * |
HNI |
ハワイ語 |
HAW |
ハンガリー語 |
HUN |
アイスランド語 |
ISL |
イド語 |
IDO |
インドネシア語 |
IND |
インターリンガ語 |
INA |
イタリア語 |
ITA |
カシューブ語 |
CSB |
カワ語 * |
WBM |
キクユ語 |
KIK |
コンゴ語 |
KON |
クペレ語 |
KPE |
クルド語 * |
KUR |
ラテン語 |
LAT |
ラトビア語 |
LAV |
リトアニア語 |
LIT |
ルバ語 |
LUA |
ルクセンブルク語 |
LTZ |
マケドニア語 |
MKD |
マダガスカル語 |
MLG |
マレー語 |
MSA |
マニンカ語 |
MLQ |
マルタ語 |
MLT |
マオリ語 |
MRI |
マヤ語 |
MYN |
モン語 * |
HMN |
ミナンカバウ語 |
分 |
モホーク語 |
MOH |
モルダビア語 |
MOL |
ナワトル語 |
NAH |
ノルウェー語 |
NOR |
ニャンジャ語 |
NYA |
西洋語 |
OCC |
オジブウェー語 |
OJI |
パピアメント語 |
PAP |
ピジン英語 |
TPI |
ポーランド語 |
POL |
ポルトガル語 |
POR |
プロヴァンス語 |
PRV |
ケチュア語 |
QUE |
ラエティア語 |
ROH |
ルーマニア語 |
RON |
ロマ語 |
ROM |
ルワンダ |
KIN |
ルンディ語 |
実行 |
ロシア語 |
RUS |
サーミ語 |
SMI |
ルレ サーミ語 |
SMJ |
北サーミ語 |
SME |
南サーミ語 |
SMA |
サモア語 |
SMO |
サルデーニャ語 |
SRD |
セルビア語 |
SRP |
セルビア語、ラテン文字 |
QSL |
ショナ語 |
SNA |
スー語 |
DAK |
スロバキア語 |
SLK |
スロベニア語 |
SLV |
ソマリ語 |
SOM |
ソルブ語 (ヴェンド語) |
WEN |
ソト語 |
SOT |
スペイン語 |
SPA |
スンダ語 |
日 |
スワヒリ語 |
SWA |
スワジ語 |
SSW |
スウェーデン語 |
SWE |
タガログ語 |
TGL |
タヒチ語 |
TAH |
Pirez |
QTI |
トンガ語 |
TON |
ツワナ語 |
TSN |
チュニア語 * |
TUG |
トルコ語 |
TUR |
ウクライナ語 |
UKR |
ヴィサヤ語 |
QIS |
ウェールズ語 |
CYM |
ウォロフ語 |
WOL |
コサ語 |
XHO |
サポテック語 |
ZAP |
ズールー語 |
ZUL |
= この言語は、ラテン アルファベットを使用して記述されている場合にのみ処理できます。 |
言語コード | |
---|---|
基本パックに含まれるすべての言語 | |
日本語 |
JPN |
簡体字中国語 |
QCS |
繁体字中国語 |
QCT |
韓国語 |
KOR |
タイ語 |
THA |
アラビア語 |
ARA |
ヘブライ語 |
HEB |
ベトナム語 (ラテン文字) |
VIE |