activities
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。
UiPath logo, featuring letters U and I in white

Document Understanding アクティビティ

最終更新日時 2024年12月5日

OmniPage OCR

UiPath.OmniPage.Activities

大事な: 手書き文字認識は、文字が関連付けられていない手書きテキストに対してのみ機能します。 ドキュメントの理想的なサイズは 25 から 45 ピクセルです。

説明

OmniPage OCR エンジンを使用して、指定した UI 要素または画像から文字列とその情報を抽出します。OmniPage OCR は、OCR エンジンの実装を必要とするすべてのアクティビティにおいて、他の OCR エンジンに代わるものです。OmniPage OCR と併用できるアクティビティには、[OCR で検出したテキストをクリック][OCRで検出したテキスト上でホバー][OCR で検出したテキストをダブルクリック][OCRでテキストを取得][OCRでテキスト位置を探す][ドキュメントをデジタル化][CV 画面スコープ][CV テキストを取得] などがあります。

注: UiPath.OmniPage.Activities パッケージ v1.9.0 以降を .NET 5 (Core) にアップグレードしました。このパッケージを Windows レガシ以外のワークフローで実行する場合は、お使いのマシンに .NET5 Framework がインストールされている必要があります。
注: [OmniPage OCR] アクティビティは UiPath.IntelligentOCR.Activities パッケージ V2.0.0 以降に対応しており、任意の OCR に関連して使用できます。

プロジェクトの対応 OS

Windows - レガシ | Windows

構成

プロパティ パネル

共通

  • 表示名 - アクティビティの表示名です。

入力

  • 画像 - 処理対象の画像です。このフィールドでは Image 型の変数のみがサポートされています。

その他

  • プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。

オプション

  • エンジン パック - 画像処理にどの埋め込みエンジンを使用するかを指定します。 次の 2 つのオプションがあります。 基本 - 幅広い言語をサポートします。 拡張 - アジアの言語、アラビア語、タイ語、ヘブライ語、ベトナム語の追加サポートを含みます。 Basic パックで利用可能なすべての言語のリストは、このページの最後にあります。
    注: 拡張エンジンを使用するためには、手動で Package Manager から現在のプロジェクトに UiPath.OmniPage.Bundle.Extended パッケージをインストールする必要があります。
  • ExtractWords - 選択されていると、検出されたすべての単語の画面上の位置を抽出します。
  • 言語 - OCR エンジンが使用する言語です。既定のオプションは [自動] で、言語が自動的に検出されることを意味します。コンマで区切って指定することで、複数の言語を使用できます。
    注:

    複数の言語を同時に設定できます。たとえば、英語とフランス語両方のコンテンツを含む画像を処理するために "eng,fra" と設定できます。

    日本語、韓国語、中国語の言語設定では、専用の認識エンジンが呼び出されることに注意してください。 これらの言語の 1 つだけを一度に選択し、アジア以外の言語と組み合わせないでください。

    アジア言語に埋め込まれた短い英語のテキストは、認識言語を英語に設定していない場合でも認識できます。

  • プロファイル - OCR の読み取りを向上させる目的で、指定した画像または UI 要素の前処理プロファイルを選択します。 次のオプションが利用できます。
    • なし - 前処理プロファイルを適用しません。これが既定のオプションです。
    • 画面 - リモート デスクトップ アプリケーションに適した前処理です。
    • スキャン - スキャンされたファイルに適した前処理です。
    • レガシ - 画像の前処理にエンジンの既定の設定を使用します。
  • Scale - 選択した UI 要素または画像の倍率です。値が高いほど画像が拡大されます。これにより OCR の読み取りを向上させることができるため、画像が小さい場合にお勧めします。倍率を下げたい場合は 0 ~ 1 の間の値も指定できます。既定値は 1 です。
    手記: Studio v19.10 でパッケージ UiPath.OmniPage.Activities v1.8.0 からこの OCR アクティビティを使用する場合は、バージョン 2.0.1 以降の UiPath.CoreIPC パッケージをインストールします。
    重要: 画像のサイズが大きいと、拡大縮小率が 1 より大きい場合にエラーが発生することがあります。

出力

  • 結果 - OCR エンジンによって抽出されたテキストとそれらの画面上の位置です。 KeyValuePair<Rectangle,String> に格納されます。このフィールドでは、KeyValuePair<Rectangle,String> のみがサポートされています。
  • テキスト - String 型変数で格納され、OCR エンジンによって抽出されたテキストです。このフィールドでは String 型の変数のみがサポートされています。

サポートされている言語

以下の表に、OmniPage OCR でサポートされているすべての言語と、対応する言語コードのリストを示します。

表 1. OmniPage OCR でサポートされている言語と言語コード - 基本パックの言語
 

言語コード

アフリカーンス語

AFR

アルバニア語

SQI

アイマラ語

AYM

バスク語

EUS

ベンバ語

BEM

ブラックフット語

BLA

ブラジル ポルトガル語

QBP

ブルトン語

BRE

ブゴトゥ語

BGT

ブルガリア語

BUL

ベラルーシ語

BEL

カタロニア語

CAT

チャモロ語

CHA

チェチェン語

CHE

コルシカ語

COS

クロアチア語

HRV

クロウ語

CRO

チェコ語

CES

デンマーク語

DAN

オランダ語

NLD

英語

ENG

エスキモー (イヌイット) 語

QES

エスペラント語

EPO

エストニア語

EST

フェロー語

FAO

フィジー語

FIJ

フィンランド語

FIN

フランス語

FRA

フリジア語

FRY

フリウリ語

FUR

ゲール語 (アイルランド)

GLE

ゲール語 (スコットランド)

GLA

ガリシア語

GLG

ガンダ語

LUG

ドイツ語

DEU

ギリシャ語

ELL

グアラニ語

GRN

ハニ語 *

HNI

ハワイ語

HAW

ハンガリー語

HUN

アイスランド語

ISL

イド語

IDO

インドネシア語

IND

インターリンガ語

INA

イタリア語

ITA

カシューブ語

CSB

カワ語 *

WBM

キクユ語

KIK

コンゴ語

KON

クペレ語

KPE

クルド語 *

KUR

ラテン語

LAT

ラトビア語

LAV

リトアニア語

LIT

ルバ語

LUA

ルクセンブルク語

LTZ

マケドニア語

MKD

マダガスカル語

MLG

マレー語

MSA

マニンカ語

MLQ

マルタ語

MLT

マオリ語

MRI

マヤ語

MYN

モン語 *

HMN

ミナンカバウ語

モホーク語

MOH

モルダビア語

MOL

ナワトル語

NAH

ノルウェー語

NOR

ニャンジャ語

NYA

西洋語

OCC

オジブウェー語

OJI

パピアメント語

PAP

ピジン英語

TPI

ポーランド語

POL

ポルトガル語

POR

プロヴァンス語

PRV

ケチュア語

QUE

ラエティア語

ROH

ルーマニア語

RON

ロマ語

ROM

ルワンダ

KIN

ルンディ語

実行

ロシア語

RUS

サーミ語

SMI

ルレ サーミ語

SMJ

北サーミ語

SME

南サーミ語

SMA

サモア語

SMO

サルデーニャ語

SRD

セルビア語

SRP

セルビア語、ラテン文字

QSL

ショナ語

SNA

スー語

DAK

スロバキア語

SLK

スロベニア語

SLV

ソマリ語

SOM

ソルブ語 (ヴェンド語)

WEN

ソト語

SOT

スペイン語

SPA

スンダ語

スワヒリ語

SWA

スワジ語

SSW

スウェーデン語

SWE

タガログ語

TGL

タヒチ語

TAH

Pirez

QTI

トンガ語

TON

ツワナ語

TSN

チュニア語 *

TUG

トルコ語

TUR

ウクライナ語

UKR

ヴィサヤ語

QIS

ウェールズ語

CYM

ウォロフ語

WOL

コサ語

XHO

サポテック語

ZAP

ズールー語

ZUL

= この言語は、ラテン アルファベットを使用して記述されている場合にのみ処理できます。

 
表 2. OmniPage OCR - Extended Pack の言語でサポートされている言語と言語コード
 

言語コード

基本パックに含まれるすべての言語

 

日本語

JPN

簡体字中国語

QCS

繁体字中国語

QCT

韓国語

KOR

タイ語

THA

アラビア語

ARA

ヘブライ語

HEB

ベトナム語 (ラテン文字)

VIE

注: 拡張パックは上記の ISO/DIS 639-3 言語コード、ISO 639-1 と ISO 639-2 言語コード、または言語の実際の名前で使用することができます。

このページは役に立ちましたか?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
Uipath Logo White
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.