UI Automation のアクティビティ

最終更新日時 2025年6月5日

Tesseract OCR

UiPath.Core.Activities.GoogleOCR

Tesseract OCR エンジンを使用して、指定した UI 要素または画像から文字列とその情報を抽出します。他の OCR アクティビティ ([OCR で検出したテキストをクリック]、[OCR で検出したテキスト上でホバー]、[OCR で検出したテキストをダブルクリック]、[OCR でテキストを取得]、[OCR でテキスト位置を探す] など) で使用できます。

注:

UiPath で使用されている Tesseract OCR エンジンは、バージョン 4.0 に更新されます。このエンジンの機能について詳しくは、こちらをご覧ください。
このアクティビティは回転されたドキュメントをサポートしていないため、そのようなドキュメントに対する結果は予測できません。

前提条件

Tesseract OCR エンジンを実行する前に、対応するマシンに Visual C++ 再頒布可能パッケージ x86 (32 ビット) をインストールします。オペレーティングシステムが 64 ビット (x64) の場合でも、x86 (32 ビット) バージョンをインストールする必要があります。「サポートされている最新の Visual C++ 再頒布可能パッケージのダウンロード」にアクセスして、要件を満たす Visual C++ のバージョンを選択してインストールします。

制限事項

Tesseract OCR エンジンは、Windows 10 N Edition をサポートしていません。このエディションの Windows には Media Feature Pack が付属しないからです。互換性を確保するため、必要なメディアコンポーネントがすべて揃った Windows 10 Pro にアップグレードすることをお勧めします。

プロパティ

オプション

許可する文字 - OCR エンジンは、ここに指定した文字に従って、指定の文字列を抽出します。
拒否する文字 - OCR エンジンは、ここに指定した文字を考慮せずに、指定の文字列を抽出します。
Invert - このチェックボックスをオンにした場合は、スクレイピングの前に UI 要素の色が反転します。背景がテキストの色より暗い場合に便利です。
言語 - OCR エンジンが UI 要素または画像から文字列を抽出する際に使用する言語です。Google OCR エンジンの場合、このフィールドには、ルーマニア語の場合は「ron」、イタリア語の場合は「ita」、フランス語の場合は「fra」などの言語ファイル接頭辞を含める必要があります。サポートされている言語の接頭辞は、このページにあります。

注: 言語フォルダーをこちらからダウンロードして、ローカルフォルダー %UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata に追加できます。言語フォルダーをローカルに追加したら、UiPath Studio アプリケーションを再起動してください。
ExtractWords - このチェックボックスをオンにした場合は、検出された各単語の画面上の位置が抽出されます。
プロファイル - OCR の読み取りを向上させる目的で、指定した画像または UI 要素の前処理プロファイルを選択します。次のオプションが使用できます。None - 前処理プロファイルを適用しません。Screen - リモートデスクトップアプリケーションに適した前処理を行います。Scan - スキャンしたファイルに適した前処理を行います。Legacy - 画像の前処理でエンジンの既定の設定を使用します。これが既定のオプションです。
拡大縮小 - 選択した UI 要素または画像の拡大縮小の倍率。この数値が大きいほど、画像が拡大されます。OCR の読み取り精度が向上することから、小さい画像で使用することをお勧めします。縮小が必要な場合、0 ～ 1 の範囲の値を設定することもできます。既定値は 2 です。

重要: 画像のサイズが大きいと、拡大縮小率が 1 より大きい場合にエラーが発生することがあります。