アクティビティ
最新
バナーの背景画像
UI Automation のアクティビティ
最終更新日 2024年4月26日

Tesseract OCR

UiPath.Core.Activities.GoogleOCR

Tesseract OCR エンジンを使用して、指定した UI 要素または画像から文字列とその情報を抽出します。他の OCR アクティビティ ([OCR で検出したテキストをクリック][OCR で検出したテキスト上でホバー][OCR で検出したテキストをダブルクリック][OCR でテキストを取得][OCR でテキスト位置を探す] など) で使用できます。

注: UiPath で使用されている Tesseract OCR エンジンは、バージョン 4.0 に更新されます。このエンジンの機能について詳しくは、こちらをご覧ください。
注: このアクティビティは回転されたドキュメントをサポートしていないため、そのようなドキュメントに対する結果は予測できません。

プロパティ

オプション
  • 許可する文字 - OCR エンジンは、ここに指定した文字に従って、指定の文字列を抽出します。
  • 拒否する文字 - OCR エンジンは、ここに指定した文字を考慮せずに、指定の文字列を抽出します。
  • Invert - このチェック ボックスをオンにした場合は、スクレイピングの前に UI 要素の色が反転します。背景がテキストの色より暗い場合に便利です。
  • 言語 - OCR エンジンが UI 要素または画像から文字列を抽出する際に使用する言語です。Google OCR エンジンの場合、このフィールドには、ルーマニア語の場合は「ron」、イタリア語の場合は「ita」、フランス語の場合は「fra」などの言語ファイル接頭辞を含める必要があります。サポートされている言語の接頭辞は、このページにあります。

    注: 言語フォルダーをこちらからダウンロードして、ローカル フォルダー %UserProfile%\.nuget\packages\uipath.vision\3.x.x\build\net461\tessdata に追加できます。言語フォルダーをローカルに追加したら、UiPath Studio アプリケーションを再起動してください。
  • ExtractWords - このチェック ボックスをオンにした場合は、検出された各単語の画面上の位置が抽出されます。
  • プロファイル - OCR の読み取りを向上させる目的で、指定した画像または UI 要素の前処理プロファイルを選択します。次のオプションが使用できます。None - 前処理プロファイルを適用しません。Screen - リモート デスクトップ アプリケーションに適した前処理を行います。Scan - スキャンしたファイルに適した前処理を行います。Legacy - 画像の前処理でエンジンの既定の設定を使用します。これが既定のオプションです。
  • 拡大縮小 - 選択した UI 要素または画像の拡大縮小の倍率。この数値が大きいほど、画像が拡大されます。OCR の読み取り精度が向上することから、小さい画像で使用することをお勧めします。縮小が必要な場合、0 ~ 1 の範囲の値を設定することもできます。既定値は 2 です。

    重要: 画像のサイズが大きいと、拡大縮小率が 1 より大きい場合にエラーが発生することがあります。
出力
  • テキスト - 抽出したテキストです。このフィールドでは string 型の変数のみがサポートされています。
  • 結果 - 抽出された単語と画面上の位置が表示されます。このフィールドでは KeyValuePair <rectangle,string> 型の変数のみがサポートされています。
入力
  • 画像 - 処理対象の画像です。このフィールドでは image 型の変数のみがサポートされています。
共通
  • 表示名 - アクティビティの表示名です。
その他
  • プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
  • プロパティ

Was this page helpful?

サポートを受ける
RPA について学ぶ - オートメーション コース
UiPath コミュニティ フォーラム
UiPath ロゴ (白)
信頼とセキュリティ
© 2005-2024 UiPath. All rights reserved.