- 概要
- Document Processing Contracts
- リリース ノート
- Document Processing Contracts について
- Box クラス
- IPersistedActivity インターフェイス
- PrettyBoxConverter クラス
- IClassifierActivity インターフェイス
- IClassifierCapabilitiesProvider インターフェイス
- ClassifierDocumentType クラス
- ClassifierResult クラス
- ClassifierCodeActivity クラス
- ClassifierNativeActivity クラス
- ClassifierAsyncCodeActivity クラス
- ClassifierDocumentTypeCapability クラス
- ContentValidationData クラス
- EvaluatedBusinessRulesForFieldValue クラス
- EvaluatedBusinessRuleDetails クラス
- ExtractorAsyncCodeActivity クラス
- ExtractorCodeActivity クラス
- ExtractorDocumentType クラス
- ExtractorDocumentTypeCapabilities クラス
- ExtractorFieldCapability クラス
- ExtractorNativeActivity クラス
- ExtractorResult クラス
- FieldValue クラス
- FieldValueResult クラス
- ICapabilitiesProvider インターフェイス
- IExtractorActivity インターフェイス
- ExtractorPayload クラス
- DocumentActionPriority 列挙型
- DocumentActionData クラス
- DocumentActionStatus 列挙型
- DocumentActionType 列挙型
- DocumentClassificationActionData クラス
- DocumentValidationActionData クラス
- UserData クラス
- Document クラス
- DocumentSplittingResult クラス
- DomExtensions クラス
- Page クラス
- PageSection クラス
- Polygon クラス
- PolygonConverter クラス
- Metadata クラス
- WordGroup クラス
- Word クラス
- ProcessingSource 列挙型
- ResultsTableCell クラス
- ResultsTableValue クラス
- ResultsTableColumnInfo クラス
- ResultsTable クラス
- Rotation 列挙型
- ルール クラス
- RuleResult クラス
- RuleSet クラス
- RuleSetResult クラス
- SectionType 列挙型
- WordGroupType 列挙型
- IDocumentTextProjection インターフェイス
- ClassificationResult クラス
- ExtractionResult クラス
- ResultsDocument クラス
- ResultsDocumentBounds クラス
- ResultsDataPoint クラス
- ResultsValue クラス
- ResultsContentReference クラス
- ResultsValueTokens クラス
- ResultsDerivedField クラス
- ResultsDataSource 列挙型
- ResultConstants クラス
- SimpleFieldValue クラス
- TableFieldValue クラス
- DocumentGroup クラス
- DocumentTaxonomy クラス
- DocumentType クラス
- Field クラス
- FieldType 列挙型
- FieldValueDetails クラス
- LanguageInfo クラス
- MetadataEntry クラス
- TextType 列挙型
- TypeField クラス
- ITrackingActivity インターフェイス
- ITrainableActivity インターフェイス
- ITrainableClassifierActivity インターフェイス
- ITrainableExtractorActivity インターフェイス
- TrainableClassifierAsyncCodeActivity クラス
- TrainableClassifierCodeActivity クラス
- TrainableClassifierNativeActivity クラス
- TrainableExtractorAsyncCodeActivity クラス
- TrainableExtractorCodeActivity クラス
- TrainableExtractorNativeActivity クラス
- BasicDataPoint クラス - プレビュー
- ExtractionResultHandler クラス - プレビュー
- Document Understanding ML
- Document Understanding OCR ローカル サーバー
- Document Understanding
- IntelligentOCR
- リリース ノート
- IntelligentOCR アクティビティ パッケージについて
- プロジェクトの対応 OS
- タクソノミーを読み込み
- ドキュメントをデジタル化
- ドキュメント分類スコープ
- キーワード ベースの分類器
- Document Understanding プロジェクト分類器
- インテリジェント キーワード分類器
- ドキュメント分類アクションを作成
- ドキュメント検証成果物を作成
- ドキュメント検証成果物を取得
- ドキュメント分類アクション完了まで待機し再開
- 分類器トレーニング スコープ
- キーワード ベースの分類器トレーナー
- インテリジェント キーワード分類器トレーナー
- データ抽出スコープ
- Document Understanding プロジェクト抽出器
- Document Understanding プロジェクト抽出器トレーナー
- 正規表現ベースの抽出器
- フォーム抽出器
- インテリジェント フォーム抽出器
- ドキュメントを墨消し
- ドキュメント検証アクションを作成
- ドキュメント検証アクション完了まで待機し再開
- 抽出器トレーニング スコープ
- 抽出結果をエクスポート
- マシン ラーニング抽出器
- マシン ラーニング抽出器トレーナー
- マシン ラーニング分類器
- マシン ラーニング分類器トレーナー
- 生成 AI 分類器
- 生成 AI 抽出器
- 認証を構成する
- ML サービス
- OCR
- OCR Contracts
- リリース ノート
- OCR コントラクトについて
- プロジェクトの対応 OS
- IOCRActivity インターフェイス
- OCRAsyncCodeActivity クラス
- OCRCodeActivity クラス
- OCRNativeActivity クラス
- Character クラス
- OCRResult クラス
- Word クラス
- FontStyles 列挙型
- OCRRotation 列挙型
- OCRCapabilities クラス
- OCRScrapeBase クラス
- OCRScrapeFactory クラス
- ScrapeControlBase クラス
- ScrapeEngineUsages 列挙型
- ScrapeEngineBase
- ScrapeEngineFactory クラス
- ScrapeEngineProvider クラス
- OmniPage
- PDF
- [リストから削除済] ABBYY
- [リストから削除済] ABBYY Embedded
Document Understanding アクティビティ
UiPath.OmniPage.Activities
手書き認識は、各文字がつながっていない手書きのテキストにのみ対応します。ドキュメントの理想的なサイズは 25 から 45 ピクセルです。
説明
OmniPage OCR エンジンを使用して、示された UI 要素または画像から文字列とその情報を抽出します。OmniPage OCR は、OCR エンジンの実装を必要とするすべてのアクティビティにおいて、他の OCR エンジンの代替として使用できます。OmniPage OCR と併用できるアクティビティには、[OCR で検出したテキストをクリック]、[OCR で検出したテキスト上でホバー]、[OCR で検出したテキストをダブルクリック]、[OCR でテキストを取得]、[OCR でテキスト位置を探す]、[ドキュメントをデジタル化]、[CV 画面スコープ]、[CV テキストを取得] などがあります。
UiPath.OmniPage.Activities パッケージ v1.9.0 以降を .NET 5 (Core) にアップグレードしました。このパッケージを Windows レガシ以外のワークフローで実行する場合は、お使いのマシンに .NET5 Framework がインストールされている必要があります。
[OmniPage OCR] アクティビティは UiPath.IntelligentOCR.Activities パッケージ V2.0.0 以降に対応しており、任意の OCR に関連して使用できます。
プロジェクトの対応 OS
Windows - レガシ | Windows
構成
プロパティ パネル
共通
- 表示名 - アクティビティの表示名です。
入力
- 画像 - 処理する画像です。このフィールドでは
Image変数のみをサポートします。
その他
- プライベート - オンにした場合、変数および引数の値が Verbose レベルでログに出力されなくなります。
オプション
-
EnginePack - 画像処理に使用する埋め込みエンジンを指定します。次の 2 つのオプションがあります。 基本 - 幅広い言語をサポートします。 拡張 - アジア、アラビア語、タイ語、ヘブライ語、ベトナム語のサポートがさらに増えます。このページの最後にある 、Basic パッケージで利用可能なすべての言語のリストを確認してください。
注:Extended エンジンを使用するには、パッケージ マネージャーから UiPath.OmniPage.Bundle.Extended パッケージを現在のプロジェクトに手動でインストールする必要があります。
-
ExtractWords - 選択されていると、検出されたすべての単語の画面上の位置を抽出します。
-
言語 - OCR エンジンが使用する言語です。既定のオプションは [自動] で、言語が自動的に検出されることを意味します。コンマで区切って指定することで、複数の言語を使用できます。
注:複数の言語を同時に設定できます。たとえば、英語とフランス語両方のコンテンツを含む画像を処理するために "eng,fra" と設定できます。
日本語、韓国語、中国語の言語設定では、専用の認識エンジンが呼び出されることに注意してください。 これらの言語の 1 つだけを一度に選択し、アジア以外の言語と組み合わせないでください。
アジア言語に埋め込まれた短い英語のテキストは、認識言語を英語に設定していない場合でも認識できます。
-
プロファイル - OCR での読み取りを向上させるために、指定した画像または UI 要素の前処理プロファイルを選択します。次のオプションが利用できます。
- なし - 前処理プロファイルは適用されません。これが既定のオプションです。
- 画面 - リモート デスクトップ アプリケーションに適した前処理。
- スキャン - スキャンされたファイルに適した前処理。
- レガシ - エンジンの既定の設定を使用して画像を前処理します。
-
Scale - 選択した UI 要素または画像の倍率です。値が高いほど画像が拡大されます。これにより OCR の読み取りを向上させることができるため、画像が小さい場合にお勧めします。倍率を下げたい場合は 0 ~ 1 の間の値も指定できます。既定値は 1 です。
注:Studio v19.10 で UiPath.OmniPage.Activities v1.8.0 のこの OCR アクティビティを使用する場合は、 UiPath.CoreIPC パッケージのバージョン 2.0.1 以降をインストールします。
重要:画像のサイズが大きいと、拡大縮小率が 1 より大きい場合にエラーが発生することがあります。
出力
- Result -
KeyValuePair<Rectangle,String>に格納され、それらの画面上の位置と共に OCR エンジンによって抽出されたテキストです。このフィールドは、KeyValuePair<Rectangle,String>のみをサポートします。 - Text - String 型変数で格納され、OCR エンジンによって抽出されたテキストです。このフィールドは、
String型変数のみをサポートします。
サポートされている言語
以下の表に、OmniPage OCR でサポートされているすべての言語と、対応する言語コードのリストを示します。
表 1.OmniPage OCR - Basic Pack でサポートされている言語と言語コード
| 言語コード | |
|---|---|
| アフリカーンス語 | AFR |
| アルバニア語 | SQI |
| アイマラ語 | AYM |
| バスク語 | EUS |
| ベンバ語 | BEM |
| ブラックフット語 | BLA |
| ブラジル ポルトガル語 | QBP |
| ブルトン語 | BRE |
| ブゴトゥ語 | BGT |
| ブルガリア語 | BUL |
| ベラルーシ語 | BEL |
| カタロニア語 | CAT |
| チャモロ語 | CHA |
| チェチェン語 | CHE |
| コルシカ語 | COS |
| クロアチア語 | HRV |
| クロウ語 | CRO |
| チェコ語 | CES |
| デンマーク語 | DAN |
| オランダ語 | NLD |
| 英語 | ENG |
| エスキモー (イヌイット) 語 | QES |
| エスペラント語 | EPO |
| エストニア語 | EST |
| フェロー語 | FAO |
| フィジー語 | FIJ |
| フィンランド語 | FIN |
| フランス語 | FRA |
| フリジア語 | FRY |
| フリウリ語 | FUR |
| ゲール語 (アイルランド) | GLE |
| ゲール語 (スコットランド) | GLA |
| ガリシア語 | GLG |
| ガンダ語 | LUG |
| ドイツ語 | DEU |
| ギリシャ語 | ELL |
| グアラニ語 | GRN |
| ハニ語 * | HNI |
| ハワイ語 | HAW |
| ハンガリー語 | HUN |
| アイスランド語 | ISL |
| イド語 | IDO |
| インドネシア語 | IND |
| インターリンガ語 | INA |
| イタリア語 | ITA |
| カシューブ語 | CSB |
| カワ語 * | WBM |
| キクユ語 | KIK |
| コンゴ語 | KON |
| クペレ語 | KPE |
| クルド語 * | KUR |
| ラテン語 | LAT |
| ラトビア語 | LAV |
| リトアニア語 | LIT |
| ルバ語 | LUA |
| ルクセンブルク語 | LTZ |
| マケドニア語 | MKD |
| マダガスカル語 | MLG |
| マレー語 | MSA |
| マニンカ語 | MLQ |
| マルタ語 | MLT |
| マオリ語 | MRI |
| マヤ語 | MYN |
| モン語 * | HMN |
| ミナンカバウ語 | 分 |
| モホーク語 | MOH |
| モルダビア語 | MOL |
| ナワトル語 | NAH |
| ノルウェー語 | NOR |
| ニャンジャ語 | NYA |
| 西洋語 | OCC |
| オジブウェー語 | OJI |
| パピアメント語 | PAP |
| ピジン英語 | TPI |
| ポーランド語 | POL |
| ポルトガル語 | POR |
| プロヴァンス語 | PRV |
| ケチュア語 | QUE |
| ラエティア語 | ROH |
| ルーマニア語 | RON |
| ロマ語 | ROM |
| ルワンダ | KIN |
| ルンディ語 | 実行 |
| ロシア語 | RUS |
| サーミ語 | SMI |
| ルレ サーミ語 | SMJ |
| 北サーミ語 | SME |
| 南サーミ語 | SMA |
| サモア語 | SMO |
| サルデーニャ語 | SRD |
| セルビア語 | SRP |
| セルビア語、ラテン文字 | QSL |
| ショナ語 | SNA |
| スー語 | DAK |
| スロバキア語 | SLK |
| スロベニア語 | SLV |
| ソマリ語 | SOM |
| ソルブ語 (ヴェンド語) | WEN |
| ソト語 | SOT |
| スペイン語 | SPA |
| スンダ語 | 日 |
| スワヒリ語 | SWA |
| スワジ語 | SSW |
| スウェーデン語 | SWE |
| タガログ語 | TGL |
| タヒチ語 | TAH |
| Pirez | QTI |
| トンガ語 | TON |
| ツワナ語 | TSN |
| チュニア語 * | TUG |
| トルコ語 | TUR |
| ウクライナ語 | UKR |
| ヴィサヤ語 | QIS |
| ウェールズ語 | CYM |
| ウォロフ語 | WOL |
| コサ語 | XHO |
| サポテック語 | ZAP |
| ズールー語 | ZUL |
| = この言語は、ラテン アルファベットを使用して記述されている場合にのみ処理できます。 |
表 2.OmniPage OCR - Extended Pack Languages でサポートされている言語と言語コード
| 言語コード | |
|---|---|
| 基本パックに含まれるすべての言語 | |
| 日本語 | JPN |
| 簡体字中国語 | QCS |
| 繁体字中国語 | QCT |
| 韓国語 | KOR |
| タイ語 | THA |
| アラビア語 | ARA |
| ヘブライ語 | HEB |
| ベトナム語 (ラテン文字) | VIE |
拡張パックは上記の ISO/DIS 639-3 言語コード、ISO 639-1 と ISO 639-2 言語コード、または言語の実際の名前で使用することができます。