- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades do Document Understanding
OmniPage OCR
UiPath.OmniPage.Activities
Handwriting recognition works only for hand-printed text, where the characters don’t have a connection. The ideal size for a document is between 25 and 45 pixels.
Description
Extracts a string and its information from an indicated UI element or image using OmniPage OCR Engine. The OmniPage OCR is an alternative to the other OCR engines, in all activities that require OCR engine implementations. Here are a few examples of activities that can be used together with the OmniPage OCR:Click OCR Text, Hover OCR Text, Double Click OCR Text, Get OCR Text, Find OCR Text Position, Digitize Document, CV Screen Scope, CV Get Text.
The UiPath.OmniPage.Activities package, v1.9.0 or higher, has been upgraded to .NET5 core. This change implies having the .NET5 framework installed on your machine if the package is run within a non-Windows legacy workflow.
The OmniPage OCR activity is compatible with the UiPath.IntelligentOCR.Activities package, v2.0.0 or higher and can be used in any OCR context.
Compatibilidade do projeto
Windows-Legacy | Windows
Configuração
Painel de Propriedades
Comum
- DisplayName - O nome de exibição da atividade.
Entrada
- Imagem - A imagem que você deseja processar. Este campo é compatível apenas com variáveis
Image.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Opções
-
EnginePack - Specifies which embedded engine must be used for image processing. There are two options, as follows: Basic - Supports a wide range of languages, Extended - Contains extra support for Asian, Arabic, Thai, Hebrew and Vietnamese languages. Check the list of all available languages for the Basic pack at the end of this page.
Observação:In order to use the Extended engine, you must manually install the UiPath.OmniPage.Bundle.Extended package in the current project from the Package Manager.
-
ExtractWords - If selected, extracts the on-screen position of all detected words.
-
Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.
Observação:Você pode usar configurações para vários idiomas ao mesmo tempo. Por exemplo, você pode definir "eng,fra" para processar imagens que contenham conteúdo em inglês e francês.
Observe que as configurações dos idiomas japonês, coreano e chinês acessam um mecanismo de reconhecimento dedicado. Apenas um desses idiomas deve ser selecionado por vez e não combinado com nenhum idioma não asiático.
Textos curtos incorporados em inglês podem ser reconhecidos sem que o inglês seja selecionado como idioma de reconhecimento.
-
Profile - Choose a pre-processing profile for the specified image or UI element to achieve a better OCR read. The following options are available:
- None - does not apply a pre-processing profile, this is the default option;
- Screen - pre-processing suitable for remote desktop applications;
- Scan - pre-processing suitable for scanned files;
- Legacy - uses the engine's default settings for pre-processing images.
-
Escala - O fator de escala do elemento de interface gráfica ou imagem selecionada. Quanto mais alto o número, mais a imagem é ampliada. Isso pode fornecer uma leitura melhor de OCR e é recomendado para imagens pequenas. Se você quiser reduzir a escala, valores entre 0 e 1 também são aceitos. Por padrão, o valor é 1.
Observação:If you want to use this OCR activity from package UiPath.OmniPage.Activities v1.8.0 in Studio v19.10, install the UiPath.CoreIPC package, version 2.0.1 or higher.
Importante:Imagens de tamanho grande podem resultar em erro quando o fator de escala é maior que 1.
Saída
- Result - The text extracted by the OCR engine along with their on-screen position, stored in a
KeyValuePair<Rectangle,String>. This field supports onlyKeyValuePair<Rectangle,String>. - Text - The text extracted by the OCR engine, stored in a String variable. This field supports only
Stringvariables.
Idiomas suportados
A tabela a seguir mostra uma lista de todos os idiomas suportados pelo OmniPage OCR, bem como seus códigos de idioma correspondentes.
Table 1. Supported languages and language codes for OmniPage OCR - Basic Pack Languages
| Código de idioma | |
|---|---|
| Africâner | AFR |
| Albanês | SQI |
| aimará | AYM |
| Basco | EUS |
| bemba | BEM |
| Blackfoot | BLA |
| Brasileiro | QBP |
| Bretão | BRE |
| Bugotu | BGT |
| Búlgaro | BUL |
| bielorrusso | BEL |
| Catalão | CAT |
| Chamorro | CHA |
| Checheno | CHE |
| corso | COS |
| Croata | HRV |
| Corvo | CRO |
| Checo | CES |
| Dinamarquês | DAN |
| Holandês | NLD |
| English | ENG |
| Esquimó (Inuit) | QES |
| esperanto | EPO |
| Estoniano | EST |
| faroense | FAO |
| Fijiano | FIJ |
| Finlandês | FIN |
| Francês | FRA |
| frísio | FRY |
| Friulano | FUR |
| Gaélico (irlandês) | GLE |
| Gaélico (escocês) | GLA |
| Galego | GLG |
| Ganda | LUG |
| Alemão | DEU |
| Grego | ELL |
| guarani | GRN |
| Hani * | HNI |
| havaiano | HAW |
| Húngaro | HUN |
| Islandês | ISL |
| Ido | IDO |
| Indonésio | IND |
| Interlingua | INA |
| Italiano | ITA |
| Kasub | CSB |
| Kawa* | WBM |
| Kikuyu | KIK |
| Congo | KON |
| Kpelle | KPE |
| curdo * | KUR |
| Latim | LAT |
| Letão | LAV |
| Lituano | LIT |
| luba | LUA |
| Luxemburguês | LTZ |
| Macedônio | MKD |
| Malgaxe | MLG |
| Malaio | MSA |
| Malinke | MLQ |
| maltês | MLT |
| maori | MRI |
| maia | MYN |
| Miao* | HMN |
| Minangkabau | Mín. |
| moicano | MOH |
| moldávio | MOL |
| náuatle | NAH |
| Norueguês | NOR |
| Nyanja | NYA |
| Ocidental | OCC |
| Ojibway | OJI |
| papiamento | PAP |
| Inglês pidgin | TPI |
| Polonês | POL |
| Português | POR |
| Provençal | PRV |
| Quechua | QUE |
| rético | ROH |
| Romeno | RON |
| romani | ROM |
| Ruanda | KIN |
| Rundi | Executar |
| Russo | RUS |
| Sami | SMI |
| Sami, Lule | SMJ |
| Sami, Norte | SME |
| Sami, Sul | SMA |
| samoano | SMO |
| sardo | SRD |
| Sérvio | SRP |
| sérvio, latino | QSL |
| Shona | SNA |
| sioux | DAK |
| Eslovaco | SLK |
| Esloveno | SLV |
| somali | SOM |
| Sorbian (Wend) | WEN |
| sotho | SOT |
| Espanhol | SPA |
| Sundanês | Dom |
| Suaíli | SWA |
| suazi | SSW |
| Sueco | SWE |
| Tagalog | TGL |
| taitiano | TAH |
| pirez | QTI |
| Tonganês | TON |
| Tswana (Chuana) | TSN |
| Tun * | TUG |
| Turco | TUR |
| Ucraniano | UKR |
| Visayan | QIS |
| Galês | CYM |
| Wolof | WOL |
| xhosa | XHO |
| zapoteca | ZAP |
| Zulu | ZUL |
| = Este idioma pode ser tratado apenas se for escrito usando o alfabeto latino. |
Table 2. Supported languages and language codes for OmniPage OCR - Extended Pack Languages
| Código de idioma | |
|---|---|
| Todos os idiomas incluídos no Basic Pack | |
| Japonês | JPN |
| Chinês simplificado | QCS |
| Chinês tradicional | QCT |
| Coreano | KOR |
| Tailandês | THA |
| Árabe | ARA |
| Hebraico | HEB |
| vietnamita (latim) | VIE |
The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.