- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Classe BasicDataPoint - visualização
- Classe ExtractionResultHandler — visualização
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Machine Learning Extractor
- Machine Learning Extractor Trainer
- Machine Learning Classifier
- Machine Learning Classifier Trainer
- Classificador Generativo
- Extrator Generativo
- Configuração da autenticação
- Validação de documentos com ações de aplicativos
- Validação manual para digitalizar documentos
- Extração de dados baseada em âncora usando a atividade Intelligent Form Extractor
- Validation Station
- Atividades generativas — Boas práticas
- Extrator generativo — boas práticas
- Classificador generativo — Boas práticas
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades do Document Understanding
UiPath.OmniPage.Activities
O reconhecimento de manuscrito funciona apenas para texto impresso à mão, onde os caracteres não têm uma conexão. O tamanho ideal para um documento está entre 25 e 45 pixels.
Description
Extrai uma string e suas informações de um elemento de interface gráfica ou imagem indicada usando o mecanismo OmniPage OCR . O OmniPage OCR é uma alternativa aos outros mecanismos de OCR em todas as atividades que exigem implementações do mecanismo de OCR. Aqui estão alguns exemplos de atividades que podem ser usadas em conjunto com o OmniPage OCR:Click OCR Text, Hover OCR Text, Double Click OCR Text, Get OCR Text, Find OCR Text Position, Digitize Document, CV Screen Scope, CV Get Text.
O pacote UiPath.OmniPage.Activities, v1.9.0 ou posterior, foi atualizado para o núcleo .NET5. Essa alteração implica ter a estrutura do .NET5 instalada em sua máquina se o pacote for executado dentro de um fluxo de trabalho antigo não Windows.
A atividade OmniPage OCR é compatível com o pacote UiPath.IntelligentOCR.Activities, v2.0.0 ou superior e pode ser usada em qualquer contexto de OCR.
Compatibilidade do projeto
Windows-Legacy | Windows
Configuração
Painel de Propriedades
Comum
- DisplayName - O nome de exibição da atividade.
Entrada
- Imagem - A imagem que você deseja processar. Este campo é compatível apenas com variáveis
Image.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Opções
-
PacoteDeMecanismo - Especifica qual mecanismo incorporado deve ser usado para o processamento de imagens. Há duas opções, da seguinte maneira: Básico - suporta uma ampla gama de idiomas, Estendido - contém suporte extra para idiomas asiáticos, árabes, tailandês, hebraico e vietnamita. Verifique a lista de todos os idiomas disponíveis para o pacote Básico no final desta página.
Observação:Para usar o mecanismo Extended , você deve instalar manualmente o pacote UiPath.OmniPage.Bundle.Extended no projeto atual a partir do gerenciador de pacotes.
-
ExtractWords - If selected, extracts the on-screen position of all detected words.
-
Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.
Observação:Você pode usar configurações para vários idiomas ao mesmo tempo. Por exemplo, você pode definir "eng,fra" para processar imagens que contenham conteúdo em inglês e francês.
Observe que as configurações dos idiomas japonês, coreano e chinês acessam um mecanismo de reconhecimento dedicado. Apenas um desses idiomas deve ser selecionado por vez e não combinado com nenhum idioma não asiático.
Textos curtos incorporados em inglês podem ser reconhecidos sem que o inglês seja selecionado como idioma de reconhecimento.
-
Perfil - Escolha um perfil de pré-processamento para a imagem especificada ou elemento de interface gráfica para alcançar uma leitura de OCR melhor. As seguintes opções estão disponíveis:
- Nenhum - não aplica um perfil de pré-processamento, essa é a opção padrão;
- Tela - pré-processamento adequado para aplicativos de áreas de trabalho remotas;
- Digitalizar - pré-processamento adequado para arquivos digitalizados;
- Legado - usa as configurações padrão do mecanismo para pré-processar imagens.
-
Escala - O fator de escala do elemento de interface gráfica ou imagem selecionada. Quanto mais alto o número, mais a imagem é ampliada. Isso pode fornecer uma leitura melhor de OCR e é recomendado para imagens pequenas. Se você quiser reduzir a escala, valores entre 0 e 1 também são aceitos. Por padrão, o valor é 1.
Observação:Se você quiser usar essa atividade de OCR do pacote UiPath.OmniPage.Activities v1.8.0 no Studio v19.10, instale o pacote UiPath.CoreIPC , versão 2.0.1 ou superior.
Importante:Imagens de tamanho grande podem resultar em erro quando o fator de escala é maior que 1.
Saída
- Result - The text extracted by the OCR engine along with their on-screen position, stored in a
KeyValuePair<Rectangle,String>. This field supports onlyKeyValuePair<Rectangle,String>. - Text - The text extracted by the OCR engine, stored in a String variable. This field supports only
Stringvariables.
Idiomas suportados
A tabela a seguir mostra uma lista de todos os idiomas suportados pelo OmniPage OCR, bem como seus códigos de idioma correspondentes.
Tabela 1. Idiomas e códigos de idioma suportados para o OmniPage OCR - Idiomas do pacote básico
| Código de idioma | |
|---|---|
| Africâner | AFR |
| Albanês | SQI |
| aimará | AYM |
| Basco | EUS |
| bemba | BEM |
| Blackfoot | BLA |
| Brasileiro | QBP |
| Bretão | BRE |
| Bugotu | BGT |
| Búlgaro | BUL |
| bielorrusso | BEL |
| Catalão | CAT |
| Chamorro | CHA |
| Checheno | CHE |
| corso | COS |
| Croata | HRV |
| Corvo | CRO |
| Checo | CES |
| Dinamarquês | DAN |
| Holandês | NLD |
| English | ENG |
| Esquimó (Inuit) | QES |
| esperanto | EPO |
| Estoniano | EST |
| faroense | FAO |
| Fijiano | FIJ |
| Finlandês | FIN |
| Francês | FRA |
| frísio | FRY |
| Friulano | FUR |
| Gaélico (irlandês) | GLE |
| Gaélico (escocês) | GLA |
| Galego | GLG |
| Ganda | LUG |
| Alemão | DEU |
| Grego | ELL |
| guarani | GRN |
| Hani * | HNI |
| havaiano | HAW |
| Húngaro | HUN |
| Islandês | ISL |
| Ido | IDO |
| Indonésio | IND |
| Interlingua | INA |
| Italiano | ITA |
| Kasub | CSB |
| Kawa* | WBM |
| Kikuyu | KIK |
| Congo | KON |
| Kpelle | KPE |
| curdo * | KUR |
| Latim | LAT |
| Letão | LAV |
| Lituano | LIT |
| luba | LUA |
| Luxemburguês | LTZ |
| Macedônio | MKD |
| Malgaxe | MLG |
| Malaio | MSA |
| Malinke | MLQ |
| maltês | MLT |
| maori | MRI |
| maia | MYN |
| Miao* | HMN |
| Minangkabau | Mín. |
| moicano | MOH |
| moldávio | MOL |
| náuatle | NAH |
| Norueguês | NOR |
| Nyanja | NYA |
| Ocidental | OCC |
| Ojibway | OJI |
| papiamento | PAP |
| Inglês pidgin | TPI |
| Polonês | POL |
| Português | POR |
| Provençal | PRV |
| Quechua | QUE |
| rético | ROH |
| Romeno | RON |
| romani | ROM |
| Ruanda | KIN |
| Rundi | Executar |
| Russo | RUS |
| Sami | SMI |
| Sami, Lule | SMJ |
| Sami, Norte | SME |
| Sami, Sul | SMA |
| samoano | SMO |
| sardo | SRD |
| Sérvio | SRP |
| sérvio, latino | QSL |
| Shona | SNA |
| sioux | DAK |
| Eslovaco | SLK |
| Esloveno | SLV |
| somali | SOM |
| Sorbian (Wend) | WEN |
| sotho | SOT |
| Espanhol | SPA |
| Sundanês | Dom |
| Suaíli | SWA |
| suazi | SSW |
| Sueco | SWE |
| Tagalog | TGL |
| taitiano | TAH |
| pirez | QTI |
| Tonganês | TON |
| Tswana (Chuana) | TSN |
| Tun * | TUG |
| Turco | TUR |
| Ucraniano | UKR |
| Visayan | QIS |
| Galês | CYM |
| Wolof | WOL |
| xhosa | XHO |
| zapoteca | ZAP |
| Zulu | ZUL |
| = Este idioma pode ser tratado apenas se for escrito usando o alfabeto latino. |
Tabela 2. Idiomas e códigos de idioma suportados para o OmniPage OCR - Idiomas de pacote estendidos
| Código de idioma | |
|---|---|
| Todos os idiomas incluídos no Basic Pack | |
| Japonês | JPN |
| Chinês simplificado | QCS |
| Chinês tradicional | QCT |
| Coreano | KOR |
| Tailandês | THA |
| Árabe | ARA |
| Hebraico | HEB |
| vietnamita (latim) | VIE |
The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.