- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
OmniPage OCR
UiPath.OmniPage.Activities
Extrai uma string e suas informações de um elemento ou imagem de interface do usuário indicado usando o OmniPage OCR Engine. O OmniPage OCR é uma alternativa aos outros mecanismos de OCR, em todas as atividades que requerem implementações de mecanismos de OCR. Aqui estão alguns exemplos de atividades que podem ser usadas junto com o OmniPage OCR:Clique em Texto OCR, Passe o mouse em Texto OCR, Clique duas vezes em Texto OCR, Obter texto OCR, Localizar posição de texto OCR, Digitalizar documento, Escopo da tela CV, Obter texto CV.
Painel de Propriedades
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
- Imagem - A imagem que você deseja processar. Este campo é compatível apenas com variáveis
Image
.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Opções
- PacoteDeMecanismo - Especifica qual mecanismo incorporado deve ser usado para o processamento de imagens. Há duas opções, conforme a seguir: Básico - suporta uma ampla gama de idiomas, Estendido - contém suporte extra para idiomas asiáticos, árabe, tailandês, hebraico e vietnamita. Verifique a lista de todos os idiomas disponíveis para o pacote Básico no final desta página.
Observação: para usar o mecanismo estendido , você deve instalar manualmente o pacote UiPath.OmniPage.Bundle.Extended no projeto atual do Gerenciador de pacotes.
- ExtractWords - Se selecionado, extrai a posição na tela de todas as palavras detectadas.
- Idioma - O idioma usado pelo mecanismo de OCR. A opção padrão é auto, o que significa que o idioma é detectado automaticamente. Vários idiomas podem ser usados separados por vírgulas.
Observação:
Você pode usar configurações para vários idiomas ao mesmo tempo. Por exemplo, você pode definir "eng,fra" para processar imagens que contenham conteúdo em inglês e francês.
Observe que as configurações dos idiomas japonês, coreano e chinês acessam um mecanismo de reconhecimento dedicado. Apenas um desses idiomas deve ser selecionado por vez e não combinado com nenhum idioma não asiático.
Textos curtos incorporados em inglês podem ser reconhecidos sem que o inglês seja selecionado como idioma de reconhecimento.
- Perfil - Escolha um perfil de pré-processamento para a imagem especificada ou elemento de interface gráfica para alcançar uma leitura de OCR melhor. As seguintes opções estão disponíveis:
- Nenhum - não aplica um perfil de pré-processamento, essa é a opção padrão;
- Tela - pré-processamento adequado para aplicativos de áreas de trabalho remotas;
- Digitalização - pré-processamento adequado para arquivos digitalizados;
- Legado - usa as configurações padrão do mecanismo para pré-processar imagens.
- Escala - O fator de escala do elemento ou imagem da interface do usuário selecionada. Quanto maior o número, mais você amplia a imagem. Isso pode fornecer uma melhor leitura de OCR e é recomendado para imagens pequenas. Se você deseja reduzir, valores entre 0 e 1 também são aceitos. Por padrão, o valor é 1.
Observação: se você quiser usar essa atividade OCR do pacote UiPath.OmniPage.Activities v1.8.0 no Studio v19.10, instale o pacote UiPath.CoreIPC , versão 2.0.1 ou superior.Importante: imagens de tamanho grande podem resultar em erro quando o fator de escala for maior que 1.
Saída
- Resultado - O texto extraído pelo mecanismo de OCR junto com sua posição na tela, armazenado em um
KeyValuePair<Rectangle,String>
. Este campo suporta apenasKeyValuePair<Rectangle,String>
. - Texto - O texto extraído pelo mecanismo de OCR, armazenado em uma variável String. Este campo suporta apenas
String
variáveis.
A tabela a seguir mostra uma lista de todos os idiomas suportados pelo OmniPage OCR, bem como seus códigos de idioma correspondentes.
Código de idioma | |
---|---|
Africâner |
AFR |
Albanês |
SQI |
aimará |
AYM |
Basco |
EUS |
bemba |
BEM |
Blackfoot |
BLA |
Brasileiro |
QBP |
Bretão |
BRE |
Bugotu |
BGT |
Búlgaro |
BUL |
bielorrusso |
BEL |
Catalão |
CAT |
Chamorro |
CHA |
Checheno |
CHE |
corso |
COS |
Croata |
HRV |
Corvo |
CRO |
Checo |
CES |
Dinamarquês |
DAN |
Holandês |
NLD |
English |
ENG |
Esquimó (Inuit) |
QES |
esperanto |
EPO |
Estoniano |
EST |
faroense |
FAO |
Fijiano |
FIJ |
Finlandês |
FIN |
Francês |
FRA |
frísio |
FRY |
Friulano |
FUR |
Gaélico (irlandês) |
GLE |
Gaélico (escocês) |
GLA |
Galego |
GLG |
Ganda |
LUG |
Alemão |
DEU |
Grego |
ELL |
guarani |
GRN |
Hani * |
HNI |
havaiano |
HAW |
Húngaro |
HUN |
Islandês |
ISL |
Ido |
IDO |
Indonésio |
IND |
Interlingua |
INA |
Italiano |
ITA |
Kasub |
CSB |
Kawa* |
WBM |
Kikuyu |
KIK |
Congo |
KON |
Kpelle |
KPE |
curdo * |
KUR |
Latim |
LAT |
Letão |
LAV |
Lituano |
LIT |
luba |
LUA |
Luxemburguês |
LTZ |
Macedônio |
MKD |
Malgaxe |
MLG |
Malaio |
MSA |
Malinke |
MLQ |
maltês |
MLT |
maori |
MRI |
maia |
MYN |
Miao* |
HMN |
Minangkabau |
Mín. |
moicano |
MOH |
moldávio |
MOL |
náuatle |
NAH |
Norueguês |
NOR |
Nyanja |
NYA |
Ocidental |
OCC |
Ojibway |
OJI |
papiamento |
PAP |
Inglês pidgin |
TPI |
Polonês |
POL |
Português |
POR |
Provençal |
PRV |
Quechua |
QUE |
rético |
ROH |
Romeno |
RON |
romani |
ROM |
Ruanda |
KIN |
Rundi |
Executar |
Russo |
RUS |
Sami |
SMI |
Sami, Lule |
SMJ |
Sami, Norte |
SME |
Sami, Sul |
SMA |
samoano |
SMO |
sardo |
SRD |
Sérvio |
SRP |
sérvio, latino |
QSL |
Shona |
SNA |
sioux |
DAK |
Eslovaco |
SLK |
Esloveno |
SLV |
somali |
SOM |
Sorbian (Wend) |
WEN |
sotho |
SOT |
Espanhol |
SPA |
Sundanês |
Dom |
Suaíli |
SWA |
suazi |
SSW |
Sueco |
SWE |
Tagalog |
TGL |
taitiano |
TAH |
pirez |
QTI |
Tonganês |
TON |
Tswana (Chuana) |
TSN |
Tun * |
TUG |
Turco |
TUR |
Ucraniano |
UKR |
Visayan |
QIS |
Galês |
CYM |
Wolof |
WOL |
xhosa |
XHO |
zapoteca |
ZAP |
Zulu |
ZUL |
= Este idioma pode ser tratado apenas se for escrito usando o alfabeto latino. |
Código de idioma | |
---|---|
Todos os idiomas incluídos no Basic Pack | |
Japonês |
JPN |
Chinês simplificado |
QCS |
Chinês tradicional |
QCT |
Coreano |
KOR |
Tailandês |
THA |
Árabe |
ARA |
Hebraico |
HEB |
vietnamita (latim) |
VIE |