- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Processo do Document Understanding - Modelo do Studio
- Document Understanding
- Notas de versão
- About the Document Understanding activity package
- Compatibilidade do projeto
- Dados do documento
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- About the IntelligentOCR activity package
- Compatibilidade do projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Intelligent Keyword Classifier
- Present Classification Station
- Create Document Classification Action
- Wait For Document Classification Action And Resume
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
OmniPage OCR
UiPath.OmniPage.Activities
Extrai uma string e suas informações de um elemento ou imagem de interface do usuário indicado usando o OmniPage OCR Engine. O OmniPage OCR é uma alternativa aos outros mecanismos de OCR, em todas as atividades que requerem implementações de mecanismos de OCR. Aqui estão alguns exemplos de atividades que podem ser usadas junto com o OmniPage OCR:Clique em Texto OCR, Passe o mouse em Texto OCR, Clique duas vezes em Texto OCR, Obter texto OCR, Localizar posição de texto OCR, Digitalizar documento, Escopo da tela CV, Obter texto CV.
Importante
O reconhecimento de manuscrito funciona apenas para texto impresso à mão, onde os caracteres não têm uma conexão. O tamanho ideal para um documento é entre 25-45 pixels.
Comum
- NomeDeExibição - o nome de exibição da atividade.
Entrada
- Imagem - A imagem que você deseja processar. Este campo é compatível apenas com variáveis
Image
.
Diversos
- Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Opções
-
EnginePack - Especifica qual mecanismo incorporado deve ser usado para processamento de imagem. Existem duas opções, como segue: Básico - Suporta uma ampla variedade de idiomas, Estendido - Contém suporte extra para idiomas asiáticos, árabes, tailandeses, hebraicos e vietnamitas. Verifique a lista de todos os idiomas disponíveis para o pacote Básico na parte inferior desta página.
Observação: para usar o mecanismo estendido , você deve instalar manualmente o pacote UiPath.OmniPage.Bundle.Extended no projeto atual do Gerenciador de pacotes. - ExtractWords - Se selecionado, extrai a posição na tela de todas as palavras detectadas.
-
Idioma - O idioma usado pelo mecanismo de OCR. A opção padrão é auto, o que significa que o idioma é detectado automaticamente. Vários idiomas podem ser usados separados por vírgulas.
Observação:Você pode usar configurações para vários idiomas ao mesmo tempo. Por exemplo, você pode definir "eng,fra" para processar imagens que contenham conteúdo em inglês e francês.
Observe que as configurações de idioma japonês, coreano e chinês acessam um mecanismo de reconhecimento dedicado. Apenas um desses idiomas deve ser selecionado por vez e não combinado com nenhum idioma não asiático.
Textos curtos incorporados em inglês podem ser reconhecidos sem que o inglês seja selecionado como idioma de reconhecimento.
- Perfil - Escolha um perfil de pré-processamento para a imagem ou elemento de interface do usuário especificado para obter uma melhor leitura de OCR. As seguintes opções estão disponíveis: Nenhum - não aplica um perfil de pré-processamento, esta é a opção padrão; Tela - pré-processamento adequado para aplicativos de área de trabalho remota; Scan - pré-processamento adequado para arquivos digitalizados; Legado - usa as configurações padrão do mecanismo para pré-processar imagens.
-
Escala - O fator de escala do elemento ou imagem da interface do usuário selecionada. Quanto maior o número, mais você amplia a imagem. Isso pode fornecer uma melhor leitura de OCR e é recomendado para imagens pequenas. Se você deseja reduzir, valores entre 0 e 1 também são aceitos. Por padrão, o valor é 1.
Nota: Se você quiser usar esta atividade de OCR do pacote UiPath.OmniPage.Activities v1.8.0 no Studio v19.10, instale o pacote UiPath.CoreIPC , versão 2.0.1 ou superior."Importante: imagens de tamanho grande podem resultar em erro quando o fator de escala for maior que 1.
Saída
- Resultado - O texto extraído pelo mecanismo de OCR junto com sua posição na tela, armazenado em um
KeyValuePair<Rectangle,String>
. Este campo suporta apenasKeyValuePair<Rectangle,String>
. - Texto - O texto extraído pelo mecanismo de OCR, armazenado em uma variável String. Este campo suporta apenas
String
variáveis.
Pacote Básico - Idiomas |
Código de idioma |
---|---|
Africâner |
AFR |
Albanês |
SQI |
aimará |
AYM |
Basco |
EUS |
bemba |
BEM |
Blackfoot |
BLA |
Brasileiro |
QBP |
Bretão |
BRE |
Bugotu |
BGT |
Búlgaro |
BUL |
bielorrusso |
BEL |
Catalão |
CAT |
Chamorro |
CHA |
Checheno |
CHE |
corso |
COS |
Croata |
HRV |
Corvo |
CRO |
Checo |
CES |
Dinamarquês |
DAN |
Holandês |
NLD |
English |
ENG |
Esquimó (Inuit) |
QES |
esperanto |
EPO |
Estoniano |
EST |
faroense |
FAO |
Fijiano |
FIJ |
Finlandês |
FIN |
Francês |
FRA |
frísio |
FRY |
Friulano |
FUR |
Gaélico (irlandês) |
GLE |
Gaélico (escocês) |
GLA |
Galego |
GLG |
Ganda |
LUG |
Alemão |
DEU |
Grego |
ELL |
guarani |
GRN |
Hani * |
HNI |
havaiano |
HAW |
Húngaro |
HUN |
Islandês |
ISL |
Ido |
IDO |
Indonésio |
IND |
Interlingua |
INA |
Italiano |
ITA |
Kasub |
CSB |
Kawa* |
WBM |
Kikuyu |
KIK |
Congo |
KON |
Kpelle |
KPE |
curdo * |
KUR |
Latim |
LAT |
Letão |
LAV |
Lituano |
LIT |
luba |
LUA |
Luxemburguês |
LTZ |
Macedônio |
MKD |
Malgaxe |
MLG |
Malaio |
MSA |
Malinke |
MLQ |
maltês |
MLT |
maori |
MRI |
maia |
MYN |
Miao* |
HMN |
Minangkabau |
Mín. |
moicano |
MOH |
moldávio |
MOL |
náuatle |
NAH |
Norueguês |
NOR |
Nyanja |
NYA |
Ocidental |
OCC |
Ojibway |
OJI |
papiamento |
PAP |
Inglês pidgin |
TPI |
Polonês |
POL |
Português |
POR |
Provençal |
PRV |
Quechua |
QUE |
rético |
ROH |
Romeno |
RON |
romani |
ROM |
Ruanda |
KIN |
Rundi |
Executar |
Russo |
RUS |
Sami |
SMI |
Sami, Lule |
SMJ |
Sami, Norte |
SME |
Sami, Sul |
SMA |
samoano |
SMO |
sardo |
SRD |
Sérvio |
SRP |
sérvio, latino |
QSL |
Shona |
SNA |
sioux |
DAK |
Eslovaco |
SLK |
Esloveno |
SLV |
somali |
SOM |
Sorbian (Wend) |
WEN |
sotho |
SOT |
Espanhol |
SPA |
Sundanês |
Dom |
Suaíli |
SWA |
suazi |
SSW |
Sueco |
SWE |
Tagalog |
TGL |
taitiano |
TAH |
pirez |
QTI |
Tonganês |
TON |
Tswana (Chuana) |
TSN |
Tun * |
TUG |
Turco |
TUR |
Ucraniano |
UKR |
Visayan |
QIS |
Galês |
CYM |
Wolof |
WOL |
xhosa |
XHO |
zapoteca |
ZAP |
Zulu |
ZUL |
= Este idioma pode ser tratado apenas se for escrito usando o alfabeto latino. |
Pacote Estendido - Idiomas |
Código de idioma |
---|---|
Todos os idiomas incluídos no Basic Pack | |
Japonês |
JPN |
Chinês simplificado |
QCS |
Chinês tradicional |
QCT |
Coreano |
KOR |
Tailandês |
THA |
Árabe |
ARA |
Hebraico |
HEB |
vietnamita (latim) |
VIE |