Atividades - OmniPage OCR

activities

latest

false

Atividades do Document Understanding

Importante :

A tradução automática foi aplicada parcialmente neste conteúdo. A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

OmniPage OCR

Atividade OmniPage OCR, que extrai texto e informações posicionais de elementos de interface gráfica ou imagens usando o mecanismo Nuance OmniPage.

UiPath.OmniPage.Activities

Importante:

O reconhecimento de manuscrito funciona apenas para texto impresso à mão, onde os caracteres não têm uma conexão. O tamanho ideal para um documento está entre 25 e 45 pixels.

Description

Extrai uma string e suas informações de um elemento de interface gráfica ou imagem indicada usando o mecanismo OmniPage OCR . O OmniPage OCR é uma alternativa aos outros mecanismos de OCR em todas as atividades que exigem implementações do mecanismo de OCR. Aqui estão alguns exemplos de atividades que podem ser usadas em conjunto com o OmniPage OCR:Click OCR Text, Hover OCR Text, Double Click OCR Text, Get OCR Text, Find OCR Text Position, Digitize Document, CV Screen Scope, CV Get Text.

Observação:

O pacote UiPath.OmniPage.Activities, v1.9.0 ou posterior, foi atualizado para o núcleo .NET5. Essa alteração implica ter a estrutura do .NET5 instalada em sua máquina se o pacote for executado dentro de um fluxo de trabalho antigo não Windows.

Observação:

A atividade OmniPage OCR é compatível com o pacote UiPath.IntelligentOCR.Activities, v2.0.0 ou superior e pode ser usada em qualquer contexto de OCR.

Compatibilidade do projeto

Windows

Configuração

Painel de Propriedades

Comum

DisplayName - O nome de exibição da atividade.

Entrada

Imagem - A imagem que você deseja processar. Este campo é compatível apenas com variáveis Image.

Diversos

Privado - Se selecionado, os valores de variáveis e argumentos não são mais registrados no nível Verbose.

Opções

PacoteDeMecanismo - Especifica qual mecanismo incorporado deve ser usado para o processamento de imagens. Há duas opções, da seguinte maneira: Básico - suporta uma ampla gama de idiomas, Estendido - contém suporte extra para idiomas asiáticos, árabes, tailandês, hebraico e vietnamita. Verifique a lista de todos os idiomas disponíveis para o pacote Básico no final desta página.

Observação:
Para usar o mecanismo Extended , você deve instalar manualmente o pacote UiPath.OmniPage.Bundle.Extended no projeto atual a partir do gerenciador de pacotes.
ExtractWords - If selected, extracts the on-screen position of all detected words.
Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.

Observação:
Você pode usar configurações para vários idiomas ao mesmo tempo. Por exemplo, você pode definir "eng,fra" para processar imagens que contenham conteúdo em inglês e francês.
Observe que as configurações dos idiomas japonês, coreano e chinês acessam um mecanismo de reconhecimento dedicado. Apenas um desses idiomas deve ser selecionado por vez e não combinado com nenhum idioma não asiático.
Textos curtos incorporados em inglês podem ser reconhecidos sem que o inglês seja selecionado como idioma de reconhecimento.
Perfil - Escolha um perfil de pré-processamento para a imagem especificada ou elemento de interface gráfica para alcançar uma leitura de OCR melhor. As seguintes opções estão disponíveis:
- Nenhum - não aplica um perfil de pré-processamento, essa é a opção padrão;
- Tela - pré-processamento adequado para aplicativos de áreas de trabalho remotas;
- Digitalizar - pré-processamento adequado para arquivos digitalizados;
- Legado - usa as configurações padrão do mecanismo para pré-processar imagens.
Escala - O fator de escala do elemento de interface gráfica ou imagem selecionada. Quanto mais alto o número, mais a imagem é ampliada. Isso pode fornecer uma leitura melhor de OCR e é recomendado para imagens pequenas. Se você quiser reduzir a escala, valores entre 0 e 1 também são aceitos. Por padrão, o valor é 1.

Observação:
Se você quiser usar essa atividade de OCR do pacote UiPath.OmniPage.Activities v1.8.0 no Studio v19.10, instale o pacote UiPath.CoreIPC , versão 2.0.1 ou superior.

Importante:
Imagens de tamanho grande podem resultar em erro quando o fator de escala é maior que 1.

Saída

Result - The text extracted by the OCR engine along with their on-screen position, stored in a KeyValuePair<Rectangle,String>. This field supports only KeyValuePair<Rectangle,String>.
Text - The text extracted by the OCR engine, stored in a String variable. This field supports only String variables.

Idiomas suportados

A tabela a seguir mostra uma lista de todos os idiomas suportados pelo OmniPage OCR, bem como seus códigos de idioma correspondentes.

Tabela 1. Idiomas e códigos de idioma suportados para o OmniPage OCR - Idiomas do pacote básico

	Código de idioma
Africâner	AFR
Albanês	SQI
aimará	AYM
Basco	EUS
bemba	BEM
Blackfoot	BLA
Brasileiro	QBP
Bretão	BRE
Bugotu	BGT
Búlgaro	BUL
bielorrusso	BEL
Catalão	CAT
Chamorro	CHA
Checheno	CHE
corso	COS
Croata	HRV
Corvo	CRO
Checo	CES
Dinamarquês	DAN
Holandês	NLD
English	ENG
Esquimó (Inuit)	QES
esperanto	EPO
Estoniano	EST
faroense	FAO
Fijiano	FIJ
Finlandês	FIN
Francês	FRA
frísio	FRY
Friulano	FUR
Gaélico (irlandês)	GLE
Gaélico (escocês)	GLA
Galego	GLG
Ganda	LUG
Alemão	DEU
Grego	ELL
guarani	GRN
Hani *	HNI
havaiano	HAW
Húngaro	HUN
Islandês	ISL
Ido	IDO
Indonésio	IND
Interlingua	INA
Italiano	ITA
Kasub	CSB
Kawa*	WBM
Kikuyu	KIK
Congo	KON
Kpelle	KPE
curdo *	KUR
Latim	LAT
Letão	LAV
Lituano	LIT
luba	LUA
Luxemburguês	LTZ
Macedônio	MKD
Malgaxe	MLG
Malaio	MSA
Malinke	MLQ
maltês	MLT
maori	MRI
maia	MYN
Miao*	HMN
Minangkabau	Mín.
moicano	MOH
moldávio	MOL
náuatle	NAH
Norueguês	NOR
Nyanja	NYA
Ocidental	OCC
Ojibway	OJI
papiamento	PAP
Inglês pidgin	TPI
Polonês	POL
Português	POR
Provençal	PRV
Quechua	QUE
rético	ROH
Romeno	RON
romani	ROM
Ruanda	KIN
Rundi	Executar
Russo	RUS
Sami	SMI
Sami, Lule	SMJ
Sami, Norte	SME
Sami, Sul	SMA
samoano	SMO
sardo	SRD
Sérvio	SRP
sérvio, latino	QSL
Shona	SNA
sioux	DAK
Eslovaco	SLK
Esloveno	SLV
somali	SOM
Sorbian (Wend)	WEN
sotho	SOT
Espanhol	SPA
Sundanês	Dom
Suaíli	SWA
suazi	SSW
Sueco	SWE
Tagalog	TGL
taitiano	TAH
pirez	QTI
Tonganês	TON
Tswana (Chuana)	TSN
Tun *	TUG
Turco	TUR
Ucraniano	UKR
Visayan	QIS
Galês	CYM
Wolof	WOL
xhosa	XHO
zapoteca	ZAP
Zulu	ZUL
= Este idioma pode ser tratado apenas se for escrito usando o alfabeto latino.

Tabela 2. Idiomas e códigos de idioma suportados para o OmniPage OCR - Idiomas de pacote estendidos

	Código de idioma
Todos os idiomas incluídos no Basic Pack
Japonês	JPN
Chinês simplificado	QCS
Chinês tradicional	QCT
Coreano	KOR
Tailandês	THA
Árabe	ARA
Hebraico	HEB
vietnamita (latim)	VIE

Observação:

The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.

Nesta página

Description
Compatibilidade do projeto
Configuração
Painel de Propriedades
Idiomas suportados

Esta página foi útil?

AnteriorAtividades

AvançarGuias de instruções do OmniPage

Description​

Compatibilidade do projeto​

Configuração​

Painel de Propriedades​

Comum​

Entrada​

Diversos​

Opções​

Saída​

Idiomas suportados​

Esta página foi útil?

Description

Compatibilidade do projeto

Configuração

Painel de Propriedades

Comum

Entrada

Diversos

Opções

Saída

Idiomas suportados