Actividades: OmniPage OCR

activities

latest

false

Actividades de Document Understanding

Importante :

Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

OmniPage OCR

Actividad OmniPage OCR, que extrae texto e información posicional de elementos de la interfaz de usuario o imágenes utilizando el motor Nuance OmniPage.

UiPath.OmniPage.Activities

Importante:

El reconocimiento de escritura manual solo funciona para el texto escrito a mano, en el que los caracteres no tienen conexión. El tamaño ideal para un documento está entre 25 y 45 píxeles.

Descripción

Extrae una cadena y su información de un elemento de la IU o una imagen indicados mediante el motor OmniPage OCR . OmniPage OCR es una alternativa a los otros motores OCR, en todas las actividades que requieren implementaciones de motores OCR. Estos son algunos ejemplos de actividades que se pueden utilizar junto con OmniPage OCR:Hacer clic en texto OCR, Mantener el puntero sobre texto OCR, Hacer doble clic en texto OCR, Obtener texto OCR, Buscar posición de texto OCR, Digitalizar documento, Ámbito de pantalla CV, Obtener texto CV.

Nota:

El paquete UiPath.OmniPage.Activities, v1.9.0 o posterior, se ha actualizado a .NET5 core. Este cambio implica tener el marco .NET5 instalado en tu máquina si el paquete se ejecuta dentro de un flujo de trabajo heredado que no sea Windows.

Nota:

La actividad OmniPage OCR es compatible con el paquete UiPath.IntelligentOCR.Activities, v2.0.0 o superior, y puede utilizarse en cualquier contexto de OCR.

Compatibilidad de proyectos

Ventanas

Configuración

Panel de propiedades

Común

Nombre para mostrar: el nombre para mostrar de la actividad.

Entrada

Imagen: la imagen que desea procesar. Este campo solo admite variables Image.

Otros

Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.

Opciones

PaqueteDeMotor : especifica qué motor integrado debe utilizarse para el procesamiento de imágenes. Hay dos opciones: Básico : admite una amplia gama de idiomas, Ampliado : contiene soporte adicional para los idiomas asiático, árabe, tailandés, hebreo y vietnamita. Consulta la lista de todos los idiomas disponibles para el paquete básico al final de esta página.

Nota:
Para utilizar el motor extendido , debes instalar manualmente el paquete UiPath.OmniPage.Bundle.Extended en el proyecto actual desde el Gestor de paquetes.
ExtractWords - If selected, extracts the on-screen position of all detected words.
Language - The language used by the OCR engine. The default option is auto, meaning that the language is automatically detected. Multiple languages can be used separated by commas.

Nota:
Puedes usar la configuración para varios idiomas al mismo tiempo. Por ejemplo, puedes configurar "eng, fra" para procesar imágenes que contengan contenido tanto en inglés como en francés.
Ten en cuenta que la configuración de los idiomas japonés, coreano y chino activa un motor de reconocimiento dedicado. Solo se debe seleccionar uno de estos idiomas a la vez y no combinarlo con ningún idioma no asiático.
Los textos insertados cortos en inglés pueden reconocerse sin seleccionar el inglés como idioma de reconocimiento.
Perfil : elige un perfil de preprocesamiento para la imagen o elemento de IU especificado para lograr una mejor lectura de OCR. Las siguientes opciones están disponibles:
- Ninguno : no aplica un perfil de preprocesamiento, esta es la opción predeterminada;
- Pantalla : preprocesamiento adecuado para aplicaciones de escritorio remoto;
- Escanear : preprocesamiento adecuado para archivos escaneados;
- Legado : utiliza la configuración predeterminada del motor para el preprocesamiento de imágenes.
Escala: el factor de escalado del elemento o imagen de la IU escogido. Cuanto mayor sea el número, más se ampliará la imagen. Esto puede facilitar una mejor lectura OCR y es lo recomendado para imágenes pequeñas. Si quieres reducir la escala, también se aceptan valores entre 0 y 1. De forma predeterminada, el valor es 1.

Nota:
Si quieres utilizar esta actividad de OCR del paquete UiPath.OmniPage.Activities v1.8.0 en Studio v19.10, instala el paquete UiPath.CoreIPC , versión 2.0.1 o superior.

Importante:
Las imágenes de gran tamaño pueden dar lugar a un error cuando el factor de escala es superior a 1.

Salida

Result - The text extracted by the OCR engine along with their on-screen position, stored in a KeyValuePair<Rectangle,String>. This field supports only KeyValuePair<Rectangle,String>.
Text - The text extracted by the OCR engine, stored in a String variable. This field supports only String variables.

Idiomas admitidos

La siguiente tabla muestra una lista de todos los idiomas compatibles con OmniPage OCR, así como sus códigos de idioma correspondientes.

Tabla 1. Idiomas y códigos de idioma admitidos para OmniPage OCR: idiomas del paquete básico

	Código de idioma
Afrikáans	AFR
Albanés	SQI
Aymara	AYM
Vasco	EUS
Bemba	BEM
Pienegro	BLA
Brasileño	QBP
Bretón	BRE
Bugotu	BGT
Búlgaro	BUL
Bielorruso	BEL
Catalán	CAT
Chamorro	CHA
Checheno	CHE
Corso	COS
Croata	HRV
Crow	CRO
Checo	CES
Danés	DAN
Holandés	NLD
English	ENG
Esquimal (inuit)	QES
Esperanto	EPO
Estonio	EST
Islas Feroe	FAO
Fiyiano	FIJ
Finlandés	FIN
Francés	FRA
Frisón	FRY
Friulano	FUR
Gaélico (irlandés)	GLE
Gaélico (escocés)	GLA
Gallego	GLG
Ganda	LUG
Alemán	DEU
Griego	ELL
Guaraní	GRN
Hani *	HNI
Hawaiano	HAW
Húngaro	HUN
Islandés	ISL
Ido	IDO
Indonesio	IND
Interlingua	INA
Italiano	ITA
Kasub	CSB
Kawa *	WBM
Kikuyú	KIK
Congo	KON
Kpelle	KPE
Kurdo *	KUR
Latín	LAT
Letón	LAV
Lituano	LIT
Luba	LUA
Luxemburgués	LTZ
Macedonio	MKD
Malgache	MLG
Malayo	MSA
Malinke	MLQ
Maltés	MLT
Maorí	MRI
Maya	MYN
Miao *	HMN
Minangkabau	Mín.
Mohicano	MOH
Moldavo	MOL
El nahuatl	NAH
Noruego	NOR
Nyanja	NYA
Occidental	OCC
Ojibway	OJI
Papiamento	PAP
Pidgin inglés	TPI
Polaco	POL
Portugués	POR
Provenzales	PRV
Quechua	QUE
Rético	ROH
Rumano	RON
Gitano	ROM
Ruanda	KIN
Rundi	Iniciar
Ruso	RUS
Sami	SMI
Sami, Lule	SMJ
Sami, del Norte	SME
Sami, Sur	SMA
Samoano	SMO
Cerdeña	SRD
Serbio	SRP
Serbio, latín	QSL
Shona	SNA
Sioux	DAK
Eslovaco	SLK
Esloveno	SLV
Somalí	SOM
Sorabo (wend)	WEN
Sotho	SOT
Español	SPA
Sundanés	Dom
Suajili	SWA
Suaze	SSW
Sueco	SWE
Tagalo	TGL
Tahitiano	TAH
Pirez	QTI
Tongano	TON
Tswana (Chuana)	TSN
Tún *	TUG
Turco	TUR
Ucraniano	UKR
Visayan	QIS
Galés	CYM
Wolof	WOL
Xhosa	XHO
Zapoteco	ZAP
Zulú	ZUL
= Este idioma solo se puede manejar si está escrito con el alfabeto latín.

Tabla 2. Idiomas y códigos de idioma admitidos para OmniPage OCR - Extended Pack Languages

	Código de idioma
Todos los idiomas incluidos en el paquete básico
Japonés	JPN
Chino simplificado	QCS
Chino tradicional	QCT
Koreano	KOR
Tailandés	THA
Árabe	ARA
Hebreo	HEB
Vietnamita (latín)	VIE

Nota:

The Extended Pack can be used with the ISO/DIS 639-3 language codes mentioned above, with the ISO 639-1 and ISO 639-2 language codes, or with the actual name of the language.

En esta página

Descripción
Compatibilidad de proyectos
Configuración
Panel de propiedades
Idiomas admitidos

¿Te ha resultado útil esta página?

AnteriorActividades

Sig.Guías prácticas de OmniPage

Descripción​

Compatibilidad de proyectos​

Configuración​

Panel de propiedades​

Común​

Entrada​

Otros​

Opciones​

Salida​

Idiomas admitidos​

¿Te ha resultado útil esta página?

Descripción

Compatibilidad de proyectos

Configuración

Panel de propiedades

Común

Entrada

Otros

Opciones

Salida

Idiomas admitidos