activities
latest
false
UiPath logo, featuring letters U and I in white

Actividades de Document Understanding

Última actualización 5 de dic. de 2024

OmniPage OCR

UiPath.OmniPage.Activities

Importante: el reconocimiento de escritura a mano solo funciona para el texto escrito a mano, en el que los caracteres no tienen conexión. El tamaño ideal para un documento está entre 25 y 45 píxeles.

Descripción

Extrae una cadena y su información de un elemento o imagen de IU indicados mediante el motor de OCR de OmniPage . OmniPage OCR es una alternativa a los otros motores de OCR en todas las actividades que requieren implementaciones de motores de OCR. A continuación, se muestran algunos ejemplos de actividades que se pueden utilizar junto con OmniPage OCR: hacerclic en texto de OCR, mantener el puntero en texto de OCR, hacer doble clic en texto de OCR, obtener textode OCR, buscar la posición del textode OCR, digitalizar documento, ámbito de la pantallade CV y obtener texto.

Nota: El paquete UiPath.OmniPage.Activities, v1.9.0 o superior, se ha actualizado a .NET5 core. Este cambio implica tener .NET5 Framework instalado en tu máquina si el paquete se ejecuta dentro de un flujo de trabajo heredado que no es de Windows.
Nota: La actividad de OCR de OmniPage es compatible con el paquete UiPath.IntelligentOCR.Activities, v2.0.0 o superior y se puede utilizar en cualquier contexto de OCR.

Compatibilidad de proyectos

Windows-Legacy | Windows

Configuración

Panel de propiedades

Común

  • NombreParaMostrar: el nombre de la actividad para ser mostrado.

Entrada

  • Imagen: la imagen que desea procesar. Este campo solo admite variables Image.

Otros

  • Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.

Opciones

  • EnginePack : especifica qué motor integrado debe utilizarse para el procesamiento de imágenes. Hay dos opciones: Básico : admite una amplia gama de idiomas, Extendido : contiene soporte adicional para los idiomas asiático, árabe, tailandés, hebreo y vietnamita. Consulta la lista de todos los idiomas disponibles para el paquete básico al final de esta página.
    Nota: para utilizar el motor ampliado , debes instalar manualmente el paquete UiPath.OmniPage.Bundle.Extended en el proyecto actual desde el Administrador de paquetes.
  • ExtraerPalabras : si se selecciona, extrae la posición en pantalla de todas las palabras detectadas.
  • Idioma : el idioma que utiliza el motor de OCR. La opción predeterminada es auto, lo que significa que el idioma se detecta automáticamente. Se pueden utilizar varios idiomas separados por comas.
    Nota:

    Puedes usar la configuración para varios idiomas al mismo tiempo. Por ejemplo, puedes configurar "eng, fra" para procesar imágenes que contengan contenido tanto en inglés como en francés.

    Ten en cuenta que la configuración de los idiomas japonés, coreano y chino activa un motor de reconocimiento dedicado. Solo se debe seleccionar uno de estos idiomas a la vez y no combinarlo con ningún idioma no asiático.

    Los textos insertados cortos en inglés pueden reconocerse sin seleccionar el inglés como idioma de reconocimiento.

  • Perfil : elige un perfil de preprocesamiento para la imagen o elemento de IU especificado para lograr una mejor lectura de OCR. Las siguientes opciones están disponibles:
    • Ninguno : no aplica un perfil de preprocesamiento, esta es la opción predeterminada;
    • Pantalla : preprocesamiento adecuado para aplicaciones de escritorio remoto;
    • Escanear : preprocesamiento adecuado para archivos escaneados;
    • Legado : utiliza la configuración predeterminada del motor para el preprocesamiento de imágenes.
  • Escala : el factor de escala del elemento o la imagen de la IU seleccionados. Cuanto más alto sea el número, más ampliará la imagen. Esto puede proporcionar una mejor lectura de OCR y se recomienda con imágenes pequeñas. Si quieres reducir la escala, también se aceptan valores entre 0 y 1. De forma predeterminada, el valor es 1.
    Nota: si quieres utilizar esta actividad OCR del paquete UiPath.OmniPage.Activities v1.8.0 en Studio v19.10, instala el paquete UiPath.CoreIPC , versión 2.0.1 o superior.
    Importante: las imágenes de gran tamaño pueden generar un error si el factor de escala es superior a 1.

Salida

  • Resultado : el texto extraído por el motor de OCR junto con su posición en pantalla, almacenado en una KeyValuePair<Rectangle,String>. Este campo solo admite KeyValuePair<Rectangle,String>.
  • Texto : el texto extraído por el motor de OCR, almacenado en una variable de tipo String. Este campo solo admite String variables.

Idiomas admitidos

La siguiente tabla muestra una lista de todos los idiomas compatibles con OmniPage OCR, así como sus códigos de idioma correspondientes.

Tabla 1. Idiomas y códigos de idioma admitidos para OmniPage OCR: idiomas del paquete básico
 

Código de idioma

Afrikáans

AFR

Albanés

SQI

Aymara

AYM

Vasco

EUS

Bemba

BEM

Pienegro

BLA

Brasileño

QBP

Bretón

BRE

Bugotu

BGT

Búlgaro

BUL

Bielorruso

BEL

Catalán

CAT

Chamorro

CHA

Checheno

CHE

Corso

COS

Croata

HRV

Crow

CRO

Checo

CES

Danés

DAN

Holandés

NLD

English

ENG

Esquimal (inuit)

QES

Esperanto

EPO

Estonio

EST

Islas Feroe

FAO

Fiyiano

FIJ

Finlandés

FIN

Francés

FRA

Frisón

FRY

Friulano

FUR

Gaélico (irlandés)

GLE

Gaélico (escocés)

GLA

Gallego

GLG

Ganda

LUG

Alemán

DEU

Griego

ELL

Guaraní

GRN

Hani *

HNI

Hawaiano

HAW

Húngaro

HUN

Islandés

ISL

Ido

IDO

Indonesio

IND

Interlingua

INA

Italiano

ITA

Kasub

CSB

Kawa *

WBM

Kikuyú

KIK

Congo

KON

Kpelle

KPE

Kurdo *

KUR

Latín

LAT

Letón

LAV

Lituano

LIT

Luba

LUA

Luxemburgués

LTZ

Macedonio

MKD

Malgache

MLG

Malayo

MSA

Malinke

MLQ

Maltés

MLT

Maorí

MRI

Maya

MYN

Miao *

HMN

Minangkabau

Mín.

Mohicano

MOH

Moldavo

MOL

El nahuatl

NAH

Noruego

NOR

Nyanja

NYA

Occidental

OCC

Ojibway

OJI

Papiamento

PAP

Pidgin inglés

TPI

Polaco

POL

Portugués

POR

Provenzales

PRV

Quechua

QUE

Rético

ROH

Rumano

RON

Gitano

ROM

Ruanda

KIN

Rundi

Iniciar

Ruso

RUS

Sami

SMI

Sami, Lule

SMJ

Sami, del Norte

SME

Sami, Sur

SMA

Samoano

SMO

Cerdeña

SRD

Serbio

SRP

Serbio, latín

QSL

Shona

SNA

Sioux

DAK

Eslovaco

SLK

Esloveno

SLV

Somalí

SOM

Sorabo (wend)

WEN

Sotho

SOT

Español

SPA

Sundanés

Dom

Suajili

SWA

Suaze

SSW

Sueco

SWE

Tagalo

TGL

Tahitiano

TAH

Pirez

QTI

Tongano

TON

Tswana (Chuana)

TSN

Tún *

TUG

Turco

TUR

Ucraniano

UKR

Visayan

QIS

Galés

CYM

Wolof

WOL

Xhosa

XHO

Zapoteco

ZAP

Zulú

ZUL

= Este idioma solo se puede manejar si está escrito con el alfabeto latín.

 
Tabla 2. Idiomas y códigos de idioma admitidos para OmniPage OCR: idiomas del paquete ampliado
 

Código de idioma

Todos los idiomas incluidos en el paquete básico

 

Japonés

JPN

Chino simplificado

QCS

Chino tradicional

QCT

Koreano

KOR

Tailandés

THA

Árabe

ARA

Hebreo

HEB

Vietnamita (latín)

VIE

Nota: El paquete ampliado se puede utilizar con los códigos de idioma ISO / DIS 639-2 mencionados anteriormente, con los códigos de idioma ISO 639-1 e ISO 639-2 o con el nombre real del idioma.
  • Descripción
  • Compatibilidad de proyectos
  • Configuración
  • Idiomas admitidos

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.