- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
OmniPage OCR
UiPath.OmniPage.Activities
Extrae una cadena y su información de un elemento o imagen de IU indicados mediante el motor de OCR de OmniPage . OmniPage OCR es una alternativa a los otros motores de OCR en todas las actividades que requieren implementaciones de motores de OCR. A continuación, se muestran algunos ejemplos de actividades que se pueden utilizar junto con OmniPage OCR: hacerclic en texto de OCR, mantener el puntero en texto de OCR, hacer doble clic en texto de OCR, obtener textode OCR, buscar la posición del textode OCR, digitalizar documento, ámbito de la pantallade CV y obtener texto.
Panel de propiedades
Común
- NombreParaMostrar: el nombre de la actividad para ser mostrado.
Entrada
- Imagen: la imagen que desea procesar. Este campo solo admite variables
Image
.
Otros
- Privado : si se selecciona, los valores de variables y argumentos ya no se registran en el nivel Detallado.
Opciones
- EnginePack : especifica qué motor integrado debe utilizarse para el procesamiento de imágenes. Hay dos opciones: Básico : admite una amplia gama de idiomas, Extendido : contiene soporte adicional para los idiomas asiático, árabe, tailandés, hebreo y vietnamita. Consulta la lista de todos los idiomas disponibles para el paquete básico al final de esta página.
Nota: para utilizar el motor ampliado , debes instalar manualmente el paquete UiPath.OmniPage.Bundle.Extended en el proyecto actual desde el Administrador de paquetes.
- ExtraerPalabras : si se selecciona, extrae la posición en pantalla de todas las palabras detectadas.
- Idioma : el idioma que utiliza el motor de OCR. La opción predeterminada es auto, lo que significa que el idioma se detecta automáticamente. Se pueden utilizar varios idiomas separados por comas.
Nota:
Puedes usar la configuración para varios idiomas al mismo tiempo. Por ejemplo, puedes configurar "eng, fra" para procesar imágenes que contengan contenido tanto en inglés como en francés.
Ten en cuenta que la configuración de los idiomas japonés, coreano y chino activa un motor de reconocimiento dedicado. Solo se debe seleccionar uno de estos idiomas a la vez y no combinarlo con ningún idioma no asiático.
Los textos insertados cortos en inglés pueden reconocerse sin seleccionar el inglés como idioma de reconocimiento.
- Perfil : elige un perfil de preprocesamiento para la imagen o elemento de IU especificado para lograr una mejor lectura de OCR. Las siguientes opciones están disponibles:
- Ninguno : no aplica un perfil de preprocesamiento, esta es la opción predeterminada;
- Pantalla : preprocesamiento adecuado para aplicaciones de escritorio remoto;
- Escanear : preprocesamiento adecuado para archivos escaneados;
- Legado : utiliza la configuración predeterminada del motor para el preprocesamiento de imágenes.
- Escala : el factor de escala del elemento o la imagen de la IU seleccionados. Cuanto más alto sea el número, más ampliará la imagen. Esto puede proporcionar una mejor lectura de OCR y se recomienda con imágenes pequeñas. Si quieres reducir la escala, también se aceptan valores entre 0 y 1. De forma predeterminada, el valor es 1.
Nota: si quieres utilizar esta actividad OCR del paquete UiPath.OmniPage.Activities v1.8.0 en Studio v19.10, instala el paquete UiPath.CoreIPC , versión 2.0.1 o superior.Importante: las imágenes de gran tamaño pueden generar un error si el factor de escala es superior a 1.
Salida
- Resultado : el texto extraído por el motor de OCR junto con su posición en pantalla, almacenado en una
KeyValuePair<Rectangle,String>
. Este campo solo admiteKeyValuePair<Rectangle,String>
. - Texto : el texto extraído por el motor de OCR, almacenado en una variable de tipo String. Este campo solo admite
String
variables.
La siguiente tabla muestra una lista de todos los idiomas compatibles con OmniPage OCR, así como sus códigos de idioma correspondientes.
Código de idioma | |
---|---|
Afrikáans |
AFR |
Albanés |
SQI |
Aymara |
AYM |
Vasco |
EUS |
Bemba |
BEM |
Pienegro |
BLA |
Brasileño |
QBP |
Bretón |
BRE |
Bugotu |
BGT |
Búlgaro |
BUL |
Bielorruso |
BEL |
Catalán |
CAT |
Chamorro |
CHA |
Checheno |
CHE |
Corso |
COS |
Croata |
HRV |
Crow |
CRO |
Checo |
CES |
Danés |
DAN |
Holandés |
NLD |
English |
ENG |
Esquimal (inuit) |
QES |
Esperanto |
EPO |
Estonio |
EST |
Islas Feroe |
FAO |
Fiyiano |
FIJ |
Finlandés |
FIN |
Francés |
FRA |
Frisón |
FRY |
Friulano |
FUR |
Gaélico (irlandés) |
GLE |
Gaélico (escocés) |
GLA |
Gallego |
GLG |
Ganda |
LUG |
Alemán |
DEU |
Griego |
ELL |
Guaraní |
GRN |
Hani * |
HNI |
Hawaiano |
HAW |
Húngaro |
HUN |
Islandés |
ISL |
Ido |
IDO |
Indonesio |
IND |
Interlingua |
INA |
Italiano |
ITA |
Kasub |
CSB |
Kawa * |
WBM |
Kikuyú |
KIK |
Congo |
KON |
Kpelle |
KPE |
Kurdo * |
KUR |
Latín |
LAT |
Letón |
LAV |
Lituano |
LIT |
Luba |
LUA |
Luxemburgués |
LTZ |
Macedonio |
MKD |
Malgache |
MLG |
Malayo |
MSA |
Malinke |
MLQ |
Maltés |
MLT |
Maorí |
MRI |
Maya |
MYN |
Miao * |
HMN |
Minangkabau |
Mín. |
Mohicano |
MOH |
Moldavo |
MOL |
El nahuatl |
NAH |
Noruego |
NOR |
Nyanja |
NYA |
Occidental |
OCC |
Ojibway |
OJI |
Papiamento |
PAP |
Pidgin inglés |
TPI |
Polaco |
POL |
Portugués |
POR |
Provenzales |
PRV |
Quechua |
QUE |
Rético |
ROH |
Rumano |
RON |
Gitano |
ROM |
Ruanda |
KIN |
Rundi |
Iniciar |
Ruso |
RUS |
Sami |
SMI |
Sami, Lule |
SMJ |
Sami, del Norte |
SME |
Sami, Sur |
SMA |
Samoano |
SMO |
Cerdeña |
SRD |
Serbio |
SRP |
Serbio, latín |
QSL |
Shona |
SNA |
Sioux |
DAK |
Eslovaco |
SLK |
Esloveno |
SLV |
Somalí |
SOM |
Sorabo (wend) |
WEN |
Sotho |
SOT |
Español |
SPA |
Sundanés |
Dom |
Suajili |
SWA |
Suaze |
SSW |
Sueco |
SWE |
Tagalo |
TGL |
Tahitiano |
TAH |
Pirez |
QTI |
Tongano |
TON |
Tswana (Chuana) |
TSN |
Tún * |
TUG |
Turco |
TUR |
Ucraniano |
UKR |
Visayan |
QIS |
Galés |
CYM |
Wolof |
WOL |
Xhosa |
XHO |
Zapoteco |
ZAP |
Zulú |
ZUL |
= Este idioma solo se puede manejar si está escrito con el alfabeto latín. |
Código de idioma | |
---|---|
Todos los idiomas incluidos en el paquete básico | |
Japonés |
JPN |
Chino simplificado |
QCS |
Chino tradicional |
QCT |
Koreano |
KOR |
Tailandés |
THA |
Árabe |
ARA |
Hebreo |
HEB |
Vietnamita (latín) |
VIE |