- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado

Actividades de Document Understanding
Validación manual para digitalizar documentos
El siguiente ejemplo explica cómo extraer manualmente datos de una imagen y presentar la salida en un archivo independiente. Presenta actividades como Digitalizar documento o Presentar estación de validación. Puedes encontrar estas actividades en el paquete UiPath.IntelligentOCR.Activities .
This workflow is using an older version of the UiPath.IntelligentOCR.Activities package.
Steps:
-
Abre Studio y crea un nuevo Proceso llamado Principal de forma predeterminada.
Nota:Make sure to add all the needed files (
.jsonfiles and all the images) inside the project folder. -
Añade un contenedor Secuencia en el Diseñador de flujo de trabajo y crea las variables mostradas en la siguiente tabla:
Tabla 1. Variables que se crearán
Tipo de variable Valor predeterminado TextCadena DOMUiPath.DocumentProcessing.Contracts.Dom.Document DataUiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy DocumentTaxonomyUiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy TaxonomyJSONCadena HumanValidatedUiPath.DocumentProcessing.Contracts.Results.ExtractionResult -
Añade una actividad Leer archivo de texto dentro de la secuencia.
- In the Properties panel, add the name of the file, in this case
"taxonomy.json", in the FileName field. - Add the variable
TaxonomyJSONin the Content field.
- In the Properties panel, add the name of the file, in this case
-
Añade una actividad Asignar después de la actividad Leer archivo de texto.
- Add the variable
Datain the To field and the expressionDocumentTaxonomy.Deserialize(TaxonomyJSON)in the Value field. This activity builds the taxonomy for extraction.
- Add the variable
-
Añade una actividad Digitalizar documento después de la actividad Asignar.
- In the Properties panel, add the value
1in the DegreeOfParallelism field. - Add the expression
"Input\Invoice01.tif"in the DocumentPath field. - Add the variable
DOMin the DocumentObjectModel field. - Add the variable
Textin the DocumentText field.
- In the Properties panel, add the value
-
Añade un motor Google OCR dentro de la actividad Digitalizar documento.
- En el panel de propiedades, añade la variable
Imageal campo Imagen. - Select the check box for the ExtractWords option. This option extracts the on-screen position of all detected words.
- Add the expression
"eng"in the Language field. - Select the option
Legacyfrom the Profile drop-down list. - Agrega el valor
2en el campo Escala.
- En el panel de propiedades, añade la variable
-
Añade una actividad Estación de validación presente después de la actividad Digitalizar documento.
- In the Properties panel, add the variable
DOMin the DocumentObjectModel field. - Add the expression
"Input\Invoice01.tif"in the DocumentPath field. - Add the variable
Textin the DocumentText field. - Add the variable
Datain the Taxonomy field. - Add the variable
HumanValidatedin the ValidatedExtractionResults field.
- In the Properties panel, add the variable
-
Añade una actividad Para cada en la actividad Estación de validación presente.
- In the Properties panel, select the option
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPointfrom the TypeArgument drop-down list. - Add the expression
HumanValidated.ResultsDocument.Fieldsin the Values field.
- In the Properties panel, select the option
-
Add a Log Message activity inside the Body of the For Each activity.
- Select the option
Infofrom the Level drop-down list. - Agrega la expresión
item.FieldNameen el campo Mensaje.
- Select the option
-
Añade una actividad Mensaje de registro debajo de la primera actividad Mensaje de registro.
- Selecciona la opción
Infode la lista desplegable Nivel. - Agrega la expresión
item.Values(0).Value.ToStringen el campo Mensaje.
- Selecciona la opción
-
Añade una actividad Escritura de línea en las actividades de Registro de mensaje.
- Añade el valor
""al campo Texto.
- Añade el valor
-
Ejecuta el proceso. El robot utiliza las actividades IntelligentOCR para procesar manualmente los datos y presentar los resultados.
Visita el siguiente enlace para descargar el ejemplo como archivo ZIP : Ejemplo.