- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
Esta página te muestra cómo crear un flujo de trabajo que incluya actividades como Digitalizar documento, Ámbito de extracción de datos y Estación de validación actual.
Puedes utilizar estas actividades cuando deseas automatizar la extracción y validación de datos a partir de documentos del mismo tipo. Las facturas u órdenes de compra son un gran ajuste para este tipo de tareas.
El siguiente flujo de trabajo se centra en el uso de la actividad Digitalizar documento en una factura, seguido de la validación de la información con el uso de la actividad Estación de validación presente . El motor OCR elegido para este flujo de trabajo es UiPath® Document OCR, pero puedes reemplazarlo por cualquier otro de nuestros motores OCR. Se utiliza una taxonomía sencilla, creada en función del documento de factura elegido. Consulta Descripción general de la taxonomía para comprobar cómo crear tu taxonomía.
Crear el flujo de trabajo
-
Abre Studio y crea un nuevo Proceso llamado Principal de forma predeterminada.
-
Drag a Sequence container into the Workflow Designer.
-
Selecciona el contenedor Secuencia y crea la siguiente variable:
- Nombre de la variable:
taxonomy; - Tipo de variable: DocumentTaxonomy;
- Valor predeterminado: ninguno.
- Nombre de la variable:
-
Añade una actividad Cargar taxonomía dentro del contenedor Secuencia.
Add the variable
taxonomyin the Taxonomy field. -
Añade una actividad Para cada después de la actividad Cargar taxonomía y dentro del contenedor Secuencia.
- Add the expression
docin the ForEach field. - Add the expression
directory.GetFiles("TestData\InputDocs\")in the In field. - In the Properties panel, select the option String from the TypeArgument dropdown list.
- Add the expression
-
Selecciona el contenedor Cuerpo de la actividad Para cada y crea las variables mostradas en la siguiente tabla:
Tabla 1. Las variables que se crearán
Tipo de variable Valor predeterminado docNameValorGenérico N/D domDocumento N/D textCadena N/D extractionResultsResultadoDeExtracción N/D validatedResultsResultadoDeExtracción N/D -
Add an Assign activity inside the Body container.
- Añade la variable
docNameen el campo Para. - Agrega la expresión
System.IO.Path.GetFileNameWithoutExtension(doc)en el campo Valor.
- Añade la variable
-
Añade una actividad Escribir línea después de la actividad Asignar.
Añada la expresión
"Digitizing "+docNameen el campo Texto. -
Añade una actividad Digitalizar documento después de la actividad Escribir línea.
- Set the DocumentPath as
doc. - Add the variable
textin the DocumentText field. - Add the variable
domin the DocumentObjectModel field.
- Set the DocumentPath as
-
Drag an OCR engine into the Digitize Document activity. UiPath Document OCR is used for this example.
-
Añade una actividad Escribir línea después de la actividad Digitalizar documento .
Añada la expresión
docName+" was digitized."en el campo Texto. -
Añade una actividad Escribir línea después de la actividad Escribir línea.
Añada la expresión
"Opening the Validation Station"en el campo Texto. -
Añade una actividad Intentar capturar después de la actividad Escribir línea.
-
Add a Sequence container in the Try section.
-
Add a Present Validation Station activity inside the Sequence container.
- Add
docas value in the DocumentPath field. - Add the variable
textin the DocumentText field. - Add the variable
domin the DocumentObjectMOdel field. - Add the variable
taxonomyin the Taxonomy field. - Add the variable
extractedResultsin the AutomaticExtractionResults field. - Add the variable
validatedResultsin the ValidatedExtractionResults field.
- Add
-
Añade una actividad Escribir archivo de texto después de la actividad Estación de validación presente.
-
Ejecuta el proceso. El robot extrae datos automáticamente, clasifica los documentos, extrae un campo específico, prepara los datos para su validación y muestra los documentos extraídos.
Visita el siguiente enlace para descargar un archivo ZIP del ejemplo: Ejemplo.
Uso de la estación de validación
Running the workflow opens the Validation Station wizard. Here you can verify the extracted information or extract it yourself by using the Tokens or Custom Area options. If you set a field in the taxonomy as multi-value, then multiple values can be extracted for that field. This can be useful for documents with multiple addresses, different currencies, etc.