- Información general
- Primeros pasos
- Actividades
- Paneles de Insights
- Proceso de Document Understanding
- Paquetes ML
- Información general
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 4506T: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación - Paquete ML
- Certificado de origen - Paquete ML
- Cheques: paquete ML
- Certificado de producto secundario - Paquete ML
- CMS 1500: paquete ML
- Declaración de conformidad UE - Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- Invoices Australia - ML package
- Invoices China - ML package
- Invoices India - ML package
- Invoices Japan - ML package
- Envío de facturas - Paquete ML
- Listas de embalaje: paquete ML
- Recibos de pago: paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Licencia
Introducción
El marco de Document Understanding de UiPath facilita el procesamiento de los archivos entrantes, desde la digitalización de archivos hasta la validación de los datos extraídos, todo ello en un entorno abierto, extensible y versátil.
Document Understanding está diseñado para ayudarte a combinar diferentes enfoques para extraer información de múltiples tipos de documentos. El objetivo principal es facilitar al máximo el proceso de extracción de datos: crear un único flujo de trabajo que extraiga datos de diversos documentos.
Antes de usar el marco de trabajo de Document Understanding, se recomienda entender los siguientes componentes del marco de trabajo de Document Understanding.
- What documents need to be processed and what data is required from them? Used to define the document types and the pieces of information targeted for data extraction (fields) for each document type, and formalizes this information into a dedicated Taxonomy structure. This metadata information is managed through the .
- ¿Qué contiene este archivo? Se usa para obtener el contenido textual y la estructura del documento entrante, convirtiendo un archivo en contenido legible por la máquina para que pueda ser procesado posteriormente.
- ¿Qué tipos de documentos de la taxonomía se encuentran en este archivo? Se usa para determinar automáticamente qué tipos de documentos se encuentran dentro de un archivo digitalizado.
- ¿Es correcta la clasificación prevista? Así puedo revisarla y corregirla. Se usa para facilitar la validación y corrección humana de los resultados de la clasificación automática y la división de documentos.
- ¿Revisó el humano los datos? Esta es la forma en la que el robot puede aprender de ellos. Se usa para devolver la información validada por los humanos a los clasificadores, para que la usen con el fin de mejorar sus futuras predicciones.
- ¿Qué datos se pueden encontrar en este documento concreto? Se usa para capturar la información requerida para el tipo de documento identificado, dentro del rango de documento de entrada y página de clasificación dados.
- ¿Es correcta la información extraída? Esta es la forma en la que puedo revisarla y corregirla. Se usa para facilitar la validación y corrección humana de los resultados de los datos extraídos automáticamente.
- ¿Revisó el humano los datos? Esta es la forma en la que el robot puede aprender de ellos. Se usa para devolver los datos extraídos validados por humanos a los extractores, para que los usen para mejorar sus predicciones de extracción.
- Permite exportar los datos validados para consumirlos.
- Lógica de medición y cobro se utiliza para explicar el consumo de unidades por página para cada servicio disponible.
El siguiente diagrama presenta los componentes del marco de Document Understanding y cómo se relacionan entre sí:
El marco de Document Understanding se encuentra en el paquete UiPath.IntelligentOCR.Activities . Una vez que se instala el paquete UiPath.IntelligentOCR.Activities , el asistente del Gestor de taxonomía aparece en la cinta superior de UiPath Studio. Este mismo paquete contiene todas las actividades del marco de comprensión de documentos básicos.
Las actividades de ámbito (Clasificar ámbito de documento, ámbito de extracción de información, entrenar el alcance de los clasificadores, entrenar el alcance de los extractores) que forman parte del marco de Document Understanding te permiten usar cualquier algoritmo de clasificación de documentos y de extracción de datos que se ajuste a tu caso de uso y luego entrenar estos algoritmos.
El marco de trabajo de Document Understanding se puede usar no solo con los clasificadores y extractores listos para usar, sino también con cualquier otro creado a medida. Pueden crearse usando las clases abstractas del paquete UiPath.DocumentProcessing.Contracts y se pueden implementar como actividades de clasificación o de extracción de datos. También se pueden crear motores OCR a medida con las clases abstractas del paquete UiPath.OCR.Contracts .
Los cursos dedicados de Document Understanding pueden encontrarse en UiPath RPA Academy.
El foro de la comunidad de UiPath es el lugar para recibir asistencia técnica de nuestra comunidad cada vez más creciente de usuarios.