- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
En esta página explica cómo utilizar Document Manager para etiquetar un nuevo conjunto de datos y volver a entrenar un modelo ML.
Access and configure Document Manager
Inicia la sesión de etiquetado de datos creada en Experiencia de primera ejecución y ve a la configuración para configurar el OCR.
Elige el OCR que deseas utilizar en el menú desplegable Método de OCR . Para UiPathDocumentOCR, pega la clave de licencia de Document UnderstandingTM (recupera la clave API de Document Understanding de la página Admin > Licencia ) y luego pega la URL de OCR que generaste al implementar UiPathDocumentOCR. Consulta Implementar UiPathDocumentOCR.
Configura el preetiquetado con los modelos que has implementado siguiendo las instrucciones descritas en Implementar un paquete ML listo para usar. Pega el punto final público del modelo Habilidad ML y la clave de licencia de Document Understanding y, a continuación, selecciona Guardar.
Para obtener más información, consulta la documentación aquí: Usar un esquema predefinido.
Importa el documento
- Selecciona el botón Importar
desde una sesión del Gestor de documentos. - Nombra el conjunto de datos y selecciona Explorar archivos para cargar.
- Selecciona el documento que deseas cargar.
- Selecciona SÍ.
Create extraction fields
Selecciona
para crear los campos que se van a extraer.
Puedes crear hasta 40 campos.
For this validation exercise, you can create some common invoice fields such as date, name, invoice-no, and total. Please ensure to change the content type accordingly - date (date), name (string), invoice-no (string), and total (number).
Etiquetar documentos
Ahora puedes empezar a etiquetar los documentos.
Selecciona el botón Predecir
en la parte superior para utilizar el modelo de factura base para predecir las etiquetas para los campos definidos y corrígelo si la predicción es incorrecta.
Para cambiar la etiqueta, arrastra el ratón sobre el campo y pulsa el atajo de teclado para etiquetarlo.
Utiliza la flecha de la parte superior para pasar al siguiente documento hasta que hayas terminado la validación de etiquetas de todas las facturas cargadas.
Dado que el modelo base de Facturas ya ha funcionado muy bien y la factura de muestra es simple sin demasiada variación, la precisión de la predicción es cercana al 100 % en este caso y es posible que no tengas que corregir ninguna etiqueta.
Exportar documentos
- Asegúrate de seleccionar el conjunto de datos correcto en el filtrado de conjuntos de datos y selecciona el botón Exportar
. - Selecciona Exportar.
- Ve a Conjuntos de datos en el mismo proyecto de AI Center, debes observar el conjunto de datos de entrenamiento exportado.
Entrenar un modelo personalizado en AI Center
- Go to Pipelines > Create new. Please select the evaluation run type, select the model package and the input dataset.
- Selecciona la subcarpeta bajo Exportar como conjunto de datos de entrada.
- Selecciona Crear para iniciar el proceso. El proceso puede tardar entre 1 y 2 horas en ejecutarse en máquinas con CPU.
Deploy the retrained ML model as an ML Skill
Go to ML Skills and create a new ML Skill.
Elige el mismo paquete de modelo de factura anteriormente creado. Como hemos reentrenado el modelo, ahora hay una nueva versión inferior del paquete (1 frente a 0). Asegúrate de seleccionar la más reciente.
Una vez creada la habilidad ML, ve a Modificar implementación actual para hacerla pública. Cambia la alternancia y selecciona Confirmar.
Copia la URL de la Habilidad ML pública para su uso posterior.
Congrats! You have now retrained an Invoice model with your own dataset and created the endpoint to access the model.