- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Paquetes ML
- Procesos
- Gestor de datos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Extractor de forma
El Extractor de formularios es el más adecuado para extraer, comparar y notificar información específica mediante el análisis de la posición de la palabra en el documento, o la detección de una firma.
El Extractor de formularios se basa en plantillas definidas de antemano en la fase de diseño. Un complejo conjunto de reglas aplica las plantillas configuradas a los documentos entrantes que deben procesarse, identificando y comunicando la información prevista.
La actividad trae un asistente de configuración para ayudarte a definir las plantillas para los campos y los tipos de documento que quieras utilizar para la extracción de datos.
La actividad admite tanto la extracción de campos simples como de campos de tabla y, como ya se ha mencionado, puede detectar un campo de firma.
Más información relacionada con el Extractor de formularios:
- Página de la actividad Extractor de formularios
- Instrucciones de configuración del Gestor de taxonomía
- Instrucciones de configuración del asistente del Gestor de plantillas
- Ejemplo de flujo de trabajo Basado en anclajes
Se recomienda buscar otros métodos de extracción si:
- hay que manejar muchos diseños;
-
Los documentos no solo están sesgados, girados o tienen tamaños diferentes, sino que también manifiestan "deformación" (curvatura en ciertas zonas).
Nota:En el caso de extracción de formularios fijos, para evaluar si los diseños de dos archivos son los mismos, prueba a superponerlos en una herramienta, con cierta transparencia, para ver si todo el contenido no variable se superpone (después de desrotar, desestructurar y poner las dos imágenes a la misma escala).
Si observas variabilidad (el contenido no variable aparece más a la izquierda/derecha/arriba/abajo en determinadas zonas del documento), entonces los diseños no se consideran iguales.
El Extractor de formularios permite definir varias plantillas para el mismo tipo de documento y en tiempo de ejecución:
- identifica la mejor plantilla para el documento entrante y el tipo de documento;
- aplica el algoritmo de coincidencia de plantillas, basado en los anclajes de las páginas, a cada una de las páginas de las que hay que extraer datos (no se admiten páginas ausentes o repetidas);
- aplica todos los ajustes de anclaje en los campos a cada página, con el fin de capturar los valores asociados a las posibles coincidencias;
- notifica la información identificada de las áreas de valores de destino.
También admite el ajuste del procesamiento de casillas de verificación/campos booleanos, permitiendo la configuración del valor "Sinónimos para Sí" o "Sinónimos para No", según el caso de uso.
Este extractor no tiene capacidad de aprendizaje (entrenamiento) y requiere configuración.
El Extractor de formularios tiene dos configuraciones principales a tener en cuenta:
- El asistente del Gestor de plantillas, que permite definir las plantillas que se aplicarán a los documentos entrantes. Este asistente también habilita el Editor de plantillas y la configuración de interpretación de campos booleanos.
- La configuración PorcentajeMínimoDeSuperposición te permite controlar lo estricto que debe ser el ajuste del área de valores. Acepta un valor entre
0
y100
, y controla qué palabras se aceptan o rechazan para formar parte de un valor determinado, en función de lo bien que se ajuste su ubicación al área definida en la plantilla.
Puedes encontrar más información sobre el uso del asistente de actividades del Extractor de formularios aquí.