Document Understanding
2022.4
False
Imagen de fondo del banner
Guía del usuario de Document Understanding
Última actualización 13 de mar. de 2024

Extractor de forma

Qué es el Extractor de formularios

El Extractor de formularios es el más adecuado para extraer, comparar y notificar información específica mediante el análisis de la posición de la palabra en el documento, o la detección de una firma.

El Extractor de formularios se basa en plantillas definidas de antemano en la fase de diseño. Un complejo conjunto de reglas aplica las plantillas configuradas a los documentos entrantes que deben procesarse, identificando y comunicando la información prevista.

La actividad trae un asistente de configuración para ayudarte a definir las plantillas para los campos y los tipos de documento que quieras utilizar para la extracción de datos.

La actividad admite tanto la extracción de campos simples como de campos de tabla y, como ya se ha mencionado, puede detectar un campo de firma.

Nota:

Más información relacionada con el Extractor de formularios:

Se recomienda buscar otros métodos de extracción si:

  • hay que manejar muchos diseños;
  • Los documentos no solo están sesgados, girados o tienen tamaños diferentes, sino que también manifiestan "deformación" (curvatura en ciertas zonas).

    Nota:

    En el caso de extracción de formularios fijos, para evaluar si los diseños de dos archivos son los mismos, prueba a superponerlos en una herramienta, con cierta transparencia, para ver si todo el contenido no variable se superpone (después de desrotar, desestructurar y poner las dos imágenes a la misma escala).

    Si observas variabilidad (el contenido no variable aparece más a la izquierda/derecha/arriba/abajo en determinadas zonas del documento), entonces los diseños no se consideran iguales.

    El Extractor de formularios permite definir varias plantillas para el mismo tipo de documento y en tiempo de ejecución:

  • identifica la mejor plantilla para el documento entrante y el tipo de documento;
  • aplica el algoritmo de coincidencia de plantillas, basado en los anclajes de las páginas, a cada una de las páginas de las que hay que extraer datos (no se admiten páginas ausentes o repetidas);
  • aplica todos los ajustes de anclaje en los campos a cada página, con el fin de capturar los valores asociados a las posibles coincidencias;
  • notifica la información identificada de las áreas de valores de destino.

También admite el ajuste del procesamiento de casillas de verificación/campos booleanos, permitiendo la configuración del valor "Sinónimos para Sí" o "Sinónimos para No", según el caso de uso.

Este extractor no tiene capacidad de aprendizaje (entrenamiento) y requiere configuración.

Cómo configurar

Configuración de la actividad

El Extractor de formularios tiene dos configuraciones principales a tener en cuenta:

  • El asistente del Gestor de plantillas, que permite definir las plantillas que se aplicarán a los documentos entrantes. Este asistente también habilita el Editor de plantillas y la configuración de interpretación de campos booleanos.
  • La configuración PorcentajeMínimoDeSuperposición te permite controlar lo estricto que debe ser el ajuste del área de valores. Acepta un valor entre 0 y 100, y controla qué palabras se aceptan o rechazan para formar parte de un valor determinado, en función de lo bien que se ajuste su ubicación al área definida en la plantilla.

Puedes encontrar más información sobre el uso del asistente de actividades del Extractor de formularios aquí.

  • Qué es el Extractor de formularios
  • Cómo configurar
  • Configuración de la actividad

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.