Document Understanding
2021.10
False
Imagen de fondo del banner
Guía del usuario de Document Understanding
Última actualización 28 de feb. de 2024

Casillas de verificación y firmas

Casillas de verificación

En el contexto de un modelo de Extracción ML, las casillas de verificación no son un valor real, sino una forma de seleccionar un determinado texto.

Por ello, la palabra que está al lado se convierte en el punto de atención, no la casilla de verificación. Y este es precisamente el propósito de la casilla de verificación: servir de anclaje para una palabra específica.

En consecuencia, para entrenar un modelo ML es necesario etiquetar la palabra, no la casilla.

En algunos casos, no se detecta la casilla de verificación. Por ejemplo, el OCR podría leerla como una X, o tal vez se trate de alguna marca escrita a mano que no se detecta en absoluto. El modelo ML puede aprender y asociar todas estas situaciones con la palabra junto a la marca.

Por lo tanto, es más robusto entrenar un modelo para que reconozca una palabra, independientemente de cómo se seleccione: con una casilla de verificación, con una X o con una marca escrita a mano (rodeada, subrayada, etc.).

Casillas de verificación de una sola opción



Para el ejemplo anterior, puedes crear tres campos en Data Manager de la siguiente manera:

  • condition-employment (etiqueta la palabra );
  • condition-auto-accident (etiqueta la palabra );
  • condition-other-accident (etiqueta la palabra NO).

El modelo ML aprende a reconocer esas palabras, tanto si están marcadas con casillas, con X o simplemente rodeadas con bolígrafo. Para ello, puedes usar UiPath Document OCR, que puede reconocer incluso las casillas de verificación.

Casillas de verificación sin etiqueta

Hay casos en los que no hay ninguna etiqueta asociada a una casilla de verificación. Por ejemplo, cuando las casillas de verificación forman parte de tablas.

Este es un ejemplo típico:



En este caso, es necesario etiquetar los recuadros. El extractor devolverá el valor de la string de la casilla de verificación que sea uno de estos dos caracteres:

Estos dos caracteres se pueden copiar y pegar como cualquier otro, y se pueden usar en los flujos de trabajo para verificar si una casilla de verificación fue devuelta como checked o unchecked. Además, el marco IntelligentOCR sabe reconocerlos, especialmente si un campo se define como Boolean:
  • si el extractor devuelve ☒, esto corresponde a ;
  • Si el extractor devuelve ☐, esto corresponde a NO.

En los casos en los que una casilla no marcada se devuelva como O o D, o cuando una casilla marcada se devuelva como X, V, K o R, también se pueden incluir en la lógica del flujo de trabajo de RPA para que el flujo de trabajo sea más robusto cuando se produzcan estos tipos de errores de OCR.

Detección de firmas

Las firmas son características visuales que no son detectadas por ningún motor OCR, por lo que un modelo ML no puede detectarlas directamente.

Sin embargo, los Modelos ML de UiPath aprenden observando tanto las palabras como los píxeles de la imagen. Esto permite detectar firmas.

Veamos como ejemplo el siguiente formulario.



Al final de la página, junto a la firma, aparece el texto Signature of U.S. person. No importa cuál sea el texto, siempre que esté lo suficientemente cerca de la firma (siempre y cuando la firma exista). En el caso de las firmas, el procedimiento es similar al de las casillas de verificación (consulta la sección Casillas de verificación anterior).

Puedes crear un campo de texto llamado firma y, cuando el documento tenga una firma, etiquetar las palabras Signature of U.S. person como campo de firma. Si el documento no tiene firma, deja el campo vacío.

En ese caso, debes asegurarte de que tu conjunto de entrenamiento tiene aproximadamente la mitad de los documentos con firma y la otra mitad sin ella. También puede ser 60/40 %, pero no 80/20 % o 90/10 %. Además, debes tener al menos entre 20 y 30 muestras de cada uno para que el modelo sea capaz de aprenderlo.

De esta forma, puedes utilizar el modelo ML para la detección de firmas.

  • Casillas de verificación
  • Casillas de verificación de una sola opción
  • Casillas de verificación sin etiqueta
  • Detección de firmas

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.