document-understanding

2021.10

false

Importante :

La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Sin asistencia

Guía del usuario de Document Understanding

ENTREGA:

Automation Cloud Automation Cloud Public Sector Automation Suite Standalone

Última actualización 4 de feb. de 2025

Casillas de verificación y firmas

Casillas de verificación

En el contexto de un modelo de Extracción ML, las casillas de verificación no son un valor real, sino una forma de seleccionar un determinado texto.

Por ello, la palabra que está al lado se convierte en el punto de atención, no la casilla de verificación. Y este es precisamente el propósito de la casilla de verificación: servir de anclaje para una palabra específica.

En consecuencia, para entrenar un modelo ML es necesario etiquetar la palabra, no la casilla.

En algunos casos, no se detecta la casilla de verificación. Por ejemplo, el OCR podría leerla como una X, o tal vez se trate de alguna marca escrita a mano que no se detecta en absoluto. El modelo ML puede aprender y asociar todas estas situaciones con la palabra junto a la marca.

Por lo tanto, es más robusto entrenar un modelo para que reconozca una palabra, independientemente de cómo se seleccione: con una casilla de verificación, con una X o con una marca escrita a mano (rodeada, subrayada, etc.).

Casillas de verificación de una sola opción

Para el ejemplo anterior, puedes crear dos campos en el Gestor de datos de esta manera:

condition-employment (etiqueta la palabra SÍ);
condition-auto-accident (etiqueta la palabra SÍ);

El modelo ML aprende a reconocer esas palabras, tanto si están marcadas con casillas, con X o simplemente rodeadas con bolígrafo. Para ello, puedes usar UiPath Document OCR, que puede reconocer incluso las casillas de verificación.

Casillas de verificación sin etiqueta

Hay casos en los que no hay ninguna etiqueta asociada a una casilla de verificación. Por ejemplo, cuando las casillas de verificación forman parte de tablas.

Este es un ejemplo típico:

En este caso, es necesario etiquetar los recuadros. El extractor devolverá el valor de la string de la casilla de verificación que sea uno de estos dos caracteres:

Estos dos caracteres se pueden copiar y pegar como cualquier otro, y se pueden usar en los flujos de trabajo para verificar si una casilla de verificación fue devuelta como checked o unchecked. Además, el marco IntelligentOCR sabe reconocerlos, especialmente si un campo se define como Boolean:

si el extractor devuelve ☒, esto corresponde a SÍ;
Si el extractor devuelve ☐, esto corresponde a NO.

En los casos en los que una casilla no marcada se devuelva como O o D, o cuando una casilla marcada se devuelva como X, V, K o R, también se pueden incluir en la lógica del flujo de trabajo de RPA para que el flujo de trabajo sea más robusto cuando se produzcan estos tipos de errores de OCR.

Detección de firmas

Las firmas son características visuales que no son detectadas por ningún motor OCR, por lo que un modelo ML no puede detectarlas directamente.

Sin embargo, los Modelos ML de UiPath aprenden observando tanto las palabras como los píxeles de la imagen. Esto permite detectar firmas.

Veamos como ejemplo el siguiente formulario.

Al final de la página, junto a la firma, aparece el texto Signature of U.S. person. No importa cuál sea el texto, siempre que esté lo suficientemente cerca de la firma (siempre y cuando la firma exista). En el caso de las firmas, el procedimiento es similar al de las casillas de verificación (consulta la sección Casillas de verificación anterior).

Puedes crear un campo de texto llamado firma y, cuando el documento tenga una firma, etiquetar las palabras Signature of U.S. person como campo de firma. Si el documento no tiene firma, deja el campo vacío.

En ese caso, debes asegurarte de que tu conjunto de entrenamiento tiene aproximadamente la mitad de los documentos con firma y la otra mitad sin ella. También puede ser 60/40 %, pero no 80/20 % o 90/10 %. Además, debes tener al menos entre 20 y 30 muestras de cada uno para que el modelo sea capaz de aprenderlo.

De esta forma, puedes utilizar el modelo ML para la detección de firmas.

En esta página