- Primeros pasos
- Componentes de marco
- Document Understanding en AI Center
- Procesos
- Paquetes ML
- Gestor de datos
- Servicios de OCR
- Licencia
- Referencias
Guía del usuario de Document Understanding
Casillas de verificación y firmas
En el contexto de un modelo de Extracción ML, las casillas de verificación no son un valor real, sino una forma de seleccionar un determinado texto.
Por ello, la palabra que está al lado se convierte en el punto de atención, no la casilla de verificación. Y este es precisamente el propósito de la casilla de verificación: servir de anclaje para una palabra específica.
En consecuencia, para entrenar un modelo ML es necesario etiquetar la palabra, no la casilla.
En algunos casos, no se detecta la casilla de verificación. Por ejemplo, el OCR podría leerla como una X, o tal vez se trate de alguna marca escrita a mano que no se detecta en absoluto. El modelo ML puede aprender y asociar todas estas situaciones con la palabra junto a la marca.
Por lo tanto, es más robusto entrenar un modelo para que reconozca una palabra, independientemente de cómo se seleccione: con una casilla de verificación, con una X o con una marca escrita a mano (rodeada, subrayada, etc.).
Para el ejemplo anterior, puedes crear tres campos en Data Manager de la siguiente manera:
- condition-employment (etiqueta la palabra SÍ);
- condition-auto-accident (etiqueta la palabra SÍ);
- condition-other-accident (etiqueta la palabra NO).
El modelo ML aprende a reconocer esas palabras, tanto si están marcadas con casillas, con X o simplemente rodeadas con bolígrafo. Para ello, puedes usar UiPath Document OCR, que puede reconocer incluso las casillas de verificación.
Hay casos en los que no hay ninguna etiqueta asociada a una casilla de verificación. Por ejemplo, cuando las casillas de verificación forman parte de tablas.
Este es un ejemplo típico:
En este caso, es necesario etiquetar los recuadros. El extractor devolverá el valor de la string de la casilla de verificación que sea uno de estos dos caracteres:
- ☒
- ☐
checked
o unchecked
. Además, el marco IntelligentOCR sabe reconocerlos, especialmente si un campo se define como Boolean
:
- si el extractor devuelve ☒, esto corresponde a SÍ;
- Si el extractor devuelve ☐, esto corresponde a NO.
En los casos en los que una casilla no marcada se devuelva como O o D, o cuando una casilla marcada se devuelva como X, V, K o R, también se pueden incluir en la lógica del flujo de trabajo de RPA para que el flujo de trabajo sea más robusto cuando se produzcan estos tipos de errores de OCR.
Las firmas son características visuales que no son detectadas por ningún motor OCR, por lo que un modelo ML no puede detectarlas directamente.
Sin embargo, los Modelos ML de UiPath aprenden observando tanto las palabras como los píxeles de la imagen. Esto permite detectar firmas.
Veamos como ejemplo el siguiente formulario.
Al final de la página, junto a la firma, aparece el texto Signature of U.S. person. No importa cuál sea el texto, siempre que esté lo suficientemente cerca de la firma (siempre y cuando la firma exista). En el caso de las firmas, el procedimiento es similar al de las casillas de verificación (consulta la sección Casillas de verificación anterior).
Puedes crear un campo de texto llamado firma y, cuando el documento tenga una firma, etiquetar las palabras Signature of U.S. person como campo de firma. Si el documento no tiene firma, deja el campo vacío.
En ese caso, debes asegurarte de que tu conjunto de entrenamiento tiene aproximadamente la mitad de los documentos con firma y la otra mitad sin ella. También puede ser 60/40 %, pero no 80/20 % o 90/10 %. Además, debes tener al menos entre 20 y 30 muestras de cada uno para que el modelo sea capaz de aprenderlo.
De esta forma, puedes utilizar el modelo ML para la detección de firmas.