- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Casillas de verificación y firmas
Los campos de selección múltiple que utilizan casillas de verificación pueden ser de varios tipos. En primer lugar, están los que se excluyen mutuamente y, a continuación, los que no se excluyen mutuamente, en los que se puede seleccionar más de una opción. Otro aspecto importante es el número de opciones disponibles para un determinado campo de selección múltiple. En algunos casos puede haber una única opción, en la que la casilla de verificación se marca o no, mientras que en otros puede haber 10, 20 o más opciones, dispuestas en una cuadrícula o tabla, como en muchos formularios de salud.
Existen cuatro formas principales de etiquetar este tipo de campos de opción múltiple.
Veamos un ejemplo para entender cómo puedes etiquetar las opciones. Los formularios pueden incluir las opciones Proyecto o Política. En este caso, solo se dispone de un campo y solamente se etiqueta la palabra seleccionada, es decir, se etiqueta la palabra Proyecto si la casilla de verificación situada junto a ella está marcada o la palabra Política si la casilla de verificación situada junto a ella está marcada. Si no se marca ninguna de las dos, entonces no se etiqueta ninguna, y no es posible marcar ambas, por lo que esos documentos se eliminarían del conjunto de entrenamiento.
Este método tiene la ventaja de que se trata de un único campo, que requiere menos datos. También tiene la ventaja de que no depende de que se detecten correctamente las casillas de verificación. Si una casilla de verificación se detecta como una letra X, el modelo aún puede aprender a reconocer que eso significa que la opción junto a ella está seleccionada.
La desventaja es que hay que asegurarse de que ambas opciones están representadas más o menos por igual, lo que no siempre es el caso. Posiblemente, en tu conjunto de entrenamiento, el 90 % de los documentos podrían tener marcado Proyecto. En este caso, el modelo no puede funcionar bien y este método falla. El problema se agrava cuando hay más opciones, ya que algunas de ellas son casi siempre poco frecuentes.En estos casos, es posible que tengas que crear documentos falsos con las opciones raras marcadas para equilibrar la situación.
En el ejemplo anterior, es posible que tengas un campo denominado Proyecto en el que siempre etiquetes la casilla de verificación Proyecto, y un campo denominado Política en el que siempre etiquetes la casilla de verificación Política, tanto si están marcadas como si no. La ventaja es que el porcentaje importa mucho menos, incluso si una de las opciones está marcada el 90 % de las veces, el modelo sigue aprendiendo a reconocerlas porque las casillas de verificación están siempre en el mismo lugar.
El inconveniente es que tiene dos campos en lugar de uno. Cuando hay dos opciones esto puede que no sea importante, pero cuando hay entre 10 y 20 opciones, tener entre 10 y 20 campos en lugar de uno complica mucho el etiquetado, y el modelo es más difícil de entrenar, requiriendo más datos de entrenamiento.
Otro inconveniente es que a veces la casilla de verificación podría no detectarse correctamente y podría ser necesario añadir una lógica más compleja en el flujo de trabajo para tratar todos los caracteres X, V o K devueltos. En algunos casos, OCR podría incluso fusionar la casilla de verificación con la palabra que aparece junto a ella, como XProject, lo que requeriría una lógica de RPA aún más compleja para resolver esta situación.
Los campos multivaluados forman parte de la versión 2022.10 de Document Understanding. Esto facilita el etiquetado, no se ve afectado por el desequilibrio de las opciones marcadas y tampoco si existe un gran número de opciones. Sin embargo, sigue dependiendo de la precisión de la detección de las casillas de verificación o del riesgo de que estas se fusionen con las opciones contiguas. Es muy difícil defenderse de los errores de OCR.
Esto también simplifica el etiquetado, es menos sensible a los errores de detección de casillas de verificación, pero podría ser más sensible a las opciones desequilibradas, al igual que la primera opción.
Según nuestra experiencia, todas estas opciones pueden ser apropiadas en algunas situaciones. Inicialmente, preferíamos la primera opción, sin embargo, a medida que ha mejorado la precisión de la detección de casillas de verificación en UiPath Document OCR, nos hemos inclinado más por las opciones dos y tres. Las opciones dos y tres también tienen otra gran ventaja: son compatibles entre Forms AI y nuestros paquetes ML basados en AI Center. De este modo, puedes empezar con Forms AI y, si la precisión es inferior a la esperada, puedes mover el conjunto de datos a una sesión de Document Manager y entrenar directamente un modelo ML sin ningún otro cambio. Esta opción se ha vuelto especialmente interesante a medida que nuestros paquetes ML son más potentes y requieren menos datos de entrenamiento.
A partir de la versión 2022.4, de LTS Enterprise, las firmas se pueden detectar utilizando el OCR de documentos de UiPath, por lo que los modelos de aprendizaje automático pueden detectar las firmas directamente.
Etiqueta una firma como cualquier otro campo en tu documento. Una vez detectado por el OCR de documentos de UiPath, el modelo de aprendizaje automático aprende a reconocer el campo como una firma.