Document Understanding
2022.4
False
Etiquetar las opciones - Independiente 2022.4
Logotipo
Document Understanding
Última actualización 19 de oct. de 2023

Etiquetar las opciones

Veamos un ejemplo para entender cómo puedes etiquetar las opciones. Los formularios pueden incluir las opciones Proyecto o Política. En este caso, solo se dispone de un campo y solamente se etiqueta la palabra seleccionada, es decir, se etiqueta la palabra Proyecto si la casilla de verificación situada junto a ella está marcada o la palabra Política si la casilla de verificación situada junto a ella está marcada. Si no se marca ninguna de las dos, entonces no se etiqueta ninguna, y no es posible marcar ambas, por lo que esos documentos se eliminarían del conjunto de entrenamiento.



Este método tiene la ventaja de que se trata de un único campo, que requiere menos datos. También tiene la ventaja de que no depende de que se detecten correctamente las casillas de verificación. Si una casilla de verificación se detecta como una letra X, el modelo aún puede aprender a reconocer que eso significa que la opción junto a ella está seleccionada.

La desventaja es que hay que asegurarse de que ambas opciones están representadas más o menos por igual, lo que no siempre es el caso. Posiblemente, en tu conjunto de entrenamiento, el 90 % de los documentos podrían tener marcado Proyecto. En este caso, el modelo no puede funcionar bien y este método falla. El problema se agrava cuando hay más opciones, ya que algunas de ellas son casi siempre poco frecuentes.En estos casos, es posible que tengas que crear documentos falsos con las opciones raras marcadas para equilibrar la situación.

Logotipo
Obtén la ayuda que necesitas
Logotipo
RPA para el aprendizaje - Cursos de automatización
Logotipo
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2023 UiPath. All rights reserved.