- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Detalles del modelo
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Datos y seguridad
- Lógica de licencias y tarificación

Document Understanding classic user guide
Casillas de verificación y firmas
Casillas de verificación
Hay varios tipos de campos de elección múltiple que utilizan casillas de verificación:
- las casillas de verificación mutuamente exclusivas
- las casillas de verificación no exclusivas entre sí, en las que puedes seleccionar más de una opción.
Otro aspecto importante es el número de opciones disponibles para un determinado campo de selección múltiple. En algunos casos puede haber una única opción, en la que la casilla de verificación se marca o no, mientras que en otros puede haber 10, 20 o más opciones, dispuestas en una cuadrícula o tabla, como en muchos formularios de salud.
Hay dos formas principales para poder etiquetar este tipo de campos de opción múltiple.
Label the options
Let's take an example to understand how you can label the options. Forms can include the options Project or Policy. In this case, you only have one field, and you only label the selected word, i.e. label the word Project if the checkbox next to it is checked or the word Policy if the checkbox next to it is checked. If neither is checked then you label neither, and both being checked is not possible, and such documents would just be deleted from the training set.

Este método tiene la ventaja de que se trata de un único campo, que requiere menos datos. También tiene la ventaja de que no depende de que se detecten correctamente las casillas de verificación. Si una casilla de verificación se detecta como una letra X, el modelo aún puede aprender a reconocer que eso significa que la opción junto a ella está seleccionada.
The disadvantage is that you need to make sure both options are roughly equally represented, which is not always the case. Potentially, in your training set, 90% of the documents might have Project checked. In this case, the model cannot perform well and this approach fails. The problem gets worse when you have more options because some of them are almost always rare. In these cases you may need to create fake documents with the rare options checked to balance things out.
Etiquetar las opciones con un único campo multivaluado
Esto también simplifica el etiquetado, es menos sensible a los errores de detección de casillas de verificación, pero podría ser más sensible a las opciones desequilibradas, al igual que la primera opción.

Detección de firmas
Starting with the 2022.4 LTS Enterprise release, signatures can be detected using the UiPath Document OCR, hence, Machine Learning Models can directly detect signatures.
Etiqueta una firma como cualquier otro campo en tu documento. Una vez detectado por el OCR de documentos de UiPath, el modelo de aprendizaje automático aprende a reconocer el campo como una firma.
For a more in depth signature analysis, you can also use the Signature Comparison model that resides in the UiPath Image Analysis ML Packages.