- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Datos y seguridad
- Licencia

Guía del usuario de Document Understanding
Para conocer los volúmenes de documentos necesarios, consulta la página Procesos .
Para obtener más detalles sobre cómo ensamblar un conjunto de datos de alta calidad, consulta la página Entrenamiento de modelos de alto rendimiento .
Hay muchas situaciones en las que un campo aparece en varios lugares en el mismo documento o incluso en la misma página. Todos deberían estar etiquetados, siempre que tengan el mismo significado.
Por ejemplo, el importe total de las facturas de servicios públicos. Suele aparecer en la parte superior, en una lista de elementos en el centro, o en un recibo de pago en la parte inferior que puede separarse y enviarse por correo con el cheque. En esta situación, los tres casos se etiquetarían. Esto es útil porque, en algunos casos, si hay un error de OCR o el diseño es diferente y un campo no puede ser identificado, el modelo todavía puede identificar las otras ocurrencias.
Puedes hacer que varios usuarios usen la misma instancia para etiquetar al mismo tiempo, incluso en el mismo documento.
Si hay cambios concurrentes en el esquema para un usuario, el cambio se aplica y para el otro o los otros, se muestra un mensaje de advertencia que indica que los cambios no se pudieron realizar. Los otros usuarios deben actualizar inmediatamente su navegador para comprobar los cambios.
Si importas un conjunto de datos sin marcar la casilla de verificación Hacer de esto un conjunto de evaluación en el cuadro de diálogo Importar datos, ese conjunto de datos se utiliza para el entrenamiento y solo tendrás que centrarte en el etiquetado del modelo y etiquetar tanto las palabras como los valores (palabras elegibles, cuadros grises) del documento.
Si a veces el texto que se rellena en los campos de la barra lateral no es correcto, no supone un problema, ya que el modelo ML sigue aprendiendo. En algunos casos, puede ser necesario ajustar la configuración de los campos: por ejemplo, seleccionando la casilla de verificación Línea múltiple. Pero, en general, lo principal es etiquetar las palabras en la página.
Cuando se importa un conjunto de datos y se marca la casilla Hacer de este un conjunto de evaluación en el cuadro de diálogo Importar datos, ese conjunto de datos es ignorado por Productos de entrenamiento en AI Center y usado solo por Productos de evaluación.
Document Manager admite el etiquetado de documentos de varias páginas, por lo tanto, los campos de la barra lateral tienen un único valor para todo el documento. Esto refleja fielmente el comportamiento en tiempo de ejecución en el flujo de trabajo de RPA y permite que los procesos de evaluación en AI Center produzcan puntuaciones realistas que reflejen el rendimiento en tiempo de ejecución real de los modelos ML.
Sin embargo, ten en cuenta que esto es un cambio importante con respecto a las versiones anteriores, en las que cada página se etiquetaba por separado. El etiquetado y la exportación de documentos de varias páginas supone que cada documento representa un único documento lógico. Por ejemplo, un documento de seis páginas puede contener una única factura de seis páginas, pero no debe contener tres facturas diferentes de dos páginas cada una. Esto es especialmente importante para los conjuntos de evaluación.
Un campo determinado puede estar etiquetado en varios lugares de la misma página.
Etiquetar un campo
Para seleccionar varias palabras, selecciona la primera palabra y luego Ctrl/Mayús+haz clic en el resto de las palabras deseadas o selecciona un área completa arrastrando el ratón (la banda elástica) sobre ella.
Para deseleccionar ciertos cuadros de texto de tu selección, mientras Ctrl/Mayús esté presionado, selecciona o elimina de nuevo los cuadros de texto no deseados.
Cuando tu selección sea precisa, pulsa la tecla de acceso directo para etiquetar el campo.
Label a multivalued field
Asegúrate de que la opción de multivaluado del campo está seleccionada.
Selecciona el primer lote de información y toca la tecla de acceso directo para etiquetar el campo.
Repite los pasos anteriores hasta que todos los valores estén etiquetados para el campo multivalor.
Eliminar una etiqueta
Selecciona los cuadros de texto y, a continuación, presiona Eliminar o la tecla de retroceso en el teclado.
Agrupar una fila de tabla
Después de haber etiquetado algunos campos de columna, y solo si algunas filas abarcan varias líneas de texto, puedes agruparlos presionando la tecla / para indicar que forman parte de la misma fila de la tabla. Aparece un cuadro verde alrededor del grupo para indicar visualmente que la fila se ha agrupado.
/
, incluso si cada fila consta de una sola línea de texto.
Desagrupar una fila de tabla
Selecciona el grupo y presiona de nuevo la tecla /.
Otras opciones
Selecciona una etiqueta
Utiliza los botones izquierdo o derecho del ratón para seleccionar una casilla o para obtener más información sobre ella.
- Clic izquierdo: selecciona la casilla
- Clic derecho: selecciona la casilla y muestra información sobre el texto OCR y la etiqueta actual.
Navegación por el documento
- Alt + flecha izquierda/flecha derecha: navega entre documentos.
Escalado de documentos
- Ctrl + Desplazar: amplía o reduce la escala del documento.
Elimina o recupera un documento
- Alt + Supr: elimina un documento.
- Alt + Supr: recupera un documento eliminado.
- Campos que aparecen varias veces en el mismo documento
- Varios usuarios que etiquetan en paralelo
- Etiquetado para el entrenamiento
- Etiquetado para la evaluación
- Acciones de etiquetado
- Etiquetar un campo
- Label a multivalued field
- Eliminar una etiqueta
- Agrupar una fila de tabla
- Desagrupar una fila de tabla
- Otras opciones