UiPath Documentation
document-understanding
2.2510
true
Importante :
La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Document Understanding user guide

Última actualización 6 de abr. de 2026

Etiquetar documentos

Para obtener los volúmenes de documentos necesarios, consulta la página.

For more details about how to assemble a high-quality dataset, check the Training High Performing Models page.

Campos que aparecen varias veces en el mismo documento

Hay muchas situaciones en las que un campo aparece en varios lugares en el mismo documento o incluso en la misma página. Todos deberían estar etiquetados, siempre que tengan el mismo significado.

Por ejemplo, el importe total de las facturas de servicios públicos. Suele aparecer en la parte superior, en una lista de elementos en el centro, o en un recibo de pago en la parte inferior que puede separarse y enviarse por correo con el cheque. En esta situación, los tres casos se etiquetarían. Esto es útil porque, en algunos casos, si hay un error de OCR o el diseño es diferente y un campo no puede ser identificado, el modelo todavía puede identificar las otras ocurrencias.

Nota:

What counts is the meaning of the value, not the value itself. For instance, on some invoices which carry no tax, the net amount and the total amount have the same value. But they are clearly different concepts. Consequently, they should not be labelled both as total amount but only the one whose meaning is to represent the total amount.

Varios usuarios que etiquetan en paralelo

Puedes hacer que varios usuarios usen la misma instancia para etiquetar al mismo tiempo, incluso en el mismo documento.

Si hay cambios concurrentes en el esquema para un usuario, el cambio se aplica y para el otro o los otros, se muestra un mensaje de advertencia que indica que los cambios no se pudieron realizar. Los otros usuarios deben actualizar inmediatamente su navegador para comprobar los cambios.

Etiquetado para el entrenamiento

When you import a dataset without checking the Make this an Evaluation set checkbox on the Import Data dialog box, then that dataset is used for training and you only need to focus on the labeling of the model and both label and value (selectable words, grey boxes) on the document.

Si a veces el texto que se rellena en los campos de la barra lateral no es correcto, no supone un problema, ya que el modelo ML sigue aprendiendo. En algunos casos, puede ser necesario ajustar la configuración de los campos: por ejemplo, seleccionando la casilla de verificación Línea múltiple. Pero, en general, lo principal es etiquetar las palabras en la página.

Etiquetado para la evaluación

Cuando se importa un conjunto de datos y se marca la casilla Hacer de este un conjunto de evaluación en el cuadro de diálogo Importar datos, ese conjunto de datos es ignorado por Productos de entrenamiento en AI Center y usado solo por Productos de evaluación.

Es importante que se complete el texto correcto en los campos de la barra lateral (o en la barra superior para los campos de columna). Esto requiere más tiempo para verificar cada campo, aunque es la única manera de obtener una métrica fiable de la precisión del modelo ML que se está creando.

Document Manager admite el etiquetado de documentos de varias páginas, por lo tanto, los campos de la barra lateral tienen un único valor para todo el documento. Esto refleja fielmente el comportamiento en tiempo de ejecución en el flujo de trabajo de RPA y permite que los procesos de evaluación en AI Center produzcan puntuaciones realistas que reflejen el rendimiento en tiempo de ejecución real de los modelos ML.

Sin embargo, ten en cuenta que esto es un cambio importante con respecto a las versiones anteriores, en las que cada página se etiquetaba por separado. El etiquetado y la exportación de documentos de varias páginas supone que cada documento representa un único documento lógico. Por ejemplo, un documento de seis páginas puede contener una única factura de seis páginas, pero no debe contener tres facturas diferentes de dos páginas cada una. Esto es especialmente importante para los conjuntos de evaluación.

Acciones de etiquetado

Un campo determinado puede estar etiquetado en varios lugares de la misma página.

Etiquetar un campo

To select multiple words, select the first word and then Ctrl/Shift+click the rest of the desired words or select an entire area by dragging the mouse (the rubber banding) over it.

To unselect certain text boxes from your selection, while Ctrl/Shift is pressed, select or rubber band the unwanted text boxes again.

Cuando tu selección sea precisa, pulsa la tecla de acceso directo para etiquetar el campo.

Label a multivalued field

Asegúrate de que la opción de multivaluado del campo está seleccionada.

Selecciona el primer lote de información y toca la tecla de acceso directo para etiquetar el campo.

Repite los pasos anteriores hasta que todos los valores estén etiquetados para el campo multivalor.

Nota:

A multivalued field displays two values in its collapsed state and all values it its expanded state. Select the expand arrow from the multivalued field to expand and visualize the list of all tagged values.

Eliminar una etiqueta

Select text boxes, then press the Delete or the Backspace key on your keyboard.

Agrupar una fila de tabla

After you have labelled some Column fields, and only if some rows span multiple lines of text, then you may group them together by pressing the / key to indicate that they are part of the same table row. A green box appears around the group.

Cuando se agrupa un campo de columna etiquetado, la tabla se analiza y se muestra en la parte superior, resaltando los datos extraídos.

Desagrupar una fila de tabla

Select the group and press the / key again.

Otras opciones

Selecciona una etiqueta

Utiliza los botones izquierdo o derecho del ratón para seleccionar una casilla o para obtener más información sobre ella.

  • Clic izquierdo: selecciona la casilla
  • Clic derecho: selecciona la casilla y muestra información sobre el texto OCR y la etiqueta actual.
Navegación por el documento
  • Alt + flecha izquierda/flecha derecha: navega entre documentos.
Escalado de documentos
  • Ctrl + Desplazar: amplía o reduce la escala del documento.
Elimina o recupera un documento
  • Alt + Supr: elimina un documento.
  • Alt + Supr: recupera un documento eliminado.

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado