Document Understanding
2020.10
False
Imagen de fondo del banner
Obsoleto
Guía del usuario de Document Understanding
Última actualización 28 de feb. de 2024

Crear y configurar campos

Añadir campos

Los campos no se pueden eliminar ni renombrar, así que piénsalo bien antes de añadir campos nuevos. Si, sin embargo, hay campos que más tarde decides que no quieres usar para entrenar un modelo ML, siempre puedes ocultarlos utilizando la casilla de verificación Oculto en la ventana Editar campo.

Haz clic aquí para obtener más información sobre los campos, su significado y cuándo utilizarlos.

Nota: Se pueden crear un máximo de 40 campos.

Campos de columna

La descripción o el precio unitario de un elemento en un documento de factura serían ejemplos de campos de columna.

  1. Haz clic en +, en la sección de la tabla en la parte superior de la página, para añadir un nuevo campo de columna. Se mostrará la ventana Crear campo de columnas.
  2. En el campo Introducir nombre único de campo, indica un nombre único para el campo. El campo no acepta mayúsculas.
  3. Haz clic en Crear. Se muestra la ventana Editar campo.
  4. En el desplegable Tipo de contenido, selecciona el tipo de contenido.
  5. De la lista desplegable Puntuación, selecciona la medida utilizada para determinar la precisión cuando se ejecutan evaluaciones de predicciones de modelos.
  6. Haz clic en el campo Tecla de acceso rápido y pulsa una tecla de tu teclado para rellenarlo automáticamente.
  7. Introduce el código hexadecimal del color del campo deseado en el campo Color.
  8. Selecciona la casilla Multilínea si el campo que se va a comprobar puede abarcar varias líneas de texto, como direcciones o descripciones. Si no se selecciona esta opción, solo se devuelve la primera línea.
  9. Selecciona la casilla Dividir elementos si deseas que este campo se use como delimitador entre los elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.
  10. Selecciona la casilla Oculto si no deseas que este campo forme parte de los conjuntos de datos exportados.
  11. Haz clic en Guardar para guardar la configuración.

Campos regulares

Son campos que solo aparecen una vez en un documento determinado. El Número de factura o Importe total de un elemento de línea en un documento de factura serían ejemplos de campos de columna.

  1. Haz clic en +, en el panel derecho en la sección Campos regulares. Se mostrará la ventana Crear campo regular.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas.
  3. Haz clic en Crear. Se muestra la ventana Editar campo.
  4. Selecciona el tipo de contenido del menú desplegable Tipo de contenido.
  5. Selecciona el mecanismo de post-procesamiento en caso de que el modelo prediga más de una instancia de una campo en una página concreta del desplegable Posprocesamiento.
  6. Haz clic en el campo Tecla de acceso rápido y pulsa una tecla de tu teclado para rellenarlo automáticamente.
  7. En el campo Color, introduce el código hexadecimal del color del campo deseado o
  8. En el menú desplegable de Multipágina, selecciona la estrategia de recuperación de datos. Esto se utiliza en caso de que los campos aparezcan en algunas páginas diferentes de un documento de varias páginas. Esta opción define la forma en que el modelo decide cuál mostrar.
  9. De la lista desplegable Puntuación, selecciona la medida utilizada para determinar la precisión cuando se ejecutan evaluaciones de predicciones de modelos.
  10. Selecciona la casilla Multilínea si el campo que se va a comprobar puede abarcar varias líneas de texto, como direcciones o descripciones. Si no se selecciona esta opción, solo se devuelve la primera línea.
  11. Selecciona la casilla Oculto si no deseas que este campo forme parte de los conjuntos de datos exportados.
  12. Haz clic en Guardar para guardar la configuración.

Campos de clasificación

Puntos de datos que se refieren a un documento en su conjunto. Por ejemplo, el Tipo de gasto de un recibo (comida, hotel, aerolínea, transporte) o la Divisa de una factura (USD, EUR, JPY) serían ejemplos de campos de clasificación.

  1. Haz clic en + en el panel derecho en la sección Campos de clasificación. Se muestra la ventana Crear campo de clasificación.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas.
  3. Haz clic en Crear. Se muestra la ventana Editar campo.
  4. En el área de texto, rellena la lista de clases y escribe los nombres como una lista separada por comas.
  5. Haz clic en Guardar para guardar la configuración.
    Importante: Al contrario que los campos Regulares y Columna, los campos de Clasificación no se reentrenan. Por ejemplo, para el campo Moneda, si se reentrena el modelo Facturas en un conjunto de datos que solo contenga facturas en USD y en INR, el modelo resultante solo podrá reconocer esas dos monedas.

Descripciones de campos

Barra de gestión

Aparece en la parte superior de la página en Data Manager. Te permite realizar múltiples operaciones: navegar entre documentos, eliminar/ un documento, filtrar documentos, ejecutar predicciones de modelos de IA, importar y exportar documentos.

Campo

Descripción

Navega entre los documentos que coincidan con el filtro activo.

Se muestra un contador entre las dos flechas.

Muestra el número del documento actual respecto al total de documentos que coinciden con el filtro activo.

Eliminar / Recuperar

Elimina o recupera un documento.

Menú desplegable de Filtro

Filtra documentos. Este filtro se aplica también a los datos exportados. Las siguientes opciones están disponibles:

  • train-validate-set

    conjunto de prueba

    -eliminado

    etiquetado

    sin etiquetar

    -<batch_name>

Predecir

Ejecutar las predicciones del modelo de IA y mostrar los resultados.

Importar

Importa un nuevo documento para etiquetarlo.

Exportar

Exporta datos etiquetados.

El filtro activo se aplica a los datos exportados.

[NombreDeDocumento]

El nombre del documento actualmente activo.

[NombreDeUsuario]

El nombre de usuario del usuario actualmente activo.

Cerrar sesión

Cierra la sesión de Data Manager.

Al cerrar la sesión también se borran las cookies.

Ayuda

Ventana Crear campo

Permite configurar el nombre del campo que se va a añadir.

Campo

Descripción

Introduzca un nombre de campo único

El nombre del campo. Solo puede contener letras minúsculas, números, guion bajo "_" y guion "-".

Ventana Editar campo

Permite configurar el campo regular y el campo columna.

Campo

Descripción

Tipo de contenido

El tipo de contenido de un campo. Las siguientes opciones están disponibles:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: apropiado para importes o cantidades, con análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, formatea y unifica las salidas en formato aaaa-mm-dd.
  • teléfono: apropiado para números de teléfono.
  • n.º-id: apropiado para códigos alfanuméricos y números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de ":". Si el número de identificación que necesitas extraer puede contener caracteres ":", utiliza en su lugar una string como tipo de contenido para evitar la pérdida de datos.

Posprocesamiento

Solo se muestra para campos regulares.

El mecanismo de posprocesamiento. Las siguientes opciones están disponibles:

  • primer tramo: si el modelo predice más de una instancia de un campo en una página determinada, el modelo devuelve la primera.
  • valor mayor: si el modelo predice más de una instancia de un campo en una página determinada, el modelo devuelve el valor numérico mayor. Solo se muestra para contenidos de tipo número y es apropiado para campos de Importe total.
  • valor más largo : si el modelo predice más de una instancia de un campo en una página determinada, el modelo devuelve el valor formado por la cadena de caracteres más larga.

Tecla de acceso rápido

La tecla de acceso directo al campo.

Color

El color del campo.

Multipágina

La estrategia de devolución de datos en caso de que un campo aparezca en varias páginas de un documento. Las siguientes opciones están disponibles:

  • mayor confianza: el valor predeterminado para los tipos de contenido string, teléfono y número.
  • primera ocurrencia: el campo predeterminado para los tipos de contenido n.º-id y datos.
  • Última ocurrencia

    - cadena más larga: solo se muestra si el contenido es de tipo cadena.

    - string más corta: solo se muestra para contenidos de tipo string.

    - valor numérico más alto: solo se muestra para contenido de tipo número.

    - valor numérico más bajo: solo se muestra para tipos de contenido número.

Puntuación

Solo puede configurarse para contenidos de tipo cadena. El resto de tipos de contenido utilizan una estrategia de puntuación de concordancia exacta.

La medida usada para determinar la precisión al ejecutar evaluaciones de los modelos de predicción.

  • coincidencia exacta: una predicción solo se considera correcta (puntuación de 1) si coincide exactamente con el valor real. Si difiere incluso en un solo carácter, se considerará que es incorrecta (puntuación de 0).
  • levenshtein: una predicción se considera parcialmente correcta según la distancia Levenshtein entre la predicción y el valor real. Si se predice correctamente un valor de 10 letras excepto por los 2 últimos caracteres, entonces la puntuación de la predicción será de 0,8.

Línea múltiple

Selecciona esta casilla para los campos que puedan abarcar varias líneas, como direcciones o descripciones. De lo contrario, solo se devolverá la primera línea.

Dividir los elementos

Solo se muestra para campos de columna.

Selecciona esta casilla si deseas que este campo se use como delimitador entre elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.

Oculto

Selecciona esta casilla si no deseas que este campo forme parte de los conjuntos de datos exportados.

Menú Ayuda de Data Manager

La sección Controles de etiquetado muestra los controles que se utilizarán a la hora de manejar los datos.

La sección Atajos de documentos muestra los accesos directos usados para realizar diversas operaciones como la navegación y el escalado de la interfaz de usuario.

La sección Configuración muestra los detalles de la configuración de la instancia realizada durante la instalación.

La sección Informe de errores te permite ver los registros generados recientemente.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.