Document Understanding
2022.4
False
Imagen de fondo del banner
Guía del usuario de Document Understanding
Última actualización 13 de mar. de 2024

Crear y configurar campos

Los campos se pueden renombrar. Simplemente haz clic en el botón Editar campo y edita el nombre del campo en la parte superior de la ventana.

Si hay campos que luego decides que no quieres usar para entrenar un modelo ML, puedes eliminarlos o siempre puedes ocultarlos usando la casilla Oculto en la ventana Editar campo.

Nota: Se pueden crear un máximo de 300 campos.

Campos de columna

La descripción o el precio unitario de un elemento en un documento de factura serían ejemplos de campos de columna.

Crear un campo de columna nuevo

  • Haz clic en docs image, en la sección de la tabla en la parte superior de la página, para añadir un nuevo campo de columna. Se mostrará la ventana Crear campo de columnas.
  • Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  • Haz clic en Aceptar. La ventana Editar campo se muestra con la pestaña General abierta.



  • En el desplegable Tipo de contenido, selecciona el tipo de contenido.
  • Haz clic en el campo Tecla de acceso rápido y pulsa una tecla de tu teclado para rellenarlo automáticamente.
  • Selecciona la casilla Dividir elementos si deseas que este campo se use como delimitador entre los elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.
  • Selecciona la casilla Oculto si no deseas que este campo forme parte de los conjuntos de datos exportados.
  • Haz clic en la pestaña Avanzado.
  • En el menú desplegable Puntuación, selecciona la medida usada para determinar la precisión al ejecutar las evaluaciones de las predicciones del modelo.
  • Introduce el código hexadecimal del color del campo deseado en el campo Color.
  • Haz clic en Guardar para guardar la configuración.

Editar un campo de columnas

Haz clic en el botón Editar campo. Las opciones disponibles para los campos de columna se encuentran en la tabla siguiente.

Opción

Tabulación

Descripción

Nombre del campo

N/D

Nombre único para el campo.

El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.

Tipo de contenido

General

El tipo de contenido de un campo:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: adecuado para importes o cantidades, con un análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, aplica un formato y unifica la salida en formato aaaa-mm-dd.
  • teléfono: adecuado para números de teléfono. El formato elimina las letras y los paréntesis, y reemplaza los espacios por guiones.
  • n.º-id: apropiado para códigos alfanuméricos, números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de dos puntos :. Si el número de identificación que necesitas extraer puede contener dos puntos :, utiliza una cadena como tipo de contenido para evitar la pérdida de datos.

Atajo

General

La tecla de acceso directo al campo. Se permiten una o dos claves.

Dividir los elementos

General

Selecciona esta casilla si deseas que este campo se use como delimitador entre elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.

Oculto

General

Selecciona esta casilla si no deseas que este campo forme parte de los conjuntos de datos exportados.

Color

Avanzado

El color del campo en formato hexadecimal. Si el valor no es válido, se genera uno nuevo.

Puntuación

Avanzado

La medida usada para determinar la precisión al ejecutar evaluaciones de los modelos de predicción. Solo se puede configurar para el tipo de contenido string. Todos los demás tipos de contenido usan una estrategia de puntuación de coincidencia exacta. Opciones:

  • coincidencia exacta: una predicción solo se considera correcta (puntuación de 1) si coincide exactamente con el valor real. Si difiere incluso en un solo carácter, se considerará que es incorrecta (puntuación de 0).
  • levenshtein: una predicción se considera parcialmente correcta según la distancia Levenshtein entre la predicción y el valor real. Si se predice correctamente un valor de 10 letras, excepto los dos últimos caracteres, la puntuación de esa predicción será de 0,8.

Eliminar un campo de columnas

Para eliminar un campo de columnas, sigue estos pasos:

  1. Haz clic en el botón Editar campo docs image correspondiente al campo de la columna que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.



  4. Haz clic en Aceptar.
  5. El campo de la columna y sus datos etiquetados asociados se eliminan.

Campos regulares

Son campos que solo aparecen una vez en un documento determinado. El Número de factura o Importe total de un elemento de línea en un documento de factura serían ejemplos de campos de columna.

Crear un campo regular nuevo

  1. Haz clic en docs image, situado en el panel derecho en la sección Campos regulares. Se mostrará la ventana Crear campo regular.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  3. Haz clic en Crear. Se muestra la ventana Editar campo.
  4. Selecciona el tipo de contenido del menú desplegable Tipo de contenido.
  5. Selecciona el mecanismo de posprocesamiento en caso de que el modelo prediga más de una instancia de un campo en una página determinada del desplegable Posprocesamiento.
  6. Haz clic en el campo Tecla de acceso rápido y pulsa una tecla de tu teclado para rellenarlo automáticamente.
  7. En el campo Color, introduce el código hexadecimal del color del campo deseado o
  8. En el menú desplegable de Multipágina, selecciona la estrategia de recuperación de datos. Esta opción se utiliza en caso de que los campos aparezcan en algunas páginas diferentes de un documento de varias páginas. Esta opción define la forma en que el modelo decide cuál mostrar.
  9. De la lista desplegable Puntuación, selecciona la medida utilizada para determinar la precisión cuando se ejecutan evaluaciones de predicciones de modelos.
  10. Selecciona la casilla Multilínea si el campo que se va a comprobar puede abarcar varias líneas de texto, como direcciones o descripciones. Si no se selecciona esta opción, solo se devuelve la primera línea.
  11. Selecciona la casilla Oculto si no deseas que este campo forme parte de los conjuntos de datos exportados.
  12. Haz clic en Guardar para guardar la configuración.

Editar un campo regular

Haz clic en el botón Editar campo. Las opciones disponibles para los campos regulares se encuentran en la siguiente tabla.

Opción

Tabulación

Descripción

Nombre del campo

N/D

Nombre único para el campo.

El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.

Tipo de contenido

General

El tipo de contenido de un campo:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: adecuado para importes o cantidades, con un análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, aplica un formato y unifica la salida en formato aaaa-mm-dd.
  • teléfono: adecuado para números de teléfono. El formato elimina las letras y los paréntesis, y reemplaza los espacios por guiones.
  • n.º-id: apropiado para códigos alfanuméricos, números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de dos puntos :. Si el número de identificación que necesitas extraer puede contener dos puntos :, utiliza una cadena como tipo de contenido para evitar la pérdida de datos.

Posprocesamiento

Avanzado

El mecanismo de posprocesamiento. Si el modelo predice más de una instancia de un campo en una página determinada, el modelo regresa:

  • mayor_confianza: el valor de mayor confianza.
  • primer_tramo: el primer valor.
  • mayor_valor: el mayor valor numérico. Solo se muestra para el tipo de contenido numérico y es apropiado para los campos Importe total.
  • valor_más_largo: el valor formado por el mayor número de caracteres.

Atajo

General

La tecla de acceso directo al campo. Se permiten una o dos claves.

Color

Avanzado

El color del campo en formato hexadecimal. Si el valor no es válido, se genera uno nuevo.

Multipágina

Avanzado

La estrategia de devolución de datos en caso de que un campo aparezca en diferentes páginas de un documento de varias páginas.

  • mayor_confianza: el valor predeterminado para los tipos de contenido string, teléfono y número.
  • primera_ocurrencia: la opción predeterminada para los tipos de contenido n.º-id y fecha.
  • última_ocurrencia

    -string_más_larga

  • cadena_más_corta
  • valor_num_más_alto: solo se muestra para el tipo de contenido número.
  • valor_num_más_bajo: solo se muestra para el tipo de contenido número.

Puntuación

Avanzado

La medida usada para determinar la precisión al ejecutar evaluaciones de los modelos de predicción. Solo se puede configurar para el tipo de contenido string. Todos los demás tipos de contenido usan una estrategia de puntuación de coincidencia exacta. Opciones:

  • coincidencia exacta: una predicción solo se considera correcta (puntuación de 1) si coincide exactamente con el valor real. Si difiere incluso en un solo carácter, se considerará que es incorrecta (puntuación de 0).
  • levenshtein: una predicción se considera parcialmente correcta según la distancia Levenshtein entre la predicción y el valor real. Si se predice correctamente un valor de 10 letras, excepto los dos últimos caracteres, la puntuación de esa predicción será de 0,8.

Línea múltiple

General

Selecciona esta casilla para los campos que pueden abarcar varias líneas de texto (direcciones o descripciones); de lo contrario, solo se devuelve la primera línea.

Oculto

General

Selecciona esta casilla si no deseas que este campo forme parte de los conjuntos de datos exportados.

Borrar un campo regular

Para eliminar un campo regular, sigue estos pasos:

  1. Haz clic en el botón Editar campo docs image correspondiente al campo regular que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.



  4. Haz clic en Aceptar.
  5. El campo regular y sus datos etiquetados asociados se eliminan.

Campos de clasificación

Puntos de datos que se refieren a un documento en su conjunto. Por ejemplo, el Tipo de gasto de un recibo (comida, hotel, aerolínea, transporte) o la Divisa de una factura (USD, EUR, JPY) serían ejemplos de campos de clasificación.

Crear un campo de clasificación nuevo

  1. Haz clic en docs image en el panel derecho en la sección Campos de clasificación. Se mostrará la ventana Crear un nuevo campo de clasificación.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  3. Haz clic en Aceptar. Se muestra la ventana Editar campo.
  4. En el área de texto, rellena la lista de clases y escribe los nombres como una lista separada por comas.
  5. Haz clic en Guardar para guardar la configuración.

Editar un campo de clasificación

Haz clic en el botón Editar campo docs image. Define una lista de valores posibles. Las comas deben separar valores. Se puede incluir una descripción opcional del valor después de los dos puntos : (opción 1: descripción 1).


Eliminar un campo de clasificación

Para eliminar un campo de clasificación, sigue estos pasos:

  1. Haz clic en el botón Editar campo docs image correspondiente al campo de clasificación que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.



  4. Haz clic en Aceptar.
  5. El campo de clasificación y sus datos etiquetados asociados se eliminan.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.