document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Guía del usuario de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última actualización 18 de dic. de 2024

Crear y configurar campos

Los campos se pueden renombrar. Solo tienes que hacer clic en el botón Editar campo y editar el nombre del campo en la parte superior de la ventana.

Si hay campos que luego decides que no quieres usar para entrenar un modelo ML, puedes eliminarlos o siempre puedes ocultarlos usando la casilla Oculto en la ventana Editar campo.

Nota: Se pueden crear un máximo de 300 campos.

Campos de columna

La descripción o el precio unitario de un elemento en un documento de factura serían ejemplos de campos de columna.

Crear un campo de columna nuevo

  • Haz clic en docs image, en la sección de la tabla en la parte superior de la página, para añadir un nuevo campo de columna. Se mostrará la ventana Crear campo de columnas.
  • Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  • Haz clic en Aceptar. La ventana Editar campo se muestra con la pestaña General abierta.

    docs image
  • En el desplegable Tipo de contenido, selecciona el tipo de contenido.
  • Haz clic en el campo Tecla de acceso rápido y pulsa una tecla de tu teclado para rellenarlo automáticamente.
  • Selecciona la casilla Dividir elementos si deseas que este campo se use como delimitador entre los elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.

  • Selecciona la casilla Oculto si no deseas que este campo forme parte de los conjuntos de datos exportados.
  • Haz clic en la pestaña Avanzado.
  • De la lista desplegable Puntuación, selecciona la medida utilizada para determinar la precisión cuando se ejecutan evaluaciones de predicciones de modelos.
  • Introduce el código hexadecimal del color del campo deseado en el campo Color.
  • Haz clic en Guardar para guardar la configuración.

Editar un campo de columnas

Haz clic en el botón Editar campo. Las opciones disponibles para los campos de columna se encuentran en la tabla siguiente.

Opción

Tabulación

Descripción

Nombre del campo

N/D

Nombre único para el campo.

El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.

Tipo de contenido

General

El tipo de contenido de un campo:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: adecuado para importes o cantidades, con un análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, formatea y unifica la salida en un formato aaaa-mm-dd . Puedes indicar cómo se deben analizar y devolver las fechas ambiguas. Para ello, elige entre el estilo no estadounidense (aaaa-mm-dd) y el estilo estadounidense (aaaa-dd-mm) en la opción Formato de fecha .
  • teléfono: adecuado para números de teléfono. El formato elimina las letras y los paréntesis, y reemplaza los espacios por guiones.
  • n.º-id: apropiado para códigos alfanuméricos, números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de dos puntos :. Si el número de identificación que necesitas extraer puede contener dos puntos :, utiliza una cadena como tipo de contenido para evitar la pérdida de datos.

Atajo

General

La tecla de acceso directo al campo. Se permiten una o dos claves.

Dividir los elementos

General

Selecciona esta casilla si deseas que este campo se use como delimitador entre elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.

Oculto

General

Selecciona esta casilla si no deseas que este campo forme parte de los conjuntos de datos exportados.

Color

Avanzado

El color del campo en formato hexadecimal. Si el valor no es válido, se genera uno nuevo.

Puntuación

Avanzado

La medida usada para determinar la precisión al ejecutar evaluaciones de los modelos de predicción. Solo se puede configurar para el tipo de contenido string. Todos los demás tipos de contenido usan una estrategia de puntuación de coincidencia exacta. Opciones:

  • coincidencia exacta: una predicción solo se considera correcta (puntuación de 1) si coincide exactamente con el valor real. Si difiere incluso en un solo carácter, se considerará que es incorrecta (puntuación de 0).
  • levenshtein: una predicción se considera parcialmente correcta según la distancia Levenshtein entre la predicción y el valor real. Si se predice correctamente un valor de 10 letras, excepto los dos últimos caracteres, la puntuación de esa predicción será de 0,8.

Eliminar un campo de columnas

Para eliminar un campo de columnas, sigue estos pasos:

  1. Haz clic en el botón Editar campodocs image correspondiente al campo de columna que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.


  4. Haz clic en Aceptar.
  5. El campo de la columna y sus datos etiquetados asociados se eliminan.

Campos regulares

Son campos que solo aparecen una vez en un documento determinado. El Número de factura o Importe total de un elemento de línea en un documento de factura serían ejemplos de campos de columna.

Crear un campo regular nuevo

  • Haz clic en docs image, situado en el panel derecho en la sección Campos regulares. Se mostrará la ventana Crear campo regular.
  • Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  • Haz clic en Aceptar. La ventana Editar campo se muestra con la pestaña General abierta.
  • Selecciona el tipo de contenido del menú desplegable Tipo de contenido.
  • Haz clic en el campo Atajo y pulsa una tecla de tu teclado para rellenarlo automáticamente.
  • Selecciona la casilla Multilínea si el campo que se va a comprobar puede abarcar varias líneas de texto, como direcciones o descripciones. Si no se selecciona esta opción, solo se devuelve la primera línea.
  • Selecciona la casilla de verificación Valor múltiple para que todos los valores detectados en el documento se muestren en forma de lista. Puedes seleccionar la casilla de verificación Línea múltiple o Valor múltiple.
  • Selecciona la casilla Oculto si no deseas que este campo forme parte de los conjuntos de datos exportados.
  • Haz clic en la pestaña Avanzado.
  • Selecciona el mecanismo de posprocesamiento en caso de que el modelo prediga más de una instancia de un campo en una página determinada del desplegable Posprocesamiento.
  • De la lista desplegable Puntuación, selecciona la medida utilizada para determinar la precisión cuando se ejecutan evaluaciones de predicciones de modelos.
  • En el campo Color, introduce el código hexadecimal del color del campo deseado.
  • Haz clic en Guardar para guardar la configuración.

Editar un campo regular

Haz clic en el botón Editar campo. Las opciones disponibles para los campos regulares se encuentran en la siguiente tabla.

Opción

Tabulación

Descripción

Nombre del campo

N/D

Nombre único para el campo.

El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.

Tipo de contenido

General

El tipo de contenido de un campo:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: adecuado para importes o cantidades, con un análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, formatea y unifica la salida en un formato aaaa-mm-dd . Puedes indicar cómo se deben analizar y devolver las fechas ambiguas. Para ello, elige entre el estilo no estadounidense (aaaa-mm-dd) y el estilo estadounidense (aaaa-dd-mm) en la opción Formato de fecha . Esta opción no tiene impacto cuando la fecha no es ambigua y solo es compatible con los paquetes ML versión 22.10.2 o posterior.
  • teléfono: adecuado para números de teléfono. El formato elimina las letras y los paréntesis, y reemplaza los espacios por guiones.
  • n.º-id: apropiado para códigos alfanuméricos, números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de dos puntos :. Si el número de identificación que necesitas extraer puede contener dos puntos :, utiliza una cadena como tipo de contenido para evitar la pérdida de datos.

Posprocesamiento

Avanzado

El mecanismo de posprocesamiento. Si el modelo predice más de una instancia de un campo en una página determinada, el modelo regresa:

  • mayor_confianza: el valor de mayor confianza.
  • primer_tramo: el primer valor.
  • mayor_valor: el mayor valor numérico. Solo se muestra para el tipo de contenido numérico y es apropiado para los campos Importe total.
  • valor_más_largo: el valor formado por el mayor número de caracteres.

Atajo

General

La tecla de acceso directo al campo. Se permiten una o dos claves.

Línea múltiple

General

Selecciona esta casilla para los campos que pueden abarcar varias líneas de texto (direcciones o descripciones); de lo contrario, solo se devuelve la primera línea.

Valor múltiple

GeneralSelecciona esta casilla de verificación para que todos los valores detectados en el documento se muestren en forma de lista. Puedes seleccionar la casilla de verificación Línea múltiple o Valor múltiple.

Oculto

General

Selecciona esta casilla si no deseas que este campo forme parte de los conjuntos de datos exportados.

Puntuación

Avanzado

La medida usada para determinar la precisión al ejecutar evaluaciones de los modelos de predicción. Solo se puede configurar para el tipo de contenido string. Todos los demás tipos de contenido usan una estrategia de puntuación de coincidencia exacta. Opciones:

  • coincidencia exacta: una predicción solo se considera correcta (puntuación de 1) si coincide exactamente con el valor real. Si difiere incluso en un solo carácter, se considerará que es incorrecta (puntuación de 0).
  • levenshtein: una predicción se considera parcialmente correcta según la distancia Levenshtein entre la predicción y el valor real. Si se predice correctamente un valor de 10 letras, excepto los dos últimos caracteres, la puntuación de esa predicción será de 0,8.

Color

Avanzado

El color del campo en formato hexadecimal. Si el valor no es válido, se genera uno nuevo.

Borrar un campo regular

Para eliminar un campo regular, sigue estos pasos:

  1. Haz clic en el botón Editar campodocs image correspondiente al campo regular que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.


  4. Haz clic en Aceptar.
  5. El campo regular y sus datos etiquetados asociados se eliminan.

Campos de clasificación

Puntos de datos que se refieren a un documento en su conjunto. Por ejemplo, el Tipo de gasto de un recibo (comida, hotel, aerolínea, transporte) o la Divisa de una factura (USD, EUR, JPY) serían ejemplos de campos de clasificación.

Crear un campo de clasificación nuevo

  1. Haz clic en docs image en el panel derecho en la sección Campos de clasificación. Se mostrará la ventana Crear un nuevo campo de clasificación.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  3. Haz clic en Aceptar. Se muestra la ventana Editar campo.
  4. En el área de texto, rellena la lista de clases y escribe los nombres como una lista separada por comas.
  5. Haz clic en Guardar para guardar la configuración.

Editar un campo de clasificación

Haz clic en el botón Editar campodocs image. Define una lista de valores posibles. Las comas deben separar valores. Se puede incluir una descripción opcional del valor después de los dos puntos : (opción 1: descripción 1).


Eliminar un campo de clasificación

Para eliminar un campo de clasificación, sigue estos pasos:

  1. Haz clic en el botón Editar campodocs image correspondiente al campo de clasificación que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.


  4. Haz clic en Aceptar.
  5. El campo de clasificación y sus datos etiquetados asociados se eliminan.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.