document-understanding
2022.4
false
UiPath logo, featuring letters U and I in white

Guía del usuario de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última actualización 11 de nov. de 2024

Crear y configurar campos

No es posible cambiar el nombre de los campos, así que piénsalo bien antes de darles un nombre. Sin embargo, si hay campos que más tarde decides que no quieres utilizar para entrenar un modelo ML, siempre puedes eliminarlos u ocultarlos utilizando la casilla Oculto de la ventana Editar campo.

Nota: Se pueden crear un máximo de 300 campos.

Campos de columna

La descripción o el precio unitario de un elemento en un documento de factura serían ejemplos de campos de columna.

Crear un campo de columna nuevo

  1. Haz clic en docs image, en la sección de la tabla en la parte superior de la página, para añadir un nuevo campo de columna. Se mostrará la ventana Crear campo de columnas.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  3. Haz clic en Crear. Se muestra la ventana Editar campo.
  4. En el desplegable Tipo de contenido, selecciona el tipo de contenido.
  5. De la lista desplegable Puntuación, selecciona la medida utilizada para determinar la precisión cuando se ejecutan evaluaciones de predicciones de modelos.
  6. Haz clic en el campo Tecla de acceso rápido y pulsa una tecla de tu teclado para rellenarlo automáticamente.
  7. Introduce el código hexadecimal del color del campo deseado en el campo Color.
  8. Selecciona la casilla Dividir elementos si deseas que este campo se use como delimitador entre los elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.
  9. Selecciona la casilla Oculto si no deseas que este campo forme parte de los conjuntos de datos exportados.
  10. Haz clic en Guardar para guardar la configuración.

Editar un campo de columnas

Haz clic en el botón Editar campo. Las opciones disponibles para los campos de columna se encuentran en la tabla siguiente.

Opción

Descripción

Tipo de contenido

El tipo de contenido de un campo:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: adecuado para importes o cantidades, con un análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, aplica un formato y unifica la salida en formato aaaa-mm-dd.
  • ** teléfono**: apropiado para los números de teléfono. El formato elimina las letras y los paréntesis, y reemplaza los espacios por guiones.
  • n.º-id: apropiado para códigos alfanuméricos, números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de dos puntos :. Si el número de identificación que necesitas extraer puede contener dos puntos :, utiliza una cadena como tipo de contenido para evitar la pérdida de datos.

Atajo

La tecla de acceso directo al campo. Se permiten una o dos claves.

Color

El color del campo en formato hexadecimal. Si el valor no es válido, se genera uno nuevo.

Puntuación

La medida usada para determinar la precisión al ejecutar evaluaciones de los modelos de predicción. Solo se puede configurar para el tipo de contenido string. Todos los demás tipos de contenido usan una estrategia de puntuación de coincidencia exacta. Opciones:

  • coincidencia exacta: una predicción solo se considera correcta (puntuación de 1) si coincide exactamente con el valor real. Si difiere incluso en un solo carácter, se considerará que es incorrecta (puntuación de 0).
  • levenshtein: una predicción se considera parcialmente correcta según la distancia Levenshtein entre la predicción y el valor real. Si se predice correctamente un valor de 10 letras, excepto los dos últimos caracteres, la puntuación de esa predicción será de 0,8.

Dividir los elementos

Selecciona esta casilla si deseas que este campo se use como delimitador entre elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.

Oculto

Selecciona esta casilla si no deseas que este campo forme parte de los conjuntos de datos exportados.

Eliminar un campo de columnas

Para eliminar un campo de columnas, sigue estos pasos:

  1. Haz clic en el botón Editar campo docs image correspondiente al campo de la columna que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.


  4. Haz clic en Aceptar.
  5. El campo de la columna y sus datos etiquetados asociados se eliminan.

Campos regulares

Son campos que solo aparecen una vez en un documento determinado. El Número de factura o Importe total de un elemento de línea en un documento de factura serían ejemplos de campos de columna.

Crear un campo regular nuevo

  1. Haz clic en docs image, situado en el panel derecho en la sección Campos regulares. Se mostrará la ventana Crear campo regular.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  3. Haz clic en Crear. Se muestra la ventana Editar campo.
  4. Selecciona el tipo de contenido del menú desplegable Tipo de contenido.
  5. Selecciona el mecanismo de posprocesamiento en caso de que el modelo prediga más de una instancia de un campo en una página determinada del desplegable Posprocesamiento.
  6. Haz clic en el campo Tecla de acceso rápido y pulsa una tecla de tu teclado para rellenarlo automáticamente.
  7. En el campo Color, introduce el código hexadecimal del color del campo deseado o
  8. En el menú desplegable de Multipágina, selecciona la estrategia de recuperación de datos. Esta opción se utiliza en caso de que los campos aparezcan en algunas páginas diferentes de un documento de varias páginas. Esta opción define la forma en que el modelo decide cuál mostrar.
  9. De la lista desplegable Puntuación, selecciona la medida utilizada para determinar la precisión cuando se ejecutan evaluaciones de predicciones de modelos.
  10. Selecciona la casilla Multilínea si el campo que se va a comprobar puede abarcar varias líneas de texto, como direcciones o descripciones. Si no se selecciona esta opción, solo se devuelve la primera línea.
  11. Selecciona la casilla Oculto si no deseas que este campo forme parte de los conjuntos de datos exportados.
  12. Haz clic en Guardar para guardar la configuración.

Editar un campo regular

Haz clic en el botón Editar campo. Las opciones disponibles para los campos regulares se encuentran en la siguiente tabla.

Opción

Descripción

Tipo de contenido

El tipo de contenido de un campo:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: adecuado para importes o cantidades, con un análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, aplica un formato y unifica la salida en formato aaaa-mm-dd.
  • ** teléfono**: apropiado para los números de teléfono. El formato elimina las letras y los paréntesis, y reemplaza los espacios por guiones.
  • n.º-id: apropiado para códigos alfanuméricos, números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de dos puntos :. Si el número de identificación que necesitas extraer puede contener dos puntos :, utiliza una cadena como tipo de contenido para evitar la pérdida de datos.

Posprocesamiento

El mecanismo de posprocesamiento. Si el modelo predice más de una instancia de un campo en una página determinada, el modelo regresa:

  • mayor_confianza: el valor de mayor confianza.
  • primer_tramo: el primer valor.
  • mayor_valor: el mayor valor numérico. Solo se muestra para el tipo de contenido numérico y es apropiado para los campos Importe total.
  • valor_más_largo: el valor formado por el mayor número de caracteres.

Atajo

La tecla de acceso directo al campo. Se permiten una o dos claves.

Color

El color del campo en formato hexadecimal. Si el valor no es válido, se genera uno nuevo.

Multipágina

La estrategia de devolución de datos en caso de que un campo aparezca en diferentes páginas de un documento de varias páginas.

  • mayor_confianza: el valor predeterminado para los tipos de contenido string, teléfono y número.
  • primera_ocurrencia: la opción predeterminada para los tipos de contenido n.º-id y fecha.
  • última_ocurrencia

    -string_más_larga

  • cadena_más_corta
  • valor_num_más_alto: solo se muestra para el tipo de contenido número.
  • valor_num_más_bajo: solo se muestra para el tipo de contenido número.

Puntuación

La medida usada para determinar la precisión al ejecutar evaluaciones de los modelos de predicción. Solo se puede configurar para el tipo de contenido string. Todos los demás tipos de contenido usan una estrategia de puntuación de coincidencia exacta. Opciones:

  • coincidencia exacta: una predicción solo se considera correcta (puntuación de 1) si coincide exactamente con el valor real. Si difiere incluso en un solo carácter, se considerará que es incorrecta (puntuación de 0).
  • levenshtein: una predicción se considera parcialmente correcta según la distancia Levenshtein entre la predicción y el valor real. Si se predice correctamente un valor de 10 letras, excepto los dos últimos caracteres, la puntuación de esa predicción será de 0,8.

Línea múltiple

Selecciona esta casilla para los campos que pueden abarcar varias líneas de texto (direcciones o descripciones); de lo contrario, solo se devuelve la primera línea.

Oculto

Selecciona esta casilla si no deseas que este campo forme parte de los conjuntos de datos exportados.

Borrar un campo regular

Para eliminar un campo regular, sigue estos pasos:

  1. Haz clic en el botón Editar campo docs image correspondiente al campo regular que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.


  4. Haz clic en Aceptar.
  5. El campo regular y sus datos etiquetados asociados se eliminan.

Campos de clasificación

Puntos de datos que se refieren a un documento en su conjunto. Por ejemplo, el Tipo de gasto de un recibo (comida, hotel, aerolínea, transporte) o la Divisa de una factura (USD, EUR, JPY) serían ejemplos de campos de clasificación.

Crear un campo de clasificación nuevo

  1. Haz clic en docs image en el panel derecho en la sección Campos de clasificación. Se muestra la ventana Crear campo de clasificación.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  3. Haz clic en Crear. Se muestra la ventana Editar campo.
  4. En el área de texto, rellena la lista de clases y escribe los nombres como una lista separada por comas.
  5. Haz clic en Guardar para guardar la configuración.

Editar un campo de clasificación

Haz clic en el botón Editar campo docs image. Define una lista de valores posibles. Las comas deben separar valores. Se puede incluir una descripción opcional del valor después de los dos puntos : (opción 1: descripción 1).


Eliminar un campo de clasificación

Para eliminar un campo de clasificación, sigue estos pasos:

  1. Haz clic en el botón Editar campo docs image correspondiente al campo de clasificación que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Escribe el nombre exacto del campo.


  4. Haz clic en Aceptar.
  5. El campo de clasificación y sus datos etiquetados asociados se eliminan.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.