Document Understanding
Más reciente
False
Imagen de fondo del banner
Guía del usuario de Document Understanding
Última actualización 30 de abr. de 2024

Formularios IA

Formularios IA forma parte de Document Understanding y se puede utilizar para cargar y procesar formularios estructurados con diseños y campos.

Crear Formularios IA

Formularios IA es el primer método de extracción disponible en el servicio Document Understanding. Consulta más información sobre cómo crear un nuevo proyecto en Document Understanding.

Una vez creado el proyecto, debes seguir los siguientes pasos para crear un tipo de documento usando Formularios IA en el proyecto.

  • Abre tu proyecto y haz clic en el botón Nuevo tipo de documento.



    Se abre un cuadro de diálogo que solicita un nombre para el tipo de documento.



Si quieres entrenar tus clasificadores de documentos directamente desde Document Understanding, puedes utilizar la funcionalidad Clasificación en un clic.

Nota: Los formularios de diseño fijo utilizados con Forms AI pueden tener una longitud máxima de cinco páginas cada uno.

Convertir una IA de Formularios en un tipo de documento semiestructurado

Puede convertir un tipo de documento de Formularios IA en un tipo de documento semiestructurado.

Al convertir un tipo de documento de Formularios IA en un tipo de documento semiestructurado (Administrador de documentos), puede usar todas las funciones disponibles en el Administrador de documentos

La opción de conversión es ideal para escenarios complejos para entrenar un modelo de aprendizaje automático de aprendizaje profundo más potente.

Cómo convertir una sesión de Forms AI

Hay dos opciones entre las que puedes elegir si decides convertir una sesión de Forms AI en una sesión del Administrador de documentos.

De la lista de tipos de documentos del proyecto

Puedes convertir un Tipo de documento directamente desde la lista de Tipos de documento del proyecto.

Accede al menú de acceso Abrir del tipo de documento que deseas convertir y haz clic en la opción Convertir a semiestructurado . Se mostrará una ventana emergente que le pedirá que confirme las Actions.

Atención:

Una vez que se ha convertido un tipo de documento, no puede revertir las Actions.

El siguiente ejemplo explica cómo usar la funcionalidad de conversión.



Desde una sesión abierta de Forms AI

Abre una sesión de Forms AI ya creada para convertirla en una sesión semiestructurada.

Desde la sesión abierta, haz clic en el menú Acceso, a continuación, haz clic en la opción Convertir a semiestructurado.

Atención: una vez convertido un tipo de documento, no se puede revertir la acción.

El botón Convertir a semiestructurado no se muestra si el proyecto no tiene un enlace de AI Center.

El siguiente ejemplo explica cómo usar la funcionalidad de conversión.



Importar documentos

Una vez creado el nuevo Formularios IA, se abre una nueva ventana en la que debes importar los datos. Puedes importar un mínimo de dos documentos y un máximo de veinte, cada uno con un máximo de cinco páginas. Arrastra y suelta los archivos o búscalos para cargarlos.



Importar documentos es otra forma de convertir de formularios AI a tipo de documento AI semiestructurado. Aparece una opción si intenta cargar más de 20 documentos o si alguno de los documentos tiene más de 20 páginas. Se mostrará una ventana emergente que le preguntará si desea convertir la sesión de FormsAI en una semiestructurada.



La exactitud del Tipo de contenido de los campos extraídos automáticamente también debe comprobarse. por ejemplo, si se ha extraído automáticamente un campo de fecha, el tipo de contenido debe ser fecha. Cualquier inexactitud debe corregirse manualmente.

Barra de gestión

En la parte superior de la página se encuentra la barra de administración. La barra de administración permite realizar múltiples operaciones: navegar entre documentos, eliminar/restaurar un documento, buscar/filtrar documentos, ejecutar predicciones de modelos de IA, importar y exportar documentos.

Estos son los elementos disponibles en la barra de administración:

Elemento

Icono

Descripción

Navegación

Permite navegar entre los documentos que coinciden con el filtro activo.

Entre las dos flechas aparece un contador. Muestra el número del documento actual del total de documentos que coinciden con la búsqueda o filtro activos.

Buscar y buscar en el documento

Buscar: inicia una búsqueda o filtra los documentos. El filtro también se aplica al exportar documentos. Puedes filtrar por las palabras de un documento o por el nombre de los documentos.

Buscar en el documento: inicia una búsqueda de texto en el documento haciendo clic en o con el atajo de teclado Ctrl + Shift + F.

Eliminar/Restaurar

/

Elimina o restaura un documento. Los documentos eliminados se encuentran bajo el filtro de eliminados.

Importar

Abre el cuadro de diálogo Importar datos.

Exportar

Abre el cuadro de diálogo Exportar archivos.

Nombre y tipo de documento

N/D

El nombre del documento actualmente activo y su tipo.

Descargar

La opción está disponible en el desplegable junto al nombre del documento.

Haz clic en el icono para descargar un archivo Zip que contiene el documento original. Además del documento original, también se descargan todas las páginas convertidas internamente por el administrador de documentos en imágenes .jpeg.

Eliminar de forma permanente

docs image

La opción está disponible en el menú desplegable junto al nombre del documento.

Borra permanentemente archivos individuales. .pdf y todas sus imágenes .jpeg se eliminan del conjunto de datos de AI Center y todos los metadatos se eliminan de la base de datos.

Al hacer clic en el botón, se mostrará un mensaje emergente que te preguntará si quieres eliminar de forma definitiva el documento. Haz clic en Aceptar para continuar o Cancelar para volver a la pantalla anterior.

Predecir

Ejecutar las predicciones del modelo de IA y mostrar los resultados.

Una vez se configure el preetiquetado, el botón se activa en la barra de administración. Haz clic en él para preetiquetar el documento actual.

Por el momento, al utilizar la opción Predecir con Puntos finales públicos solo se preetiquetan las 10 primeras páginas de un documento. Este es un problema conocido y se está buscando una solución. Sin embargo, el uso de la opción Predecir con Habilidades ML en AI Center no impone tal limitación.

Publicar

Publica el extractor Formularios IA y crea el enlace asociado, disponible en la lista de extractores del proyecto.

Configuración

Configura los ajustes de OCR y preetiquetado o accede al panel Tutorial.

El botón de configuración tiene dos opciones disponibles:

  • Configuración donde se puede ver la configuración de OCR que se rellena automáticamente desde la configuración del proyecto.
  • Elmodo de accesibilidad hace que los valores sin procesar sean visibles

  • Cómo ... donde puede encontrar todos los atajos y controles disponibles.

Sesión

N/D

El nombre de la sesión actual, que se encuentra en la parte superior de la página, junto al logotipo de UiPath Document Understanding.

Profundicemos un poco más para entender la diferencia entre las opciones Eliminar y Eliminar de forma permanente.

  • La opción Eliminar elimina los archivos sin eliminarlos permanentemente de su proyecto. Aún puedes encontrar los archivos eliminados bajo el filtro eliminado de la barra de búsqueda y restaurarlos con la opción Restaurar .
  • La opción Eliminar de forma permanente borra los archivos seleccionados sin posibilidad de restaurarlos.

    Consulte a continuación el uso de ambas opciones:



El botón de configuración tiene dos opciones disponibles:

  • Configuración : dónde puede configurar el servicio de OCR
  • Cómo ... , que tiene el propósito de ser un menú de ayuda


Campos de columna

Crear un campo de columna nuevo

  1. Haz clic en docs image, en la sección de la tabla en la parte superior de la página, para añadir un nuevo campo de columna. Se mostrará la ventana Crear campo de columnas.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  3. Haz clic en Aceptar.

Editar un campo de columnas

Haz clic en el botón Editar campo. Las opciones disponibles para los campos de columna se encuentran en la tabla siguiente.

Opción

Descripción

Nombre del campo

Nombre único para el campo.

El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.

Tipo de contenido

El tipo de contenido de un campo:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: adecuado para importes o cantidades, con un análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, aplica un formato y unifica la salida en formato aaaa-mm-dd.
  • teléfono: adecuado para números de teléfono. El formato elimina las letras y los paréntesis, y reemplaza los espacios por guiones.
  • n.º-id: apropiado para códigos alfanuméricos, números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de dos puntos :. Si el número de identificación que necesitas extraer puede contener dos puntos :, utiliza una cadena como tipo de contenido para evitar la pérdida de datos.

Atajo

La tecla de acceso directo al campo. Se permiten una o dos claves.

Dividir los elementos

Selecciona esta casilla si deseas que este campo se use como delimitador entre elementos o filas de una tabla. En cualquier línea en la que aparezca este campo, se considera que hay un elemento de línea o fila nueva en la tabla. Normalmente, esto se utiliza en campos de Cantidad de línea en elementos de línea de Factura.

Haz clic en Guardar para guardar la configuración.

La agrupación de las filas de la tabla es diferente a la del administrador de documentos de AI Center. Aquí, las filas se agrupan automáticamente en función del estado de la casilla Dividir los elementos de cada campo de columnas. Esto solo es relevante para las tablas con filas que contienen varias líneas de texto. En este caso, debes marcar la casilla Dividir los elementos en cualquiera de los campos que tengan una sola línea para cada fila de la tabla. Por ejemplo, en una factura, el importe del elemento sería un campo típico en el que se puede marcar la opción Dividir los elementos. En el contexto de Formularios IA, se haría lo mismo en los formularios.

El ejemplo siguiente muestra una descripción de dos líneas para un elemento. En este caso, el campo de columna descripción no tiene marcada la opción Dividir los elementos, mientras que los otros dos campos de columna sí la tienen marcada.



Eliminar un campo de columnas

Para eliminar un campo de columnas, sigue estos pasos:

  1. Haz clic en el botón Editar campo docs image correspondiente al campo de la columna que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Haz clic en Aceptar.
  4. El campo de la columna y sus datos etiquetados asociados se eliminan.

Campos

Crear un campo nuevo

  1. Haz clic en docs image en el panel derecho en la sección Campos. Se muestra la ventana Crear un nuevo campo regular.
  2. Introduce un nombre único para el campo en Introducir nombre único del campo. El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.
  3. Haz clic en Aceptar.

Eliminar todos los campos

  1. Haz clic en docs image en la sección de la tabla en la parte superior de la página para eliminar todos los campos creados. Utiliza esta función para eliminar todos los campos, incluidos los campos Regular y Columna, y todas las etiquetas de los documentos de la colección Tipo de documento actual. Esta acción no se puede deshacer.
  2. Haz clic en el botón Eliminar del cuadro de diálogo Eliminar todos los campos.

Editar un campo

Haz clic en el botón Editar campo. Las opciones disponibles para los campos regulares se encuentran en la siguiente tabla.

Opción

Descripción

Nombre del campo

Nombre único para el campo.

El campo no acepta mayúsculas. Solo puede contener letras minúsculas, números, guiones bajos _ y guion -.

Tipo de contenido

El tipo de contenido de un campo:

  • string: adecuada para nombres de empresas o direcciones, así como para condiciones de pago, o cualquier otro campo en el que el RPA Developer prefiera crear la lógica de análisis o formato de forma manual en el flujo de trabajo de RPA.
  • número: adecuado para importes o cantidades, con un análisis inteligente de los separadores de decimales/miles.
  • fecha: el modelo analiza, aplica un formato y unifica la salida en formato aaaa-mm-dd.
  • teléfono: adecuado para números de teléfono. El formato elimina las letras y los paréntesis, y reemplaza los espacios por guiones.
  • n.º-id: apropiado para códigos alfanuméricos, números de identificación. Se parece al tipo de contenido string, pero incluye la eliminación de cualquier carácter que vaya delante de dos puntos :. Si el número de identificación que necesitas extraer puede contener dos puntos :, utiliza una cadena como tipo de contenido para evitar la pérdida de datos.

Atajo

La tecla de acceso directo al campo. Se permiten una o dos claves.

Línea múltiple

General

Haz clic en Guardar para guardar la configuración.

Borrar un campo regular

Para eliminar un campo regular, sigue estos pasos:

  1. Haz clic en el botón Editar campo docs image correspondiente al campo regular que deseas eliminar.
  2. Haz clic en el botón Eliminar.
  3. Haz clic en Aceptar.
  4. El campo y sus datos etiquetados asociados se eliminan.

Visualización y etiquetado de documentos

En el caso de los documentos de varias páginas, puedes desplazarte de forma natural por las páginas como en cualquier visor de PDF. Para ampliar o reducir la imagen, pulsa Ctrl a la vez que desplazas el ratón.

Puedes etiquetar los documentos seleccionando los recuadros de palabras y asignándolas a un campo con una tecla. También puedes hacer clic con el botón derecho en el recuadro de palabras y verificar la información extraída.

Para obtener más detalles sobre cómo etiquetar documentos, visita esta página.

Casillas de verificación

Las casillas de verificación que están disponibles en Formularios AI deben etiquetarse manualmente para cada campo. Las casillas de verificación de las tablas también se pueden etiquetar usando la opción Campos de columna . Cuando se etiqueta una casilla de verificación en Formularios AI, se deben considerar tanto las casillas marcadas como las no marcadas.

Aquí puedes encontrar información más detallada sobre cómo etiquetar casillas de verificación.

Puedes optar por integrar tu proyecto de Document Understanding en un flujo de trabajo de RPA siguiendo los pasos presentados aquí.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.