document-understanding

2020.10

false

Importante :

La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Obsoleto

Guía del usuario de Document Understanding

ENTREGA:

Última actualización 4 de feb. de 2025

Introducción

El marco de Document Understanding de UiPath facilita el procesamiento de los archivos entrantes, desde la digitalización de archivos hasta la validación de los datos extraídos, todo ello en un entorno abierto, extensible y versátil.

Document Understanding está diseñado para ayudarte a combinar diferentes enfoques para extraer información de múltiples tipos de documentos. El objetivo principal es facilitar al máximo el proceso de extracción de datos: crear un único flujo de trabajo que extraiga datos de diversos documentos.

Antes de usar el marco de trabajo de Document Understanding, se recomienda entender los siguientes componentes del marco de trabajo de Document Understanding.

Taxonomía ¿Qué documentos hay que procesar y qué datos se requieren de ellos?
Sirve para definir los tipos de documentos y las piezas de información destinadas a la extracción de datos (campos) para cada tipo de documento, y formaliza esta información en una estructura de Taxonomía dedicada. Esta información de metadatos se gestiona a través del Gestor de taxonomía.
Digitalización ¿Qué contiene este archivo?
Se usa para obtener el contenido textual y la estructura del documento entrante, convirtiendo un archivo en contenido legible por la máquina para que pueda ser procesado posteriormente.
¿Qué tipos de documentos de la taxonomía se encuentran en este archivo?
Se usa para determinar automáticamente qué tipos de documentos se encuentran dentro de un archivo digitalizado.
¿Es correcta la clasificación prevista? Así puedo revisarla y corregirla.
Se usa para facilitar la validación y corrección humana de los resultados de la clasificación automática y la división de documentos.
¿Revisó el humano los datos? Esta es la forma en la que el robot puede aprender de ellos.
Se usa para devolver la información validada por los humanos a los clasificadores, para que la usen con el fin de mejorar sus futuras predicciones.
Extracción de información ¿Qué datos se pueden encontrar en este documento concreto?
Se usa para capturar la información requerida para el tipo de documento identificado, dentro del rango de documento de entrada y página de clasificación dados.
Validación de extracción de datos ¿Es correcta la información extraída? Esta es la forma en la que puedo revisarla y corregirla.
Se usa para facilitar la validación y corrección humana de los resultados de los datos extraídos automáticamente.
Entrenamiento de extracción de datos ¿Revisó el humano los datos? Esta es la forma en la que el robot puede aprender de ellos.
Se utiliza para transferir los datos extraídos y validados por una persona de vuelta a los extractores, para utilizarlos para mejorar sus predicciones de extracción.
Consumo de datos
Se utiliza para exportar los datos validados para su consumo.

El siguiente diagrama presenta los componentes del marco de Document Understanding y cómo se relacionan entre sí:

El marco de Document Understanding se encuentra en el paquete de actividades de IntelligentOCR. Una vez instalado el paquete UiPath.IntelligentOCR.Activities, el asistente del gestor de taxonomía aparecerá en la cinta superior de UiPath Studio. Este mismo paquete contiene todas las actividades del marco de Document Understanding básico.

Las actividades de ámbito (Clasificar ámbito de documento, ámbito de extracción de datos, Ámbito de entrenamiento de los clasificadores, Ámbito de entrenamiento de los extractores) que forman parte del marco de Document Understanding te permiten usar cualquier algoritmo de clasificación de documentos y de extracción de datos que se ajuste a tu caso de uso y luego entrenar estos algoritmos.

El marco de trabajo de Document Understanding se puede usar no solo con los clasificadores y extractores listos para usar, sino también con cualquier otro creado a medida. Pueden crearse utilizando las clases abstractas del paquete e implementarse como actividades de clasificación o extracción de datos. También los motores de OCR personalizados pueden crearse con las clases abstractas del paquete.