- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Guía del usuario de Document Understanding
Introducción
El marco UiPath® Document UnderstandingTM facilita el procesamiento de archivos entrantes, desde la digitalización de archivos hasta la validación de datos extraídos, todo en un entorno abierto, extensible y versátil.
Document Understanding está diseñado para ayudarte a combinar diferentes enfoques para extraer información de múltiples tipos de documentos. El objetivo principal es facilitar al máximo el proceso de extracción de datos: crear un único flujo de trabajo que extraiga datos de diversos documentos.
Antes de usar el marco de trabajo de Document Understanding, se recomienda entender los siguientes componentes del marco de trabajo de Document Understanding.
- Taxonomía ¿Qué documentos deben procesarse y qué datos se requieren de ellos? Se utiliza para definir los tipos de documentos y las piezas de información destinadas a la extracción de datos (campos) para cada tipo de documento, y formaliza esta información en una estructura de taxonomía dedicada. Esta información de metadatos se gestiona a través del Gestor de taxonomía.
- Digitalización ¿Qué contiene este archivo? Se utiliza para obtener el contenido textual y la estructura del documento entrante, convirtiendo un archivo en contenido legible por la máquina para que pueda ser procesado posteriormente.
- Clasificación de documentos ¿Qué tipos de documentos de la taxonomía se encuentran en este archivo? Se utiliza para determinar automáticamente qué tipos de documentos se encuentran dentro de un archivo digitalizado.
- Validación de clasificación de documentos ¿Es correcta la clasificación prevista? Así es como puedo revisarlo y corregirlo. Se utiliza para ayudar en la validación y corrección humana de la clasificación automática y los resultados de la división de documentos.
- Entrenamiento de la clasificación ¿El humano revisó los datos? Así es como el robot puede aprender de él. Se utiliza para devolver la información validada por humanos a los clasificadores, para que la utilicen para mejorar sus predicciones futuras.
- Extracción de información ¿Qué datos se pueden encontrar en este documento en particular? Se utiliza para capturar la información necesaria para el tipo de documento identificado, dentro del rango de documentos de entrada y páginas de clasificación dados.
- Validación de extracción de datos ¿Es correcta la información extraída? Así es como puedo revisarlo y corregirlo. Se utiliza para ayudar en la validación y corrección humana de los resultados de datos extraídos automáticamente.
- Entrenamiento de extracción de datos ¿El humano revisó los datos? Así es como el robot puede aprender de él. Se utiliza para devolver los datos extraídos validados por humanos a los extractores, para utilizarlos para mejorar sus predicciones de extracción.
- Consumo de datos Se utiliza para exportar los datos validados para consumirlos.
- Lógica de medición y cobro Se utiliza para explicar el consumo de unidades por página para cada servicio disponible.
El siguiente diagrama presenta los componentes del marco de Document Understanding y cómo se relacionan entre sí:

El marco de Document Understanding se encuentra en el paquete UiPath.IntelligentOCR.Activities . Una vez instalado el paquete UiPath.IntelligentOCR.Activities , el asistente Gestor de taxonomía aparece en la cinta superior de UiPath Studio. Este mismo paquete contiene todas las actividades básicas del marco de Document Understanding.
Las actividades de ámbito (Clasificar ámbito de documento, ámbito de extracción de datos, Ámbito de entrenamiento de los clasificadores, Ámbito de entrenamiento de los extractores) que forman parte del marco de Document Understanding te permiten usar cualquier algoritmo de clasificación de documentos y de extracción de datos que se ajuste a tu caso de uso y luego entrenar estos algoritmos.
El marco de Document Understanding puede utilizarse no solo con los clasificadores y extractores listos para usar, sino también con cualquiera creado a medida. Estos pueden crearse utilizando las clases abstractas del paquete UiPath.DocumentProcessing.Contracts y pueden implementarse como actividades de clasificación o extracción de datos. También se pueden crear motores OCR personalizados utilizando las clases abstractas del paquete UiPath.OCR.Contracts.
Recursos
Los cursos especializados en Document Understanding pueden encontrarse en UiPath RPA Academy.
El Foro de UiPath Community es el lugar donde recibir ayuda de nuestra creciente comunidad de usuarios.