- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador de CapturaFlexible
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 4506T: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos - paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Document Understanding implementado en Automation Suite
- Instalar y utilizar
- Primera experiencia de ejecución
- Implementar UiPathDocumentOCR
- Implementar un paquete ML listo para usar
- Paquetes sin conexión 2023.10.12+patch1
- Paquetes sin conexión 2023.10.12
- Paquetes sin conexión 2023.10.11
- Paquetes sin conexión 2023.10.10
- Paquetes sin conexión 2023.10.9
- Paquetes sin conexión 2023.10.8
- Paquetes sin conexión 2023.10.7+patch1
- Paquetes sin conexión 2023.10.7
- Paquetes sin conexión 2023.10.6
- Paquetes sin conexión 2023.10.5
- Paquetes sin conexión 2023.10.4
- Paquetes sin conexión 2023.10.3
- Paquetes sin conexión 2023.10.2
- Paquetes sin conexión 2023.10.1
- Paquetes sin conexión 2023.10.0
- Utiliza Document Manager
- Utilizar el marco
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Document Understanding user guide
Importar documentos
El cuadro de diálogo Importar datos permite importar fácilmente nuevos documentos para etiquetar o revisar.
Select the Import button
from the management bar.
El cuadro de diálogo contiene los siguientes controles:
-
Campo de texto Nombre del lote: es obligatorio introducir un nombre para tu exportación, de lo contrario la sección Examinar o soltar archivos se desactiva; un nombre válido puede tener hasta 24 caracteres y no debe contener caracteres especiales.
-
Make this an evaluation set checkbox - if selected, the dataset is used for evaluation purposes.
-
Browse or drop files section - select Browse files to upload to navigate through your directory or simply drag and drop the files inside the frame.
-
Status section - select (load previous import log) to check to check the status of the latest import; when uploading data, in the Status section you receive an overview of your files and you are prompted to proceed with the import by selecting YES or abort the import by selecting CANCEL.

Tipos de importación
Hay 4 tipos de importación compatibles en el administrador de documentos:
- Importación de esquema
- Raw documents import (max 2000 pages and 4000 MiB per import)
- Document Manager dataset import (4000 MiB per import)
- Validation Station dataset import (max 2000 pages and 4000 MiB per import)
Importación de esquema
Si deseas iniciar una nueva sesión del administrador de documentos con el mismo esquema que en una sesión existente, puedes seguir estos pasos:
- Select the Export button from the management bar.
- En el cuadro de diálogo Exportar archivos, marca la opción Esquema.
- Select the Export button inside the dialog box. A
.zipfile is exported. - Select the Import button from the management bar.
- Upload or drag & drop the
.zipfile directly into the new Document Manager session (do not unzip). In this step, you can also upload a predefined schema. - Select YES in the Status section to proceed with the import. The schema is imported.
La importación de esquemas también puede aplicarse a campos con varios valores.
Ten en cuenta que los campos multivaluados solo son compatibles con los modelos con la Versión 2022.10 o superior.
Importación de documentos sin formato
Los tipos de documentos que se pueden importar para el etiquetado son .pdf, .tiff, .png y .jpg.
Los archivos .zip no son compatibles con la importación de documentos en bruto.
Los ajustes de OCR deben configurarse antes de la importación.
- Select the Import button
. The Import data dialog box is displayed. - Indica un nombre de lote en el campo Nombre del lote. Esto te permite filtrar y encontrar fácilmente estos documentos usando el desplegable Buscar más adelante.
- Si deseas usar este lote de documentos para el entrenamiento de un modelo ML, deja sin seleccionar la casilla Hacer de esto un conjunto de evaluación.
- Si deseas usar este lote de documentos para evaluar un modelo ML (por ejemplo, para medir su rendimiento), selecciona la casilla Hacer de esto un conjunto de evaluación. Esto garantiza que los datos sean ignorados por los procesos de entrenamiento.
- Carga o arrastra un archivo o conjunto de archivos en la sección Examinar o soltar archivos.
- Select YES. The file or set of files are imported.
Importación de conjuntos de datos del administrador de documentos
Para importar un conjunto de datos que fue etiquetado previamente en otra sesión del administrador de documentos, es necesario obtener el archivo .zip que fue exportado originalmente, e importarlo directamente en la nueva instancia del administrador de documentos.
Si tu nueva instancia del administrador de documentos está completamente vacía (sin datos ni campos definidos), se importan tanto los documentos con etiquetas como el esquema.
Si tu nueva instancia del administrador de documentos ya tiene campos definidos, el nuevo conjunto de datos importado debe tener los mismos campos, o un subconjunto de esos campos. En caso contrario, se rechaza la importación.
En caso de que exportes una base de datos desde un entorno de Automation Cloud™ y luego la importes a una implementación local, debes seguir estos pasos:
- Descomprime el archivo del conjunto de datos.
- Edita el archivo
scheman.jsondel archivo. - Elimina todas las propiedades
display_namedel archivojsony guárdalo. - Vuelve a comprimir el conjunto de datos e impórtalo a la sesión de las instalaciones.
Dividir grandes conjuntos de datos
To import Document Manager datasets larger than 1GB or that have more than 1500 files, we recommend you to use this script which splits the .zip files into multiple .zip files that are smaller than 1GB and that have less than 1500 files.
Importación del conjunto de datos de la estación de validación
As your RPA workflow processes documents using an existing ML model, some documents may require human validation using the Validation Station activity (available on attended bots or in the browser using Orchestrator Action Center).
The validated data generated in Validation Station can be exported using Machine Learning Extractor Trainer activity and can be used to train ML models.
Para la importación de conjuntos de datos de la estación de validación, es obligatorio tener un esquema definido.
- Configura el entrenador de extractor con aprendizaje automático para que los datos salgan en una carpeta con ruta
<Trainer/Output/Folder>(usa cualquier ruta de carpeta vacía). - Ejecuta un flujo de trabajo de RPA que incluya la estación de validación y el entrenador de extractor con aprendizaje automático.
- El entrenador de extractor con aprendizaje automático crea tres subcarpetas: documentos, metadatos y predicciones dentro de la carpeta de salida.
- Comprime
<Trainer/Output/Folder>para obtener un archivo.zip, por ejemplo TrainerOutputFolder.zip. - Importa el archivo
.zipen el administrador de documentos, que detecta que la importación contiene datos producidos por el entrenador de extractor con aprendizaje automático e importa los datos en consecuencia.
Si faltan campos requeridos por el conjunto de datos, se muestra un mensaje de error en el cuadro de diálogo de importación.
