- Primeros pasos
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Paquetes ML
- Procesos
- Gestor de datos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Importar documentos
El cuadro de diálogo Importar datos permite importar fácilmente nuevos documentos para etiquetar o revisar.
Haz clic en el botón Importar de la barra de gestión.
El cuadro de diálogo contiene los siguientes controles:
- Campo de texto Nombre del lote: es obligatorio introducir un nombre para tu exportación, de lo contrario la sección Examinar o soltar archivos se desactiva; un nombre válido puede tener hasta 24 caracteres y no debe contener caracteres especiales.
- Casilla Haz de este un conjunto de evaluación: cuando se selecciona, el conjunto de datos se utiliza con fines de evaluación.
- Casilla Habilitar documentos grandes: si está seleccionada, puedes cargar documentos de más de 150 páginas.
- Sección Examinar o soltar archivos: haz clic en Examinar los archivos para subirlos para navegar por tu directorio o simplemente arrastra los archivos dentro del marco.
- Sección Estado: haz clic en (cargar el registro de importación anterior) para comprobar el estado de la última importación; cuando cargues datos, en la sección de estado recibirás un resumen de tus archivos y se te pedirá que continúes con la importación haciendo clic en SÍ o que abortes la importación haciendo clic en CANCELAR.
Importante:La versión 2021.10 de Data Manager admite el etiquetado de documentos de varias páginas. Se trata de un cambio importante con respecto a las versiones anteriores, en las que cada página se etiquetaba por separado. El etiquetado y la exportación de documentos de varias páginas supone que cada documento representa un único documento lógico. Por ejemplo, un documento de seis páginas puede contener una única factura de seis páginas, pero no debe contener tres facturas diferentes de dos páginas cada una. Esto es especialmente importante para los conjuntos de evaluación.
Este requisito no es pertinente para exportaciones retrocompatibles.
Hay cuatro tipos de Importar admitidos en Data Manager:
- Importación de esquema
- Importación de documentos en bruto (máx. 2000 o 2 GB de páginas por importación)
- Importación del conjunto de datos de Data Manager (máx. 2000 o 2 GB de páginas por importación)
- Importación del conjunto de datos de la Estación de validación (máx. 2000 o 2 GB de páginas por importación)
Si te gustaría lanzar una nueva sesión de Data Manager utilizando el mismo esquema que en una sesión existente, puedes seguir estos pasos:
- Haz clic en el botón Exportar en la barra de gestión.
- En el cuadro de diálogo Exportar archivos, marca la opción Esquema.
- Haz clic en el botón Exportar dentro del cuadro de diálogo. Se exporta un archivo
.zip
. - Haz clic en el botón Importar de la barra de gestión.
- Carga o arrastra y suelta el archivo
.zip
directamente en la sesión de Data Manager (no descomprimir). En este paso, también puedes cargar un esquema predefinido. - Haz clic en SÍ en la sección Estado para proceder a la importación. El esquema se importa.
También puedes usar uno de los esquemas predefinidos proporcionados en la página Utilizar un esquema predefinido.
.pdf
, .tiff
, .png
y .jpg
.
- Los archivos
.zip
no son compatibles con la importación de documentos en bruto. - Los ajustes de OCR deben configurarse antes de la importación.
Sigue estos pasos:
- Haz clic en el botón Importar . Se muestra el cuadro de diálogo Importar datos.
- Indica un nombre de lote en el campo Nombre del lote. Esto te permite filtrar y encontrar fácilmente estos documentos usando el desplegable Buscar más adelante.
- Si deseas usar este lote de documentos para el entrenamiento de un modelo ML, deja sin seleccionar la casilla Hacer de esto un conjunto de evaluación.
- Si deseas usar este lote de documentos para evaluar un modelo ML (por ejemplo, para medir su rendimiento), selecciona la casilla Hacer de esto un conjunto de evaluación. Esto garantiza que los datos sean ignorados por los procesos de entrenamiento.
- Si tienes documentos de más de 150 páginas, marca la casilla Habilitar documentos grandes. En caso contrario, deja la casilla sin marcar.
- Carga o arrastra un archivo o conjunto de archivos en la sección Examinar o soltar archivos.
- Haz clic en Sí. Se importa el archivo o conjunto de archivos.
.zip
exportado originalmente e importarlo directamente a la nueva instancia de Data Manager.
Si tu nueva instancia de Data Manager está completamente vacía (sin datos ni campos definidos), entonces tanto los documentos con etiquetas y el esquema serán importados.
Si tu nueva instancia de Data Manager ya tiene campos definidos, entonces el conjunto de datos recién importado debe tener los mismos campos o un subconjunto de esos campos. En caso contrario, se rechaza la importación.
Dividir grandes conjuntos de datos
.zip
en múltiples archivos .zip
de menos de 1 GB y que tengan menos de 1500 archivos.
A medida que tu flujo de trabajo RPA procesa los documentos usando un modelo ML existente, algunos documentos pueden requerir de validación humana mediante la actividad Estación de validación (disponible en los robots attended o en el navegador que usa el Action Center de Orchestrator).
Los datos validados generados en la Estación de validación se pueden exportar usando la actividad Entrenador de extractor con aprendizaje automático y se pueden usar para entrenar modelos ML con la característica descrita a continuación.
Sigue estos pasos:
- Configura el entrenador de extractor con aprendizaje automático para que los datos salgan en una carpeta con ruta
<Trainer/Output/Folder>
(usa cualquier ruta de carpeta vacía). - Ejecuta un flujo de trabajo de RPA que incluya la estación de validación y el entrenador de extractor con aprendizaje automático.
- El entrenador de extractor con aprendizaje automático crea tres subcarpetas: documentos, metadatos y predicciones dentro de la carpeta de salida.
- Comprime
<Trainer/Output/Folder>
para obtener un archivo.zip
, por ejemplo TrainerOutputFolder.zip. - Importa el archivo
.zip
en Data Manager, que detecta que la importación contiene datos producidos por el Entrenador de extractor con aprendizaje automático e importa los datos en consecuencia.
Si faltan campos requeridos por el conjunto de datos, se muestra un mensaje de error en el cuadro de diálogo de importación.