- Primeros pasos
- Componentes de marco
- Document Understanding en AI Center
- Procesos
- Paquetes ML
- Gestor de datos
- Servicios de OCR
- Licencia
- Referencias
Guía del usuario de Document Understanding
Importar documentos
AI Center no admite nombres de archivo que contengan caracteres especiales, por lo que se recomienda encarecidamente que, antes de importar documentos a Data Manager, te asegures de que sus nombres solo contienen caracteres latinos, números, guiones (-) y guiones bajos (_).
Hay cuatro tipos de Importar admitidos en Data Manager:
- Importación de esquema
- Importación de documentos sin formato
- Importación del conjunto de datos de Data Manager
- Importación de conjunto de datos del Entrenador del extractor con aprendizaje automático (característica de VISTA PREVIA)
Si te gustaría lanzar una nueva instancia de Data Manager utilizando el mismo esquema que en una instancia existente, puedes seguir estos pasos:
- Introduce una cadena aleatoria en el filtro de la instancia existente, de forma que no quede ningún documento en la vista.
- Haz clic en el botón Exportar. Se exportará un archivo zip.
- Importa el archivo zip directamente en la nueva instancia de Data Manager (no lo descomprimas). El esquema se importará.
También puedes utilizar uno de los esquemas predefinidos que se proporcionan en la sección Configurar Data Manager de esta documentación.
.pdf
, .tiff
, .png
y .jpg
. Los pasos son:
- Haz clic en Importar. Se muestra la ventana Importar datos.
- Indica un nombre de lote en el campo Nombre del lote. Esto te permite filtrar y encontrar fácilmente estos documentos usando el desplegable Filtro más adelante.
- Si deseas usar este lote de documentos para el entrenamiento de un modelo ML, deja sin seleccionar la casilla de verificación Convertirlo en un conjunto de prueba.
- Si deseas usar este lote de documentos para evaluar un modelo ML (por ejemplo, medir su rendimiento), marca la casilla de verificación Hacer de este un conjunto de prueba. Esto garantiza que los datos sean ignorados por los procesos de entrenamiento.
- Carga o arrastra un archivo o conjunto de archivos en la sección Examinar o soltar archivos.
Se acepta cualquier tipo de archivo. La aplicación los inspecciona e indica cuántos de ellos se pueden importar. También se aceptan archivos
.zip
. La aplicación descomprime el archivo y recorre las carpetas de manera recurrente para encontrar todos los archivos que contiene.Al importar un archivo zip de conjunto de datos exportado desde otra instancia de Data Manager, se importarán los documentos con las etiquetas. Esto solo funciona si el esquema del conjunto de datos es el mismo o es un subconjunto del esquema preexistente en Data Manager.
Para importar un conjunto de datos etiquetado previamente en otra instancia de Data Manager, debes obtener el archivo zip exportado originalmente, e importarlo directamente a la nueva instancia de Data Manager. Si tu nueva instancia de Data Manager está completamente vacía (sin datos ni campos definidos), entonces se importarán tanto los datos como el esquema. Si tu nueva instancia de Data Manager ya tiene campos definidos, entonces el conjunto de datos recién importado debe tener los mismos campos o un subconjunto de esos campos. De lo contrario, se rechazará la importación.
A medida que tu flujo de trabajo RPA procesa los documentos usando un modelo ML existente, algunos documentos pueden requerir de validación humana mediante la actividad Estación de validación (disponible en los robots attended o en el navegador que usa el Action Center de Orchestrator).
Los datos validados generados en la estación de validación pueden exportarse utilizando la actividad Entrenador de extractores de aprendizaje automático y pueden utilizarse para entrenar modelos ML utilizando la característica descrita aquí.
Los pasos que hay que realizar son los siguientes:
- Configura el Entrenador del extractor con aprendizaje automático para que los datos salgan en una carpeta con ruta <Trainer/Output/Folder> (usa cualquier ruta de carpeta vacía).
- Ejecuta el flujo de trabajo RPA, incluyendo la Estación de validación y el Entrenador del extractor ML.
- El Entrenador del extractor con aprendizaje automático creará 3 subcarpetas denominadas: documentos, metadatos y predicciones en la carpeta de salida.
- Comprime <Trainer/Output/Folder> para obtener un archivo zip como, por ejemplo, TrainerOutputFolder.zip.
- Importa el archivo zip en Data Manager. Data Manager detectará que la importación contiene datos generados por el Entrenador del extractor con aprendizaje automático e importará los datos en consecuencia.
- Exporta los datos como siempre y cárgalos en AI Center.
- Inicia el Proceso de entrenamiento o el Proceso completo y asegúrate de seleccionar el Paquete ML y la versión que deseas ajustar.