- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- 990 - Paquete ML: vista previa
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Pasaportes: paquete ML
- Nóminas - - Paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Requisitos de hardware
- Procesos
- Administrador de documentos
- Servicios de OCR
- Aprendizaje profundo
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Document Understanding implementado en AI Center independiente
- Licencia
- Actividades
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Importar documentos
El cuadro de diálogo Importar datos permite importar fácilmente nuevos documentos para etiquetar o revisar.
Haz clic en el botón Importar de la barra de gestión.
El cuadro de diálogo contiene los siguientes controles:
- Campo de texto Nombre del lote: es obligatorio introducir un nombre para tu exportación, de lo contrario la sección Examinar o soltar archivos se desactiva; un nombre válido puede tener hasta 24 caracteres y no debe contener caracteres especiales.
- Casilla Haz de este un conjunto de evaluación: cuando se selecciona, el conjunto de datos se utiliza con fines de evaluación.
- Sección Examinar o soltar archivos: haz clic en Examinar los archivos para subirlos para navegar por tu directorio o simplemente arrastra los archivos dentro del marco.
-
Sección Estado: haz clic en (cargar el registro de importación anterior) para comprobar el estado de la última importación; cuando cargues datos, en la sección de estado recibirás un resumen de tus archivos y se te pedirá que continúes con la importación haciendo clic en SÍ o que abortes la importación haciendo clic en CANCELAR.
Hay 4 tipos de importación compatibles en el administrador de documentos:
- Importación de esquema
- Importación de documentos sin formato (máximo 2000 páginas y 4000 MiB por importación)
- Importación de conjuntos de datos de Document Manager (4000 MiB por importación)
- Importación de conjuntos de datos de la estación de validación (máximo 2000 páginas y 4000 MiB por importación)
Si deseas iniciar una nueva sesión del administrador de documentos con el mismo esquema que en una sesión existente, puedes seguir estos pasos:
- Haz clic en el botón Exportar de la barra de gestión.
- En el cuadro de diálogo Exportar archivos, marca la opción Esquema.
- Haz clic en el botón Exportar dentro del cuadro de diálogo. Se exporta un archivo
.zip
. - Haz clic en el botón Importar de la barra de gestión.
- Carga o arrastra el archivo
.zip
directamente en la nueva sesión del administrador de documentos (no lo descomprimas). En este paso, también puedes cargar un esquema predefinido. - Haz clic en SÍ en la sección Estado para proceder a la importación. El esquema se importa.
La importación de esquemas también puede aplicarse a campos con varios valores.
.pdf
, .tiff
, .png
y .jpg
.
.zip
no son compatibles con la importación de documentos en bruto.
Los ajustes de OCR deben configurarse antes de la importación.
Sigue estos pasos:
.zip
que fue exportado originalmente, e importarlo directamente en la nueva instancia del administrador de documentos.
Si tu nueva instancia del administrador de documentos está completamente vacía (sin datos ni campos definidos), se importan tanto los documentos con etiquetas como el esquema.
Si tu nueva instancia del administrador de documentos ya tiene campos definidos, el nuevo conjunto de datos importado debe tener los mismos campos, o un subconjunto de esos campos. En caso contrario, se rechaza la importación.
- Descomprime el archivo del conjunto de datos.
- Edita el archivo
scheman.json
del archivo. - Elimina todas las propiedades
display_name
del archivojson
y guárdalo. - Vuelve a comprimir el conjunto de datos e impórtalo a la sesión de las instalaciones.
Dividir grandes conjuntos de datos
.zip
en múltiples archivos .zip
de menos de 1 GB y que tengan menos de 1500 archivos.
A medida que tu flujo de trabajo RPA procesa los documentos usando un modelo ML existente, algunos documentos pueden requerir de validación humana mediante la actividad Estación de validación (disponible en los robots attended o en el navegador que usa el Action Center de Orchestrator).
Los datos validados generados en la Estación de validación se pueden exportar usando la actividad Entrenador de extractor con aprendizaje automático y se pueden usar para entrenar modelos ML con la característica descrita a continuación.
Sigue estos pasos:
- Configura el entrenador de extractor con aprendizaje automático para que los datos salgan en una carpeta con ruta
<Trainer/Output/Folder>
(usa cualquier ruta de carpeta vacía). - Ejecuta un flujo de trabajo de RPA que incluya la estación de validación y el entrenador de extractor con aprendizaje automático.
- El entrenador de extractor con aprendizaje automático crea tres subcarpetas: documentos, metadatos y predicciones dentro de la carpeta de salida.
- Comprime
<Trainer/Output/Folder>
para obtener un archivo.zip
, por ejemplo TrainerOutputFolder.zip. - Importa el archivo
.zip
en el administrador de documentos, que detecta que la importación contiene datos producidos por el entrenador de extractor con aprendizaje automático e importa los datos en consecuencia.
Si faltan campos requeridos por el conjunto de datos, se muestra un mensaje de error en el cuadro de diálogo de importación.