- Información general
- Primeros pasos
- Actividades
- Paneles de insights
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Información general
- Actividades de Document Understanding
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador inteligente de palabra clave
- Clasificador basado en palabras clave
- Clasificador de aprendizaje automático
- Clasificador generativo
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Llamadas a API
- Paquetes ML
- Información general
- Document Understanding - Paquete ML
- DocumentClassifier: paquete ML
- Paquetes ML con capacidades OCR
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Otros paquetes ML listos para usar
- Puntos finales públicos
- Limitaciones de tráfico
- Configuración de OCR
- Procesos
- Servicios de OCR
- Idiomas admitidos
- Aprendizaje profundo
- Licencia
Guía del usuario de Document Understanding
Exportar documentos
El cuadro de diálogo Exportar archivos permite exportar fácilmente los datos para el entrenamiento de los modelos ML.
Haz clic en el botón Exportar en la barra de gestión.
El cuadro de diálogo contiene tres pestañas:
La pestaña Exportar ahora te permite:
- Descargar a Excel: descarga los datos localmente en formato Excel.
- Descargar: descarga los datos localmente.
- Exportar a AI Center: exporta los datos a AI Center. Las carpetas exportadas se encuentran en AI Center en la carpeta de exportación (Conjuntos de datos > dataset_name > exportación).
Si no se define ningún esquema, se deshabilitan todas las opciones de exportación.
Si se define un esquema, es obligatorio introducir un nombre para su exportación, de lo contrario, los botones Descargar y Exportar están deshabilitados. Un nombre válido puede tener hasta 24 caracteres y no debe contener caracteres especiales.
Puedes exportar o descargar un esquema incluso si incluye campos multivaluados.
Puedes optar por exportar una de las siguientes opciones:
- Resultados de búsqueda actuales: los documentos etiquetados filtrados por una palabra clave/lote de nombre predefinido o por una consulta de texto. Si no se aplica ningún filtro, se exportan todos los documentos etiquetados en la vista actual.
- Todos los etiquetados: todos los documentos con al menos un campo etiquetado, de cualquier tipo; más concretamente, los documentos del filtro etiquetado.
- Esquema: un archivo zip que contiene los campos y sus configuraciones, y que puede ser importado en otra sesión del administrador de documentos.
- Todos: exporta todos los documentos, con independencia de si se han aplicado etiquetas o no.
La casilla de verificación Exportación compatible con versiones anteriores te permite aplicar el comportamiento de exportación heredado, que consiste en exportar cada página como un documento independiente. Prueba esta opción si el modelo entrenado con la exportación predeterminada no cumple las expectativas. Deja esta opción sin seleccionar para exportar los documentos en su formulario original de varias páginas.
Para exportar un conjunto de datos, todos los campos deben estar etiquetados en al menos 10 páginas diferentes. De lo contrario, la exportación falla y se muestran los siguientes mensajes:
En el caso de los campos de clasificación, existe un requisito adicional: cada opción debe estar etiquetada en al menos un documento. De lo contrario, la exportación falla y se muestra el siguiente mensaje:
Cuando se exportan solo los datos del conjunto de evaluación, se desactivan todas las validaciones.
Una carpeta que contiene el conjunto de datos exportados procedentes del administrador de documentos. Esto incluye:
schema.json
: un archivo que contenga los campos a extraer y sus tipos.split.csv
: un archivo que contiene la división por cada documento que se usará para ENTRENAR o VALIDAR durante el proceso de entrenamiento.- imágenes: una carpeta que contiene imágenes de todas las páginas etiquetadas.
-
último: una carpeta que contiene archivos
.json
con los datos etiquetados de cada página.
La característica Programación de la exportación está documentada aquí.
La pestaña Registros muestra el último registro exportado.
En caso de que la exportación tenga éxito, el registro muestra el número de documentos procesados y la duración de la exportación.
En caso de que la exportación del esquema tenga éxito, el registro muestra la duración de la exportación.
Durante la exportación, puedes comprobar el estado de la misma. Esto resulta particularmente útil para las grandes exportaciones.
Los mensajes de error también se muestran en los registros, por ejemplo:
En caso de que el entrenamiento automático tenga éxito, también se muestran los registros de importación de la carpeta ajuste del conjunto de datos: