- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Paquetes ML
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- Receipts Japan - ML package
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Idiomas admitidos
- Paneles de insights
- Datos y seguridad
- Licencia
- Tutorial
Guía del usuario de proyectos modernos de Document Understanding
Migrar proyectos clásicos
- Exporta el conjunto de datos del proyecto clásico o el proyecto basado en AI Center.
- Importar el conjunto de datos en el proyecto moderno.
- Actualmente, no se admite la importación de conjuntos de datos mayores de 3000 páginas. Solo las 3000 páginas iniciales se importarán correctamente, cualquier página adicional no lo hará. Por ejemplo, si tu conjunto de datos consta de 2999 páginas e intentas importar un documento de 4 páginas, el proceso no se realizará correctamente.
- Los nombres de los lotes y los resultados de los lotes correspondientes no están disponibles actualmente. Si tus datos están organizados en lotes, esta información aún no se muestra, pero se guarda.
Una vez que se importa el conjunto de datos, se inicia el entrenamiento del modelo. Una vez que se complete el entrenamiento, se muestra la puntuación del modelo. Para comprobar las puntuaciones del modelo detallado, selecciona la puntuación y luego Puntuaciones del modelo detalladas.
Esta acción te lleva a la página Medir donde puedes acceder a métricas del modelo detalladas.
Cuando se utiliza el mismo conjunto de datos para entrenar un ML dos veces, puedes observar métricas del modelo ligeramente diferentes. Esto puede ocurrir debido a algunas razones:
- Inicialización: el aprendizaje automático utiliza métodos de optimización que necesitan conjeturas iniciales para desencadenar los algoritmos de optimización. Diferentes conjeturas iniciales durante cada entrenamiento podrían conducir a varios resultados debido a la naturaleza impredecible de estos algoritmos.
- Estado aleatorio: algunos algoritmos utilizan la aleatoriedad en sus operaciones. Por ejemplo, al entrenar una red neuronal, los procedimientos como el descenso de gradiente estocástico y el descenso de gradiente en minilotes introducen la aleatoriedad. Por lo tanto, incluso con parámetros del modelo iniciales y conjuntos de datos idénticos, el rendimiento de los modelos puede variar en diferentes ejecuciones.
- Regularización: ciertos algoritmos incluyen un término de penalización que alienta al modelo a mantener pesos más pequeños. Debido a la aleatoriedad involucrada, el modelo podría operar con un conjunto de pesos diferente cada vez.
Sin embargo, es vital tener en cuenta que estas diferencias menores no implican necesariamente que un modelo sea superior o inferior a otro. Incluso con métricas ligeramente variables, la capacidad de los modelos para comprender los datos esencialmente sigue siendo la misma, siempre que las diferencias no sean significativamente grandes. Además, repetir este proceso numerosas veces y tomar un promedio debe producir métricas de rendimiento similares.
Para los proyectos clásicos, hay varios métodos para exportar datos. No todos los tipos de datos exportados son compatibles para importar en proyectos modernos. Para comparar los resultados del modelo en ambos tipos de proyectos, filtre los documentos por Conjunto de entrenamiento y validación y seleccione Elegir resultados de búsqueda para exportar el conjunto de datos. Para obtener más información sobre cada opción, consulte la siguiente tabla.
Tipo de exportación | Datos exportados | Qué sucede con los datos importados |
---|---|---|
Resultados de búsqueda actuales | Exporta el conjunto de datos filtrado actual. Úsalo junto con el filtro Conjunto de entrenamiento y validación. | Los documentos etiquetados como entrenamiento se utilizan para entrenar el modelo. Los documentos etiquetados como validación se utilizan para medir el rendimiento del modelo.
Consejo: para comparar los resultados del modelo entre dos tipos de proyectos, exporte e importe siempre el conjunto de datos como Entrenar y validación.
|
Todos etiquetados | Exporta todos los documentos anotados del conjunto de datos:
|
|
Esquema | Exporta la lista de campos y su configuración respectiva. | Se importa un esquema si no hay ninguno. Si ya hay definido un esquema, la importación falla. |
Todos | Exporta todos los documentos anotados y no anotados. |
|
- Cree un tipo de documento personalizado en la sección Crear.
- Importa el archivo zip que contiene el esquema.
- Las importaciones de esquemas están limitadas a tipos de documentos personalizados sin esquemas preexistentes.
- Si importas un esquema a un tipo de documento que ya contiene un esquema, la importación fallará.