document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white
Document Understanding Modern Projects User Guide
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 11 de nov. de 2024

Migrar proyectos clásicos

Use the instructions from this page to migrate a a project based on AI Center. There are two main steps in migrating a project:
  1. Export the dataset from the project based on AI Center.
  2. Importar el conjunto de datos en el proyecto moderno.

Limitaciones actuales

  • Actualmente, no se admite la importación de conjuntos de datos mayores de 3000 páginas. Solo las 3000 páginas iniciales se importarán correctamente, cualquier página adicional no lo hará. Por ejemplo, si tu conjunto de datos consta de 2999 páginas e intentas importar un documento de 4 páginas, el proceso no se realizará correctamente.
  • Los nombres de los lotes y los resultados de los lotes correspondientes no están disponibles actualmente. Si tus datos están organizados en lotes, esta información aún no se muestra, pero se guarda.

Exportar un conjunto de datos de un proyecto basado en AI Center

  1. Abre AI Center y navega a la página Etiquetado de datos.
  2. Selecciona la sesión de etiquetado de datos que deseas migrar.


  3. Una vez abierto Document Manager, en la lista desplegable Filtrar documentos, selecciona Conjunto de entrenamiento y validación.
    Figure 1. Training and validation set

  4. Selecciona Exportar.
  5. Deja los resultados de la búsqueda actual seleccionados e introduce un nombre para tu trabajo de exportación.
  6. Selecciona Descargar.
    Figure 2. Download export

Importar un conjunto de datos

  1. Busque y abra el proyecto en el que desea importar datos.
  2. Selecciona Añadir tipo de documento y crea un nuevo tipo de documento personalizado.
    Figure 3. Add document type

  3. En el nuevo tipo de documento personalizado, selecciona Cargar y elige el archivo zip del proyecto clásico que exportaste. Espera a que finalice la carga.
    Figure 4. Upload processing

Una vez finalizada la carga, los documentos están disponibles para el entrenamiento.

Entrenamiento del modelo

Una vez que se importa el conjunto de datos, se inicia el entrenamiento del modelo. Una vez que se complete el entrenamiento, se muestra la puntuación del modelo. Para comprobar las puntuaciones del modelo detallado, selecciona la puntuación y luego Puntuaciones del modelo detalladas.



Esta acción te lleva a la página Medir donde puedes acceder a métricas del modelo detalladas.

Cuando se utiliza el mismo conjunto de datos para entrenar un ML dos veces, puedes observar métricas del modelo ligeramente diferentes. Esto puede ocurrir debido a algunas razones:

  • Inicialización: el aprendizaje automático utiliza métodos de optimización que necesitan conjeturas iniciales para desencadenar los algoritmos de optimización. Diferentes conjeturas iniciales durante cada entrenamiento podrían conducir a varios resultados debido a la naturaleza impredecible de estos algoritmos.
  • Estado aleatorio: algunos algoritmos utilizan la aleatoriedad en sus operaciones. Por ejemplo, al entrenar una red neuronal, los procedimientos como el descenso de gradiente estocástico y el descenso de gradiente en minilotes introducen la aleatoriedad. Por lo tanto, incluso con parámetros del modelo iniciales y conjuntos de datos idénticos, el rendimiento de los modelos puede variar en diferentes ejecuciones.
  • Regularización: ciertos algoritmos incluyen un término de penalización que alienta al modelo a mantener pesos más pequeños. Debido a la aleatoriedad involucrada, el modelo podría operar con un conjunto de pesos diferente cada vez.

Sin embargo, es vital tener en cuenta que estas diferencias menores no implican necesariamente que un modelo sea superior o inferior a otro. Incluso con métricas ligeramente variables, la capacidad de los modelos para comprender los datos esencialmente sigue siendo la misma, siempre que las diferencias no sean significativamente grandes. Además, repetir este proceso numerosas veces y tomar un promedio debe producir métricas de rendimiento similares.

Cambiar el modelo base en Gestor de tipos de documentos

Si hay una diferencia significativa entre los resultados del modelo de tu proyecto clásico y el moderno, podría estar causado por un modelo base diferente. Para cambiar el modelo base, sigue los siguientes pasos.
  1. Selecciona el menú de tres puntos de tu tipo de documento personalizado y elige gestor de tipos de documentos.


  2. Navega a la pestaña Configuración.
  3. Selecciona el modelo deseado de la lista desplegable Modelo base.


  4. Después de realizar tu selección, selecciona Guardar. Para salir, selecciona Atrás.

Exportar tipos

Para los proyectos clásicos, hay varios métodos para exportar datos. No todos los tipos de datos exportados son compatibles para importar en proyectos modernos. Para comparar los resultados del modelo en ambos tipos de proyectos, filtre los documentos por Conjunto de entrenamiento y validación y seleccione Elegir resultados de búsqueda para exportar el conjunto de datos. Para obtener más información sobre cada opción, consulte la siguiente tabla.

Tabla 1. Tipos de exportación
Tipo de exportaciónDatos exportadosQué sucede con los datos importados
Resultados de búsqueda actualesExporta el conjunto de datos filtrado actual. Úsalo junto con el filtro Conjunto de entrenamiento y validación. Los documentos etiquetados como entrenamiento se utilizan para entrenar el modelo. Los documentos etiquetados como validación se utilizan para medir el rendimiento del modelo.
Consejo: para comparar los resultados del modelo entre dos tipos de proyectos, exporte e importe siempre el conjunto de datos como Entrenar y validación.
Todos etiquetadosExporta todos los documentos anotados del conjunto de datos:
  • Entrenar conjunto
  • Conjunto de validación
  • Conjunto de evaluación
  • Los documentos etiquetados como entrenamiento se utilizan para entrenar el modelo.
  • Los documentos etiquetados como validación se utilizan para medir el rendimiento del modelo.
  • Se ignoran los documentos etiquetados como evaluación.
EsquemaExporta la lista de campos y su configuración respectiva.Se importa un esquema si no hay ninguno. Si ya hay definido un esquema, la importación falla.
TodosExporta todos los documentos anotados y no anotados.
  • Los documentos etiquetados como entrenamiento se utilizan para entrenar el modelo.
  • Los documentos etiquetados como validación se utilizan para medir el rendimiento del modelo.
  • Se ignoran los documentos etiquetados como evaluación.
  • Los documentos no anotados se anotan previamente y se tratan como no confirmados.

Importar esquemas

Puedes importar esquemas junto con conjuntos de datos en proyectos modernos. Siga estos pasos para importar un esquema:
  1. Cree un tipo de documento personalizado en la sección Crear.
  2. Importa el archivo zip que contiene el esquema.
Nota:
  • Las importaciones de esquemas están limitadas a tipos de documentos personalizados sin esquemas preexistentes.
  • Si importas un esquema a un tipo de documento que ya contiene un esquema, la importación fallará.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.