- Información general
- Proceso de Document Understanding
- Tutoriales de inicio rápido
- Componentes de marco
- Resumen de la clasificación de documentos
- Asistente para Configurar clasificadores de Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Clasificador de CapturaFlexible
- Clasificador de aprendizaje automático
- Actividades relacionadas con la clasificación de documentos
- Consumo de datos
- Paquetes ML
- Procesos
- Administrador de documentos
- Servicios de OCR
- Document Understanding implementado en Automation Suite
- Instalar y utilizar
- Primera experiencia de ejecución
- Implementar UiPathDocumentOCR
- Implementar un paquete ML listo para usar
- Paquetes sin conexión 2022.10.0
- Paquetes sin conexión 2022.10.2
- Paquetes sin conexión 2022.10.4
- Paquetes sin conexión 2022.10.6
- Paquetes sin conexión 2022.10.9
- Paquetes sin conexión 2022.10.10
- Paquetes sin conexión 2022.10.11
- Paquetes sin conexión 2022.10.12
- Paquetes sin conexión 2022.10.13
- Paquetes sin conexión 2022.10.14
- Utiliza Document Manager
- Utilizar el marco
- Document Understanding implementado en AI Center independiente
- Aprendizaje profundo
- Licencia
- Referencias
- Actividades.DeUipath
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guía del usuario de Document Understanding
Diagnóstico de conjuntos de datos
Entrenar a un nuevo modelo desde cero a veces puede ser un trabajo muy exigente.
La función de diagnóstico de conjuntos de datos te ayuda a crear conjuntos de datos eficaces proporcionando información y pistas sobre los pasos necesarios para lograr una buena precisión del modelo entrenado.
Situado en la barra de administración del administrador de documentos, el diagnóstico de conjuntos de datos proporciona una guía visual y escrita durante todo el proceso de entrenamiento de un nuevo modelo.
Hay tres niveles de estado del conjunto de datos expuestos en la barra de administración:
- Rojo: se necesitan más datos de entrenamiento etiquetados.
- Naranja: se recomienda que haya más datos de entrenamiento etiquetados.
- Verde: se consigue el nivel necesario de datos de entrenamiento etiquetados.
Si no se crea ningún campo en la sesión, el nivel de estado del conjunto de datos es gris.
Hay más información sobre cada estado en el menú emergente Diagnóstico del conjunto de datos. Haz clic en el botón Diagnóstico del conjunto de datos para abrirlo.
Proporciona información sobre los documentos usados para el entrenamiento del modelo, el número total de páginas importadas y el número total de páginas etiquetadas.
La separación en la barra de estado de color está determinada por el número recomendado de páginas etiquetadas necesarias para el entrenamiento del modelo y el estado real de tu conjunto de datos, incluidos los datos etiquetados y no etiquetados. Al pasar el ratón por encima de cada color de la barra de estado se obtiene información adicional sobre cada estado.
Las cifras disponibles en la pestaña Conjunto de datos se calculan a partir del número de campos regulares y campos de elementos de la sesión de entrenamiento.
-
Rojo: el conjunto de datos requiere más datos etiquetados para el entrenamiento del modelo.
-
Naranja: para aumentar el nivel de precisión del modelo entrenado, se recomienda usar más datos etiquetados. Puedes elegir seguir con los datos reales, pero el nivel de precisión no es tan alto como se desea.
-
Verde: los datos etiquetados son suficientes para que el conjunto de datos se entrene en consecuencia y reciba información precisa.
Proporciona información sobre cada campo etiquetado, más concretamente el número total de páginas de formación en las que está señalada la etiqueta, el número total de documentos evaluados con el campo etiquetado y su estado para el conjunto de entrenamiento actual.
- Campo: el nombre del campo etiquetado.
- Páginas de entrenamiento: el número de páginas del conjunto de Entrenamiento+Validación en las que el campo está etiquetado.
- Documentos de evaluación: el número de documentos del conjunto de evaluación en los que se ha etiquetado este campo.
- Estado: el estado de cada campo, marcado por tres opciones, Rojo, Naranja y Verde.
Aquí están todas las opciones disponibles para la barra Estado:
-
Rojo: no hay datos suficientes sobre el campo, por lo que se necesitan más etiquetas.
-
Naranja: es necesario etiquetar más páginas para que los resultados sean relevantes.
-
Verde: hay suficientes páginas etiquetadas para que los resultados sean relevantes.
Los botones Actualizar y Cerrar son aplicables a ambas pestañas, lo que significa que si se pulsa el botón Actualizar en la pestaña Conjunto de datos, también se actualiza la pestaña Archivos.
- Actualizar: usa la opción de actualización tras realizar modificaciones en el conjunto de datos, ya sea en el número de páginas totales o en el número de páginas etiquetadas. El menú emergente se actualiza automáticamente cada pocos minutos y tiene lugar en ambas pestañas simultáneamente. Usa esta función cuando se necesite una actualización fuera de la ventana automática.
- Cerrar: una vez reunida toda la información necesaria, cierra el menú pulsando el botón Cerrar. Todo el menú emergente se cierra, independientemente de la pestaña desde la que se haga clic en el botón.