Communications Mining
Más reciente
False
Imagen de fondo del banner
Guía de usuario de Communications Mining
Última actualización 18 de abr. de 2024

Validación para entidades

Introducción

La plataforma muestra estadísticas de validación, advertencias y acciones recomendadas para las entidades habilitadas en la página Validación, al igual que para cada etiqueta de tu taxonomía.

Para verlos, ve a la página Validación y selecciona la pestaña 'Entidades ' en la parte superior, como se muestra en la siguiente imagen.

Cómo acceder a la página Validación de entidad

¿Cómo funciona la validación de entidades?

El proceso en el que la plataforma valida su capacidad para predecir correctamente las entidades es muy similar al de las etiquetas.

los mensajes se dividen (80:20) en un conjunto de entrenamiento y un conjunto de prueba (determinado aleatoriamente por el ID de mensaje de cada mensaje) cuando se añaden por primera vez al conjunto de datos. Cualquier entidad que haya sido asignada (predicciones que fueron aceptadas o corregidas) caerá en el conjunto de entrenamiento o en el conjunto de prueba, en función del conjunto al que se haya asignado originalmente el mensaje en el que se encuentran.

Como a veces puede haber un gran número de entidades en un mensaje y no hay garantía de si un mensaje está en el conjunto de entrenamiento o en el conjunto de prueba, puedes ver una gran disparidad entre el número de entidades en cada conjunto.

También puede haber casos en los que todas las entidades asignadas caigan en el conjunto de entrenamiento. Como se requiere al menos un ejemplo en el conjunto de pruebas para calcular las puntuaciones de validación, esta entidad requeriría más ejemplos asignados hasta que algunos estuvieran presentes en el conjunto de pruebas.

¿Cómo se calculan las puntuaciones?

Las estadísticas individuales de precisión y recuperación para cada entidad con suficientes datos de entrenamiento se calculan de forma muy similar a la de las etiquetas:

Precisión = N.º de entidades coincidentes / N.º de entidades previstas

Recuperación = N.º de entidades coincidentes/N.º de entidades reales

Una "entidad coincidente" es aquella en la que la plataforma ha predicho la entidad exactamente (es decir, sin coincidencias parciales)

La puntuación F1 es simplemente la media armónica tanto de la precisión como de la recuperación.

Entidades entrenables

Vale la pena señalar que las estadísticas de precisión y recuperación que se muestran en esta página son más útiles para las entidades que se pueden entrenar en vivo en la plataforma (que se muestran en la segunda columna anterior), ya que todas las entidades revisadas para estos tipos de entidades afectarán directamente a la plataforma. capacidad de predecir esas entidades.

Por lo tanto, la aceptación de las entidades correctas y la corrección o el rechazo de las entidades incorrectas debe hacerse siempre que sea posible.

Entidades preentrenadas

En el caso de las entidades preentrenadas, para que las estadísticas de validación proporcionen un reflejo preciso del rendimiento, los usuarios deberían asegurarse de que aceptan una cantidad considerable de predicciones correctas, además de corregir las incorrectas.

Si solo corrigieran las predicciones erróneas, los conjuntos de entrenamiento y prueba se llenarían artificialmente solo de las instancias en las que la plataforma ha tenido problemas para predecir una entidad, y no de aquellas en las que es más capaz de predecirlas. Como la corrección de predicciones erróneas para estas entidades no conduce a una actualización en tiempo real de estas entidades (se actualizan periódicamente sin conexión), es posible que las estadísticas de validación no cambien durante algún tiempo y que sean artificialmente bajas.

Aceptar muchas de las predicciones correctas puede no ser siempre conveniente, ya que estas entidades se predicen correctamente la mayoría de las veces. Pero si la mayoría de las predicciones son correctas para estas entidades, es probable que no tengas que preocuparte por su precisión y las estadísticas de recuperación en la página Validación.

¿Qué significan las estadísticas de resumen?

Las estadísticas de resumen (precisión media, recuperación media y puntuación F1 media) son simplemente medias de cada una de las puntuaciones de las entidades individuales.

Al igual que con las etiquetas, solo las entidades que tienen suficientes datos de entrenamiento se incluyen en las puntuaciones medias. Aquellos que no tienen suficientes datos de entrenamiento para ser incluidos tienen un icono de advertencia junto a su nombre.

Nota: Las estadísticas de resumen incorporan todas las entidades con suficientes datos de entrenamiento, tanto las que son entrenables en vivo como las que están preentrenadas. Las predicciones para las entidades que están preentrenadas a menudo solo se corrigen cuando son incorrectas, y no siempre se aceptan cuando son correctas. Esto significa que sus estadísticas de precisión y recuperación a menudo pueden ser artificialmente bajas, lo que reduciría las puntuaciones medias.

Métricas

La página Validación de entidades muestra las estadísticas de rendimiento medio de las entidades, así como un gráfico que muestra la puntuación F1 media de cada entidad frente al tamaño de su conjunto de entrenamiento. El gráfico también marca las entidades que tienen advertencias de rendimiento de color ámbar o rojo.

Página de validación de entidades

Las estadísticas de rendimiento de la entidad que se muestran son:

  • Puntuación F1 media: media de las puntuaciones F1 en todas las entidades con datos suficientes para estimar con precisión el rendimiento. Esta puntuación tiene en cuenta la memoria y la precisión por igual. Un modelo con una puntuación F1 alta produce menos falsos positivos y negativos.
  • Precisión media: media de las puntuaciones de precisión en todas las entidades con datos suficientes para estimar con precisión el rendimiento. Un modelo con alta precisión produce menos falsos positivos.
  • Promedio de recuperación: promedio de las puntuaciones de recuperación en todas las entidades con datos suficientes para estimar con precisión el rendimiento. Un modelo con alta recuperación produce menos falsos negativos.

Comprender el rendimiento de la entidad

El gráfico de rendimiento de la entidad que se muestra en la pestaña Métricas de la página Validación (ver más arriba) ofrece una indicación visual inmediata del rendimiento de cada entidad individual.

Para que una entidad aparezca en este gráfico, debe tener al menos 20 ejemplos anclados presentes en el conjunto de entrenamiento utilizado por la plataforma durante la validación. Para garantizar que esto suceda, los usuarios deben asegurarse de proporcionar un mínimo de 25 (a menudo más) ejemplos anclados por entidad de 25 mensajes diferentes.

Cada entidad se trazará como uno de los tres colores, en función de la comprensión del modelo de cómo se está desempeñando la entidad. A continuación, explicamos lo que significan:

Indicadores de rendimiento de la entidad

Indicadores de rendimiento de la entidad:

  • Las entidades representadas en azul en el gráfico tienen un nivel de rendimiento satisfactorio . Esto se basa en numerosos factores que contribuyen, incluido el número y la variedad de ejemplos y la precisión media para esa entidad
  • Las entidades representadas en ámbar tienen un rendimiento ligeramente inferior al satisfactorio . Pueden tener una precisión media relativamente baja o no tener suficientes ejemplos de entrenamiento. Estas entidades requieren un poco de entrenamiento/corrección para mejorar su rendimiento
  • Las entidades trazadas en rojo son entidades de bajo rendimiento. Pueden tener una precisión media muy baja o no tener suficientes ejemplos de entrenamiento. Estas entidades pueden requerir mucho más entrenamiento/corrección para llevar su rendimiento a un nivel satisfactorio
Nota: Verás que los indicadores de rendimiento ámbar y rojo aparecen en las barras de filtro de entidades en Explorar, Informes y Validación. Esto ayuda a notificarte rápidamente qué entidades necesitan ayuda, y también en qué predicciones de las entidades no se debe confiar (sin algún trabajo para mejorarlas) al utilizar las características de análisis.

Rendimiento de la entidad individual

Los usuarios pueden seleccionar entidades individuales desde la barra de filtro de entidades (o haciendo clic en el gráfico de la entidad en el gráfico "Todas las entidades") para ver las estadísticas de rendimiento de la entidad.

La vista de entidad específica también mostrará cualquier advertencia de rendimiento y sugerencias de mejores acciones recomendadas para ayudar a mejorar su rendimiento.

La vista de la entidad mostrará la puntuación F1 media de la entidad, así como su precisión y recuperación.
Ejemplo de tarjeta de entidad con acciones recomendadasdocs image

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.