communications-mining

latest

false

Introducción
Control de acceso y administración
Gestionar fuentes y conjuntos de datos
Entrenamiento y mantenimiento de modelos
Extracción generativa
- Información general
- Habilitar la extracción generativa
  - LLM de CommPath frente a LLM de vista previa
- Configurar campos
  - Información general sobre la configuración de tus campos de extracción
- Filtrado de tipo de campo de extracción
- Generar tus extracciones
- Validar y anotar las extracciones generadas
- Mejores prácticas y consideraciones
- Comprender la validación de las extracciones y el rendimiento de las extracciones
- Preguntas frecuentes
Uso de análisis y supervisión
Minería de automatizaciones y comunicaciones
Información de licencia
- Licencia
Preguntas frecuentes y más
- Preguntas frecuentes, consejos y trucos
- Migración de Communications Mining™ a UiPath® IXP

Importante :

Communications Mining forma ahora parte de UiPath IXP. Consulte la Introducción de la Guía del usuario para más información. Este contenido se ha traducido mediante traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Guía de usuario de Communications Mining

Última actualización 25 de mar. de 2025

Comprender la validación de las extracciones y el rendimiento de las extracciones

Nota: La página Validación de extracciones está en vista previa pública.

La página Validación muestra una descripción general del rendimiento de las extracciones y te ayuda a profundizar en el rendimiento individual de cada extracción.

Puedes acceder a la página Validación desde la pestaña Extracciones dentro de Validación, y solo está disponible si tienes campos de extracción definidos en tu conjunto de datos.

Información general sobre el rendimiento

La página predeterminada de la página Validación de extracciones es la página de resumen "Todos", que proporciona las siguientes estadísticas resumidas sobre el rendimiento general de las extracciones en el conjunto de datos:

Puntuación F1 media de las extracciones
Precisión media de las extracciones
Recuperación media de las extracciones

Figura 1. Página Validación de extracciones

Nota: Una puntuación F1 de la media de extracción baja es un signo de un rendimiento de extracción deficiente.

Extracciones individuales

Haz clic en las etiquetas individuales para ver el rendimiento de las extracciones individuales, es decir, la etiqueta y sus campos de extracción asociados.

Para cada extracción, puedes ver los siguientes valores:

Puntuación F1
Precisión
Recordar

Para todos los campos de extracción de la etiqueta, puedes ver los siguientes valores:

Puntuación media F1
Precisión promedio
Recuperación promedio

Para los campos de extracción individuales, puedes ver los siguientes valores:

Puntuación F1
Precisión
Recordar

Figura 2. Validación de extracción individual

Niveles de confianza y LLM

El funcionamiento de los niveles de confianza varía en función del modelo LLM subyacente que utilices.

Si utilizas el CommPath LLM

Si utilizas CommPath LLM, el modelo asigna un conjunto de puntuaciones de confianza para cada predicción (%).

CommPath calcula y devuelve lo siguiente:

Confianza de ocurrencia: la probabilidad de que la ocurrencia detectada corresponda a la etiqueta asignada.
Confianza de extracción: la confianza en la corrección del contenido extraído.

Estos valores de confianza permiten que las automatizaciones posteriores filtren las extracciones con niveles de confianza por debajo de un umbral de etiqueta establecido. Si estableces un umbral adecuado, puedes asegurarte de que solo se utilizan en los flujos de trabajo las predicciones que cumplen un nivel de confianza deseado.

Si utilizas el LLM de vista previa

La Preview LLM para la extracción generativa proporciona un valor de confianza de ocurrencia de etiqueta única para cada extracción, reemplazando tanto la confianza de ocurrencia como la confianza de extracción. Este enfoque difiere de CommPath, que devuelve valores de confianza independientes para cada extracción.

Nota:

Devolver la confianza de la etiqueta ayuda a filtrar las extracciones posteriores si es necesario, lo que permite a los usuarios mejorar la precisión de algunos resultados.

Automatización con extracción generativa

Nota: En caso de que hayas creado previamente automatizaciones con entidades: si planeas crear automatizaciones utilizando Extracción generativa, el punto final de la API y las actividades necesarias para construir esto son diferentes a los que has utilizado anteriormente.

En esta sección se describen los resultados de la actividad Obtener resultados de flujo . Consulta la página del marco del distribuidor de Communications Mining para obtener más detalles.

Para automatizar con la extracción generativa, es importante comprender el contenido de los resultados de tus extracciones.

Confianza de ocurrencia: se refiere a la confianza del modelo en torno al número de instancias que puede ocurrir una solicitud en un mensaje (es decir, cuántas veces puede ocurrir una extracción).

Por ejemplo: para procesar un extracto de cuentas en un sistema descendente, siempre necesitas un ID de cuenta, un número de PO, el importe del pago y la fecha de vencimiento.

Consulta a continuación el ejemplo de confianza de ocurrencia . Muestra cómo el modelo puede identificar con confianza que hay 2 posibles ocurrencias en las que necesitas facilitar este proceso posterior.

Confianza de extracción

La confianza de extracción es la confianza del modelo sobre sus predicciones. Esto incluye qué tan preciso cree que fue al predecir la instancia de una etiqueta y sus campos relacionados. También incluye la confianza del modelo para predecir correctamente si falta un campo.

Considera el mismo ejemplo que antes. Para procesar un extracto de cuentas en un sistema descendente, siempre necesitas un ID de cuenta, un número de orden de compra, el importe del pago y la fecha de vencimiento.

Sin embargo, esta vez, el número de orden de compra no está presente en el mensaje, ni la fecha de vencimiento (solo la fecha de inicio).

La confianza de extracción de este ejemplo es la confianza del modelo sobre la identificación de si los valores para cada campo asociado con la etiqueta están presentes. También incluye la confianza del modelo para predecir correctamente si falta un campo.

En este caso, no tienes todos los campos que necesitas para poder extraer completamente todos los campos necesarios.

Ejemplo de carga útil

Consulta a continuación un ejemplo de salida de lo que devuelve la actividad Obtener respuesta de flujo.

La transmisión se refiere al umbral que estableces en Communications Mining, y si el mensaje alcanza este umbral.

En lugar de filtrar las predicciones en función de los umbrales, esta ruta devuelve qué predicción de confianza cumple los umbrales.

En otras palabras, si se alcanzan los umbrales, se devuelve la transmisión . Si no es así, este valor está vacío.

Nota: Este es un fragmento de muestra para explicar los diferentes componentes, no el resultado completo de una respuesta de Extracción generativa.

Además, cuando hay varias extracciones, está condicionado a las extracciones anteriores.

Para las etiquetas sin campos de extracción, la confianza de ocurrencia es equivalente a la confianza de la etiqueta que puedes ver en la IU.

Nota: Si el modelo no ha podido extraer correctamente todos los campos de un mensaje porque hay demasiados campos, devolverá una extracción en la respuesta de flujo que tiene una confianza de ocurrencia Y una confianza de extracción con valores de 0.

En esta página