communications-mining
latest
false
Importante :
Este contenido se ha traducido mediante traducción automática.
UiPath logo, featuring letters U and I in white

Guía de usuario de Communications Mining

Última actualización 10 de feb. de 2025

Jerarquía de etiquetas y mejores prácticas

Introducción

Para cumplir tus objetivos empresariales, es importante entender cómo crear tu taxonomía antes de empezar a entrenar tu modelo. Esto incluye cómo nombrar y estructurar tus etiquetas, y en qué deben consistir. Para obtener más información, consulta Crear tu estructura de taxonomía.

Etiquetas de nombre

La característica de anotación generativa utiliza nombres de etiquetas y descripciones como entrada de entrenamiento. Como resultado, es importante utilizar nombres de etiquetas claros, distintos y descriptivos. Los nombres y descripciones de las etiquetas proporcionan al modelo las mejores entradas de entrenamiento cuando genera predicciones automáticamente.

Puedes cambiar el nombre de las etiquetas y añadir niveles de jerarquía en cualquier momento. Esto te permite refinar las etiquetas y las descripciones de las etiquetas para mejorar las predicciones generadas automáticamente antes de anotar los mensajes con etiquetas.

Jerarquías de etiquetas

Cuando nombras etiquetas, también debes determinar su jerarquía dentro de tu taxonomía. Pueden tener varios niveles de jerarquía, separados por un >, para capturar cuando un concepto de etiqueta es un subconjunto de un concepto principal más amplio.

Ejemplos de estructura de etiquetas:

  • [Etiqueta principal]
  • [Etiqueta principal] > [Etiqueta secundaria]
  • [Etiqueta principal] > [Etiqueta de rama] > [Etiqueta secundaria]

Puedes añadir más de tres niveles de jerarquía, pero no recomendamos que lo hagas a menudo, ya que resulta complejo entrenar el modelo. Para añadir niveles adicionales de jerarquía, puedes cambiar el nombre de tus etiquetas más adelante en el proceso de entrenamiento del modelo.

Conceptualmente, cada etiqueta anidada debajo de otra debe representar un subconjunto de la etiqueta que está encima. Este anidamiento representa el nivel de jerarquía, y lo establece > al especificar el nombre de la etiqueta.
Ilustración de cómo funcionan conceptualmente las jerarquías de etiquetasdocs image

Ejemplos prácticos de jerarquías

Para entender cómo funcionan las jerarquías, considera la Etiqueta secundaria X del diagrama en la sección Jerarquías de etiquetas .

Cuando el modelo predice que la Etiqueta secundaria X se aplica a un mensaje, también predice la Etiqueta de rama C y la Etiqueta principal 1 al mismo tiempo. Esto se debe a que la Etiqueta secundaria X es un subconjunto de las dos.

Cada nivel de jerarquía añade un nivel creciente de especificidad. Sin embargo, el modelo suele tener más confianza al asignar una etiqueta principal o de rama que una etiqueta secundaria más específica. Esto significa que el modelo puede asignar diferentes probabilidades a diferentes predicciones de etiquetas dentro de la misma jerarquía.

Por ejemplo, para un mensaje en particular, el modelo podría ser:

  • 99 % de confianza en que se aplica la etiqueta principal 1.
  • 88 % de confianza en que se aplica la etiqueta de rama C.
  • 75 % de confianza en que se aplica la etiqueta secundaria X.
Note: If the model predicts a child label for a message, it should always predict the parent label - and branch label where applicable - with at least the same confidence as the child label, if not greater.

El modelo predice cada etiqueta de forma independiente, por lo que es importante que las etiquetas principales representen temas o conceptos genuinos en lugar de abstractos.

Por ejemplo, no es efectivo utilizar Proceso como etiqueta principal si agrupa procesos específicos, ya que es demasiado abstracto para que el modelo lo prediga. En cambio, un nombre de proceso específico del texto del mensaje funciona mejor como etiqueta principal, con etiquetas secundarias y de rama que representan subprocesos relevantes.

Decidir entre etiquetas principales y etiquetas secundarias

A veces, es posible que tengas que tomar decisiones difíciles con respecto a la estructura de tu taxonomía. Por ejemplo, podría ser difícil elegir si una etiqueta debe ser una etiqueta principal o una etiqueta secundaria. Esto puede suceder porque la etiqueta podría servir lógicamente como una categoría principal amplia con sus propias subcategorías, o podría ser una subcategoría específica de otra categoría principal más amplia.

Por ejemplo, imagina un conjunto de datos de reseñas de hoteles. Muchas reseñas pueden incluir el precio de varios aspectos de las vacaciones y del hotel, como el restaurante, el bar, las habitaciones, las actividades, etc.

Puedes considerar las siguientes opciones:

  • Podría tener Precios como etiqueta principal, y cada aspecto específico de los precios (es decir, restaurante) como etiquetas secundarias.
  • Sin embargo, también podrías tener etiquetas principales relacionadas con aspectos específicos como Restaurantes y Habitaciones, y tener Precios como etiqueta secundaria debajo de cada uno.

Cuando decidas, asegúrate de tener en cuenta lo siguiente:

  • ¿Habrá un número significativo de otros conceptos relacionados con este tema más amplio que le gustaría incluir? En caso afirmativo, debería ser una etiqueta principal.
  • ¿Qué es lo más importante a seguir desde la perspectiva de la información de gestión o de los informes? Teniendo en cuenta nuestro ejemplo, ¿es útil ver claramente en el análisis de Communications Mining exactamente cuántas personas están hablando de precios y sus subcategorías? ¿O es más útil ver las estadísticas generales sobre los comentarios sobre las habitaciones, los restaurantes, las actividades, etc., siendo el precio solo un aspecto de ellos?

No siempre hay una respuesta clara correcta o incorrecta en estas situaciones; en última instancia, depende de lo que más te importe a ti y a tu negocio.

Capturar datos con etiquetas

Hasta ahora, hemos discutido cómo nombrar etiquetas y estructurarlas en jerarquías. Sin embargo, es posible que aún te preguntes qué debe capturar exactamente una etiqueta.

Es importante recordar que Communications Mining es una herramienta de procesamiento de lenguaje natural (NLP). La plataforma lee e interpreta cada mensaje al que se le asigna una etiqueta, y comienza a comprender cómo identificar ese concepto de etiqueta basándose principalmente en el texto que contiene.

A medida que añades ejemplos más variados y coherentes para cada etiqueta, el modelo mejora su comprensión de ese concepto de etiqueta. Una vez que una etiqueta funciona bien, evita añadir más etiquetas, ya que el proceso produciría rendimientos decrecientes. Además, evita aceptar un gran número de predicciones de alta confianza para una etiqueta, ya que esto no proporciona nueva información al modelo.

Dado que Communications Mining utiliza el lenguaje del mensaje para comprender e identificar lo que constituye los conceptos de etiqueta, la etiqueta debe ser claramente identificable a partir del texto de los mensajes a los que se aplica. Para un mensaje de correo electrónico, esto incluye tanto el asunto como el cuerpo del correo electrónico.

El siguiente ejemplo de correo electrónico tiene la etiqueta Cancellation > Confirmation > Termination aplicada:
Ejemplo de mensaje de correo electrónico que destaca el texto que el modelo tiene en cuenta al hacer predicciones

You can clearly infer the label name from the email subject and body.

Si bien el modelo puede considerar ciertas propiedades de los metadatos, como las puntuaciones de NPS, cuando se entrena en conjuntos de datos de comentarios de los clientes para ayudar a comprender el sentimiento, el texto del mensaje sigue siendo el dato más importante para los modelos de Communication Mining.

Note: The model does not consider the specific sender or recipient address of an email. Therefore, these addresses should not be used at all when you determine which label to apply to an email message.

Esto significa que cada etiqueta debe ser específica en lo que pretende capturar. De lo contrario, el modelo tendrá dificultades para identificar las tendencias y patrones en el lenguaje necesario para predecir el concepto de etiqueta con precisión.

Por qué debería evitar el uso de etiquetas muy amplias

Las etiquetas extremadamente amplias, como Consulta general o Todo lo demás, pueden no ser útiles si las utilizas para agrupar varios temas diferentes y no hay un patrón claro o elementos comunes entre los ejemplos proporcionados al modelo.

Para que el modelo prediga una etiqueta con precisión, requiere múltiples ejemplos similares de las diversas expresiones de cada concepto capturado por la etiqueta. Por lo tanto, las etiquetas extremadamente amplias necesitan un gran número de ejemplos para predecirse de forma efectiva.

Es una mejor práctica dividir las etiquetas amplias en etiquetas distintas, incluso si tienes Todo lo demás > [Varias etiquetas secundarias].

Si el modelo puede identificar mejor una etiqueta secundaria porque es más específica y claramente identificable, en comparación con una categoría principal muy amplia, también puede mejorar significativamente su capacidad para predecir la etiqueta principal.

Descripciones de etiquetas

La característica Anotación generativa utiliza descripciones de etiquetas y nombres de etiquetas para entrenar automáticamente un modelo especializado. Por lo tanto, es importante añadir descripciones descriptivas, claras e informativas a cada etiqueta para que el modelo pueda generar predicciones precisas.

El modelo de IA generativa utiliza descripciones como entradas para preanotar mensajes en segundo plano. Esto reduce el tiempo y el esfuerzo que dedicas a anotar manualmente los ejemplos.

Puedes añadir descripciones de etiquetas una vez que el proceso Crear conjunto de datos las cree, o puedes añadirlas o editarlas desde la página Taxonomía en Configuración del conjunto de datos.

Una forma eficaz de mantener la coherencia de las etiquetas durante todo el proceso de creación de modelos es añadir descripciones a cada etiqueta. Esto es útil si varios usuarios entrenan tu modelo porque garantiza que todos los usuarios tengan la misma comprensión de una etiqueta determinada y su concepto asociado. Otra ventaja de mantener la coherencia de las etiquetas es que hace que el proceso de entrega sea más eficiente si necesitas transferir el modelo a otro usuario.

Ejemplos de descripciones de etiquetas en la página Configuración del conjunto de datos

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2025 UiPath. Todos los derechos reservados.