Communications Mining
Más reciente
False
Imagen de fondo del banner
Guía de usuario de Communications Mining
Última actualización 18 de abr. de 2024

Jerarquía de etiquetas y mejores prácticas

Introducción

Antes de comenzar el entrenamiento del modelo, esmuy importante comprender cómo abordar la creación de tu taxonomía, incluida la denominación y la estructuración de tus etiquetas y lo que esas etiquetas deberían capturar realmente. Este artículo cubrirá cada uno de estos temas, comenzando con las etiquetas de nombres.

En el siguiente artículo se explica por qué es tan importante estructurar tu taxonomía correctamente para cumplir tus objetivos empresariales (aquí).

Etiquetas de nombre

Decidir los nombres de las etiquetas puede parecer una tarea desalentadora o que requiere mucho tiempo, pero no tiene por qué serlo.

Para empezar, no importa el nombre de una etiqueta, para nuestros modelos, el nombre de la etiqueta en sí es solo un número. Lo importante es que el nombre de la etiqueta tenga un propósito empresarial y sea una descripción útil del concepto específico que pretende capturar.

Puedes cambiar el nombre de las etiquetas en cualquier momento (consulta cómo), así como añadir niveles de jerarquía cuando sea necesario, así que no pierdas demasiado tiempo al crear tu modelo pensando en el nombre perfecto.

Jerarquías de etiquetas

Parte de nombrar una etiqueta es determinar su jerarquía dentro de tu taxonomía. Las etiquetas pueden tener múltiples niveles de jerarquía, simplemente separados por '> ', para capturar cuando un concepto de etiqueta es un subconjunto de un concepto principal más amplio.

Así que las posibles estructuras de etiquetas pueden verse así (ver también el ejemplo en la imagen a continuación):

  1. [Etiqueta principal]
  2. [Etiqueta principal] > [Etiqueta secundaria]
  3. [Etiqueta principal] > [Etiqueta de rama] > [Etiqueta secundaria]

Puedes añadir más de tres niveles de jerarquía, pero no recomendamos hacerlo a menudo, ya que se vuelve cada vez más complejo de entrenar. Puede ser necesario en determinados casos, pero no debe considerarse una buena práctica.

Conceptualmente, es importante que cada etiqueta anidada bajo otra etiqueta sea un subconjunto de la etiqueta que está encima. Este anidamiento (nivel de jerarquía) se crea utilizando un '>' al escribir el nombre de la etiqueta.

La siguiente imagen ilustra este punto utilizando un diagrama de Venn:

Ilustración de cómo funcionan conceptualmente las jerarquías de etiquetasdocs image

De nuevo, puedes añadir niveles adicionales de jerarquía cambiando el nombre de tus etiquetas más adelante en el proceso de entrenamiento del modelo.

¿Cómo funcionan estas jerarquías en la práctica?

Para entender esto, tomemos 'Etiqueta secundaria X ' de la imagen anterior como ejemplo.

Cuando el modelo predice que la 'Etiqueta secundaria X' se aplica a un mensaje, también predice que la 'Etiqueta de rama C ' y la 'Etiqueta principal 1 ' al mismo tiempo. Esto se debe a que 'Etiqueta secundaria X' es un subconjunto de estos.

Sin embargo, dado que cada nivel de jerarquía añade un nivel cada vez mayor de especificidad, el modelo puede tener más confianza en que se aplica una etiqueta principal o de rama que una etiqueta secundaria más específica. Esto significa que el modelo puede asignar diferentes probabilidades a diferentes predicciones de etiquetas dentro de la misma jerarquía.

Entonces, para un mensaje en particular, el modelo podría ser:

  • 99 % de confianza en que se aplica la 'Etiqueta principal 1'
  • 88 % de confianza en que se aplica la 'Etiqueta de rama C '
  • 75 % de confianza en que se aplica la 'Etiqueta secundaria X '.

Vale la pena señalar que si se predice una etiqueta secundaria para un mensaje, el modelo siempre debe predecir la etiqueta principal (y la etiqueta de la rama cuando corresponda) con al menos la misma confianza que la etiqueta secundaria, si no mayor.

El hecho de que el modelo prediga cada etiqueta de forma independiente es una de las razones clave por las que es importante que las etiquetas principales capturen temas o conceptos genuinos, en lugar de abstractos.

Por ejemplo, una etiqueta principal como 'Proceso ' utilizada para agrupar etiquetas secundarias que se relacionan con procesos específicos, es una mala elección para una etiqueta principal. El 'proceso' en sí mismo es un concepto abstracto y no es algo que el modelo pueda predecir bien por sí solo. En un contexto empresarial, el nombre del proceso específico con el que se relaciona algo (y que puede identificarse a partir del texto de un mensaje) sería una etiqueta principal útil. Las ramas útiles y las etiquetas secundarias podrían ser subprocesos relevantes del proceso principal principal.

¿Cómo elijo qué conceptos deben ser etiquetas principales y cuáles deben ser etiquetas secundarias?

A veces puede que tengas que tomar decisiones difíciles con respecto a la estructura de tu taxonomía. Por ejemplo, podría ser difícil elegir si una etiqueta debe ser una etiqueta principal o una etiqueta secundaria, ya que lógicamente podría ser una categoría principal amplia con sus propias subcategorías, o ser una subcategoría específica de otra categoría principal más amplia.

Por ejemplo, imagina un conjunto de datos compuesto por reseñas de hoteles : podría haber muchas reseñas que analicen los precios de diferentes aspectos de sus vacaciones y del hotel: el restaurante, el bar, las habitaciones, las actividades, etc.

Lógicamente, podría tener 'Precios' como etiqueta principal, y cada aspecto específico de los precios (por ejemplo, restaurante) como etiquetas secundarias.

Sin embargo, también podrías tener etiquetas principales relacionadas con aspectos específicos como "Restaurante" y "Habitaciones" y tener "Precios" como etiqueta secundaria debajo de cada uno.

Entonces, ¿cuál debería elegir?

Es útil tener en cuenta algunas cosas a la hora de decidir:

  • ¿Habrá potencialmente un número significativo de otros conceptos que le gustaría capturar relacionados con este tema más amplio? En caso afirmativo, es probable que sea una etiqueta principal
  • ¿Qué es lo más importante a seguir desde una perspectiva de MI o de informes? Teniendo en cuenta nuestro ejemplo, ¿es más útil poder ver claramente en los análisis de Communications Mining exactamente cuántas personas están hablando de precios y sus subcategorías? ¿O es más útil ver estadísticas generales sobre los comentarios sobre las habitaciones, los restaurantes, las actividades, etc., siendo el precio un aspecto de ellos?

No hay necesariamente una respuesta correcta o incorrecta en estas situaciones: todo se reduce a lo que es más importante para usted y su negocio.

¿Qué puedo capturar realmente con una etiqueta?

Hasta ahora hemos discutido cómo nombrar etiquetas y estructurarlas en jerarquías, pero es posible que aún te preguntes qué debe capturar exactamente una etiqueta.

Es importante recordar que Communications Mining es una herramienta de procesamiento de lenguaje natural . La plataforma lee e interpreta cada mensaje al que se le asigna una etiqueta, y comienza a comprender cómo identificar ese concepto de etiqueta basándose principalmente en el texto que contiene.

A medida que añades ejemplos más variados y coherentes para cada etiqueta, el modelo mejora su comprensión de ese concepto de etiqueta. Sin embargo, añadir más etiquetas es un proceso con rendimientos decrecientes una vez que una etiqueta tiene un buen rendimiento. Aceptar muchas predicciones de alta confianza para una etiqueta no proporciona información nueva al modelo y es una práctica que debe evitarse.

Dado que Communications Mining utiliza el idioma del mensaje para comprender e identificar lo que constituye un concepto de etiqueta, la etiqueta debe ser claramente identificable a partir del texto (es decir, el idioma) de los mensajes a los que se aplica. Para un mensaje de correo electrónico , esto incluye el asunto Y el cuerpo del correo electrónico.

Consulta este ejemplo de correo electrónico a continuación, que tiene la etiqueta "Cancelación > Confirmación > Terminación " aplicada. Esta etiqueta se puede deducir claramente del asunto y del cuerpo del correo electrónico.

Ejemplo de mensaje de correo electrónico que destaca el texto que el modelo tiene en cuenta al hacer predicciones

Si bien el modelo puede tener en cuenta ciertas propiedades de los metadatos al entrenar, en particular cosas como la puntuación NPS (para conjuntos de datos de comentarios de los clientes) que pueden ayudarlo a comprender el sentimiento, el texto del mensaje es, con mucho, el dato más importante considerado por Modelos de Communications Mining.

Nota:

El modelo no tiene en cuenta la dirección específica del remitente o del destinatario de un correo electrónico, por lo que no debe utilizarse para determinar qué etiqueta debe aplicarse a un mensaje de correo electrónico.

Todo esto significa que es importante que cada etiqueta sea específica en lo que intenta capturar, delo contrario el modelo no podrá identificar tendencias y patrones en el lenguaje que le ayuden a predecir un concepto de etiqueta.

¿Por qué debería intentar evitar el uso de etiquetas muy amplias?

Las etiquetas extremadamente amplias como "Consulta general " o "Todo lo demás " pueden ser muy poco útiles si se utilizan para agrupar muchos temas distintos y no hay un patrón claro o elementos comunes entre los ejemplos proporcionados al modelo.

Si el modelo va a predecir bien una etiqueta, necesita múltiples ejemplos similares de las diferentes expresiones de cada concepto capturado por una etiqueta. Por lo tanto, las etiquetas extremadamente amplias requieren un gran número de ejemplos para poder predecirlas correctamente.

Por lo general, es una práctica mucho mejor dividir las etiquetas amplias en etiquetas distintas, incluso si tienes 'Todo lo demás > [Varias etiquetas secundarias] '.

Si el modelo es más capaz de identificar una etiqueta secundaria porque es más específica y claramente identificable (en comparación con una categoría principal muy amplia), puede aumentar significativamente su capacidad de predecir también su etiqueta principal.

Descripciones de etiquetas

Una de las mejores formas de mantener la coherencia de las etiquetas durante todo el proceso de creación del modelo es añadir descripciones de conceptos a cada una de tus etiquetas, lo que se puede hacer en la página Configuración del conjunto de datos en "Etiquetas y entidades". Esto es especialmente útil si varias personas van a entrenar tu modelo, lo que ayuda a garantizar que todos tengan la misma comprensión de una etiqueta determinada y su concepto asociado. También es útil si tienes que entregar el modelo a otra persona.

Ejemplos de descripciones de etiquetas en la página Configuración del conjunto de datos

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.