Guia do usuário do Communications Mining

Última atualização 10 de nov de 2025

Hierarquia de rótulos e práticas recomendadas

Introdução

Para atender a seus objetivos de negócios, é importante entender como criar sua taxonomia antes de começar a treinar seu modelo. Isso inclui como nomear e estruturar seus rótulos e como eles devem consistir. Para obter mais detalhes, consulte Construir sua estrutura de taxonomia.

Nomenclatura dos rótulos

A funcionalidade de anotação generativa usa nomes e descrições de rótulos como entrada de treinamento. Como resultado, é importante usar nomes de rótulos claros, distintos e descritivos. Os nomes e as descrições de rótulos fornecem ao modelo as melhores entradas de treinamento quando ele gera automaticamente previsões.

Você pode renomear rótulos e adicionar níveis de hierarquia a qualquer momento. Isso permite que você refine rótulos e descrições de rótulos para melhorar as previsões geradas automaticamente antes de anotar mensagens com rótulos.

Hierarquias de rótulo

Ao nomear rótulos, você também deve determinar sua hierarquia dentro de sua taxonomia. Eles podem ter vários níveis de hierarquia, separados por um sinal de maior que >, para capturar quando um conceito de rótulo for um subconjunto de um conceito pai mais amplo.

Exemplos de estrutura de rótulo:

[Rótulo Principal]
[Rótulo Pai] > [Rótulo Filho]
[Rótulo Pai] > [Rótulo da Ramificação] > [Rótulo Filho]

Você pode adicionar mais de três níveis de hierarquia, mas não recomendamos que você faça isso com frequência, pois fica complexo treinar o modelo. Para adicionar mais níveis de hierarquia, você pode renomear seus rótulos mais tarde no processo de treinamento do modelo.

Conceitualmente, cada rótulo aninhado sob outro deve representar um subconjunto do rótulo que o precede. Esse aninhamento representa o nível de hierarquia e é estabelecido pelo sinal de maior que > quando você especifica o nome do rótulo.

Exemplos práticos de hierarquias

Para entender como as hierarquias funcionam, considere o Rótulo filho X do diagrama na seção Hierarquias de rótulos .

Quando o modelo prevê que o rótulo filho X se aplica a uma mensagem, ele também prevê o rótulo de ramificação C e o rótulo pai 1 ao mesmo tempo. Isso ocorre porque o rótulo filho X é um subconjunto dos dois.

Cada nível de hierarquia adiciona um nível crescente de especificidade. No entanto, o modelo costuma ser mais confiante ao atribuir um rótulo pai ou de ramificação do que um rótulo filho mais específico. Isso significa que o modelo pode atribuir diferentes probabilidades a diferentes previsões de rótulos dentro da mesma hierarquia.

Para exemplificar, para uma mensagem específica, o modelo poderia ser:

99% de confiança que o Rótulo Pai 1 se aplica.
88% de confiança que o rótulo da ramificação C se aplica.
75% de confiança que o rótulo filho X se aplica.

Observação: se o modelo prever um rótulo filho para uma mensagem, ele deve sempre prever o rótulo pai — e o rótulo de ramificação, quando aplicável — com pelo menos a mesma confiança que o rótulo filho, se não for maior.

O modelo prevê cada rótulo de forma independente, por isso é importante que os rótulos pais representem tópicos ou conceitos verdadeiros, em vez de resumos.

Por exemplo, é ineficaz usar Processo como rótulo pai se ele agrupar processos específicos, pois é muito resumo para o modelo prever. Em vez disso, um nome de processo específico do texto da mensagem funciona melhor como um rótulo pai, com ramificações e rótulos filhos que representam subprocessos relevantes.

Decisão entre rótulos pai e rótulos filho

Às vezes, você pode precisar fazer escolhas difíceis em relação à estrutura de sua taxonomia. Por exemplo, pode ser difícil escolher se um rótulo deve ser pai ou filho. Isso pode acontecer porque o rótulo pode servir logicamente como uma categoria pai ampla com suas próprias subcategorias ou pode ser uma subcategoria específica de outra categoria pai mais ampla.

Por exemplo, pense em um conjunto de dados de avaliações de hoteis. Muitas avaliações podem incluir o preço de vários aspectos das férias e do host, como o restaurante, o barra, os salas, as atividades, entre outros.

Você pode considerar as seguintes opções:

Você pode ter o Preço como um rótulo pai e cada aspecto específico do preço (ou seja, restaurante) como rótulos filhos.
No entanto, você também pode ter rótulos pai que se relacionam com aspectos específicos, comoRestaurantes e Salões, e ter o Preço como um rótulo filho em cada um.

Quando você decidir, certifique-se de considerar o seguinte:

Há um número significativo de outros conceitos relacionados a este tópico mais amplo que você gostaria de incluir? Se sim, então ele deve ser um rótulo pai.
Qual é a coisa mais importante a rastrear de uma perspectiva de gerenciamento de informações ou relatórios? Considerando nosso exemplo, não é útil visualizar claramente na análise do Communications Mining™ exatamente quantas pessoas estão falando sobre preços e suas subcategorias ou é mais útil visualizar estatísticas gerais sobre o feedback sobre salas, restaurantes, atividades e e assim por diante, com os preços sendo apenas um aspecto deles?

Nem sempre há uma resposta certa ou errada nessas situações, e isso depende do que é mais importante para você e para sua empresa.

Captura de dados com rótulos

Até agora, discutimos como nomear rótulos e estruturá-los em hierarquias. No entanto, você ainda pode estar se perguntando o que exatamente um rótulo deve capturar.

É importante lembrar que o Communications Mining™ é uma ferramenta de processamento de linguagem natural (NLP). A plataforma lê e interpreta cada mensagem que recebe um rótulo e começa a compreender como identificar esse conceito de rótulo com base predominantemente no texto dentro dele.

À medida que você adiciona exemplos mais variados e consistentes para cada rótulo, o modelo melhora sua compreensão desse conceito de rótulo. Depois que um rótulo funcionar bem, evite adicionar mais rótulos, pois o processo renderia retornos decrescentes. Além disso, evite aceitar um grande número de previsões de alta confiança para um rótulo, pois isso não fornece novas informações ao modelo.

Como o Communications Mining usa a linguagem da mensagem para entender e identificar o que constitui os conceitos dos rótulos, o rótulo deve ser claramente identificável a partir do texto das mensagens às quais é aplicado. Para uma mensagem de e-mail, isso inclui o assunto e o corpo do e-mail.

O seguinte exemplo de e-mail tem o rótulo Cancellation > Confirmation > Termination aplicado:

Você pode inferir claramente o nome do rótulo a partir do assunto e do corpo do email.

Embora o modelo possa considerar certas propriedades de metadados, como pontuações do NPS, quando treina com base em conjuntos de dados de feedback dos clientes para ajudar a entender o sentimento, o texto da mensagem continua sendo o dado mais importante para os modelos do Communications Mining.

Observação: o modelo não considera o endereço específico do remetente ou destinatário de um e-mail. Portanto, esses endereços não devem ser usados de forma alguma quando você determina qual rótulo a ser aplicado a uma mensagem de e-mail.

Isso significa que cada rótulo deve ser específico no que visa capturar. Caso contrário, o modelo terá dificuldade em identificar as tendências e padrões na linguagem necessários para prever o conceito do rótulo com precisão.

Por que você deve evitar usar rótulos muito amplos

Rótulos extremamente amplos, como Consulta geral ou Tudo o mais, podem não ajudar se você os usar para agrupar vários tópicos diferentes e não houver um padrão claro ou algo em comum entre os exemplos fornecidos ao modelo.

Para que o modelo preveja um rótulo com precisão, são necessários vários exemplos semelhantes das várias expressões de cada conceito capturado pelo rótulo. Portanto, rótulos extremamente amplos precisam de um número muito grande de exemplos para serem previstos com eficácia.

É uma prática recomendada dividir rótulos amplos em rótulos distintos, mesmo que você tenha Tudo o mais > [Vários rótulos secundários].

Se o modelo pode identificar melhor um rótulo filho por ser mais específico e claramente identificável, em comparação com uma categoria pai muito ampla, ele também pode aprimorar significativamente sua capacidade de prever o rótulo pai.

Descrições de rótulos

A funcionalidade Anotação generativa usa descrições e nomes de rótulos para treinar automaticamente um modelo especializado. Portanto, é importante adicionar descrições descritivas, claras e informativas a cada rótulo para que o modelo possa gerar previsões precisas.

O modelo de IA Generativa usa descrições como entradas para pré-anotar mensagens em segundo plano. Isso reduz o tempo e o esforço que você gasta para anotar manualmente exemplos.

Você pode adicionar descrições de rótulos após o processo Criar conjunto de dados criá-las ou pode adicioná-las ou editá-las na página Taxonomia nas Configurações do conjunto de dados.

Uma maneira eficaz de manter a consistência dos rótulos em todo o processo de construção de modelos é adicionar descrições a cada rótulo. Isso é útil se vários usuários treinarem seu modelo, porque garante que todos os usuários tenham a mesma compreensão de um determinado rótulo e seu conceito associado. Outro benefício de manter a consistência do rótulo é que isso torna o processo de transferência mais eficiente se você precisar transferir o modelo para outro usuário.