Guia do usuário do Communications Mining

Última atualização 4 de mar de 2025

Visão geral

Principais etapas

A página Explorar tem vários modos de treinamento, e esta fase se concentra principalmente em três deles:

'Aleatório' - mostra uma seleção aleatória de mensagens para os usuários anotarem. É vital concluir uma parte significativa do treinamento na atividade Aleatório, para criar um conjunto de exemplos de treinamento que seja representativo do conjunto de dados mais amplo.

"Ensinar" (para mensagens não revisadas) - assim que a plataforma estiver fazendo previsões razoável para um rótulo, você poderá melhorar sua capacidade de prever o rótulo em relação aos exemplos mais variados. Basta revisar as mensagens no modo padrão Ensinar (que é para mensagens não revisadas mensagens). Isso mostrará mensagens em que a plataforma não tem certeza se o rótulo selecionado se aplica ou não.

“Baixa confiança” - mostra mensagens que não são bem cobertas pelas previsões informativas do rótulo. Essas mensagens não terão previsões ou previsões de confiança muito baixa para rótulos que a plataforma entende como informativos.

Esta seção da Base de Conhecimento também abordará o treinamento usando a PesquisanoExplorar , que é muito semelhante ao treinamento usando a Pesquisa no Descubra.

Há outro modo de treinamento em Explorar — Ensinar (para mensagens revisadas) — que está explicado na seção “Refinando modelos e usando a validação” da Base de Conhecimento aqui.

Layout

Layout explicado:

A	Ajuste o intervalo de datas ou período das mensagens exibidas
B	Adicione vários outros filtros com base nos metadados das mensagens, por exemplo pontuação ou remetente
C	Adicione um filtro de campo geral
D	Alterna de todas as mensagens para mensagens revisadas ou não revisadas, também ajusta as contagens de rótulos fixados versus previstos
E	Adicione um filtro de rótulo
F	Pesquise rótulos específicos em sua taxonomia
G	Adicionar rótulos adicionais
H	Expandir metadados da mensagem
I	Atualizar a consulta atual
J	Alterne entre diferentes modos de treinamento, como recente, aleatório, instruído e baixa confiança, e selecione o rótulo para classificar
K	Pesquise o conjunto de dados em busca de mensagens que contenham palavras ou frases específicas
L	Faça o download de todas as mensagens nesta página ou exporte o conjunto de dados com os filtros aplicados como um arquivo CSV

Quanto treinamento você deve fazer para cada rótulo?

O número de exemplos necessários para prever com precisão cada rótulo pode variar muito, dependendo da extensão ou especificidade de um conceito de rótulo.

Pode ser que um rótulo esteja normalmente associado a palavras, frases ou intenções muito específicas e facilmente identificáveis, e a plataforma seja capaz de prever isso de forma consistente com relação a poucos exemplos de treinamento. Também pode ser que um rótulo capture um tópico amplo com muitas variações diferentes de idioma que seriam associados a ele, caso em que pode exigir muito mais exemplos de treinamento para permitir que a plataforma identifique de forma consistente instâncias em que o rótulo deve ser aplicado.

Muitas vezes, a plataforma pode começar a fazer previsões para um rótulo com apenas cinco exemplos. Porém, para estimar com precisão o desempenho de um rótulo (o quão bem a plataforma é capaz de prevê-lo), cada rótulo exija pelo menos 25 exemplos.

Ao anotar no Explorar, os pequenos seletores vermelhas (exemplos mostrados abaixo) ao lado de cada rótulo indicam se mais exemplos são necessários para estimar com precisão o desempenho do rótulo. O mostrador começa a desaparecer à medida que você fornece mais exemplos de treinamento e desaparecerá completamente quando você atingir 25.

Rótulos de seletores de treinamento

Isso não significa que, com 25 exemplos, a plataforma será capaz de prever com precisão todos os rótulos, mas pelo menos poderá validar o quão bem é capaz de prever cada rótulo e alertar você se for necessário um treinamento adicional.

Portanto, durante a fase Explorar, você deve fornecer pelo menos 25 exemplos para todos os rótulos nos quais está interessado, usando uma combinação das etapas mencionadas acima (principalmente Aleatório e Teach + Não revisado).

Durante a fase de Refinar, pode ficar claro que mais treinamento é necessário para determinados rótulos melhorarem seu desempenho, e isso é abordado em detalhes aqui.

Avisos de desempenho do rótulo

No Explorar, quando você atingir 25 exemplos fixados para um rótulo, você poderá ver um dos indicadores de desempenho do rótulo abaixo no lugar do mostrador de treinamento:

O círculo cinza é um indicador de que a plataforma está calculando o desempenho desse rótulo. Ele será atualizado para desaparecer ou se tornar um círculo amarelo ou vermelho após o cálculo
Âncora é um indicador de que o rótulo tem um desempenho um pouco menos satisfatório e pode ser melhorado
A cor vermelha indica que o rótulo está apresentando um desempenho ruim e precisa de treinamento adicional/ações corretivas para melhorá-lo
Se não houver nenhum círculo, isso significa que o rótulo está funcionando em um nível satisfatório (mas ainda pode precisar de melhorias, dependendo do caso de uso e dos níveis de precisão desejados)
Para entender mais sobre o desempenho do rótulo e como melhorá-lo, comece por aqui

Indicadores de desempenho do rótulo

Contagens de rótulos previstos x contagens de rótulos fixados

Se você clicar no ícone de verificação (conforme mostrado abaixo) na parte superior da barra do filtro de rótulos para filtrar para mensagens revisadas, você verá o número de mensagens revisadas que têm esse rótulo aplicado.

Se você clicar no ícone do computador para filtrar para mensagens não revisadas, você será mostrado para o número total de previsões para esse rótulo (que inclui também o número de exemplos revisados).

No Explorar, quando nem revisadas nem não revisadas estiverem selecionadas, a plataforma mostra o número total de mensagens fixadas para um rótulo como padrão. Em Relatórios, o padrão é mostrar o total previsto.

Observação: o número previsto é uma agregação de todas as probabilidades que a plataforma calcula para esse rótulo. Por exemplo, duas mensagens com um nível de confiança de 50% seriam contadas como um rótulo previsto.

Dicas úteis para usar o Explorar

O modelo pode começar a fazer previsões com apenas algumas mensagens anotadas, embora, para que ele faça previsões confiáveis, você deva anotar no mínimo 25 mensagens por rótulo. Alguns exigirão mais do que isso, dependendo da complexidade dos dados, do rótulo e da consistência com os rótulos aplicados
Em Explorar, você também deve tentar encontrar mensagens nas quais o modelo tenha previsto um rótulo incorretamente. Você deve remover rótulos incorretos e aplicar os corretos. Esse processo ajuda a evitar que o modelo faça uma previsão incorreta semelhante no futuro

Importante: durante esta fase, você aplicará muitos rótulos, portanto, lembre-se de aderir às principais práticas recomendadas de anotação de adicionar todos os rótulos aplicáveis, aplicá-los de forma consistente e anotar o que vê à sua frente

Nesta página