- Introdução
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais (anteriormente entidades)
- Rótulos (previsões, níveis de confiança, hierarquia etc.)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens revisadas e não revisadas
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Crie uma origem de dados na GUI
- Carregar um arquivo CSV para uma origem
- Criar um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Corrigir configurações de conjunto de dados
- Excluir mensagens por meio da interface do usuário
- Excluir um conjunto de dados
- Excluir uma origem
- Exportar um conjunto de dados
- Usando integrações do Exchange
- Preparando dados para carregamento de .CSV
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulo e práticas recomendadas
- Definição dos seus objetivos de taxonomia
- Casos de uso de análise versus automação
- Transformando seus objetivos em rótulos
- Criação da sua estrutura taxonômica
- Práticas recomendadas de design de taxonomia
- Importando sua taxonomia
- Visão geral do processo de treinamento do modelo
- Anotação Generativa (Novo)
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Treinamento
- Visão geral
- Treinamento usando clusters
- Treinamento usando Pesquisar (Descoberta)
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como funciona a Validação?
- Compreender e melhorar o desempenho do modelo
- Por que um rótulo pode ter uma precisão média baixa?
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining
- Informações de licenciamento
- Perguntas frequentes e mais
Treinamento usando clusters
Permissões de usuário necessárias: "Exibir Origens" E "Revisar e anotar".
Assim que seus dados estiverem na plataforma, ela agrupará e exibirá 30 clusters de comunicações (mensagens) que ela acredita que compartilham conceitos ou intenções semelhantes. O objetivo desta parte do processo de treinamento é passar por cada um desses clusters e anotar os dados apresentados em cada um deles.
Esse processo torna o treinamento do modelo mais fácil e rápido, para começar, pois você pode adicionar rótulos a várias mensagens semelhantes de uma só vez, além de adicionar/remover rótulos a mensagens individuais, conforme a necessidade.
Dicas úteis para anotar clusters:
- Não perca muito tempo pensando no nome do rótulo. Você pode renomear um rótulo a qualquer momento durante o processo de treinamento.
- Seja o mais específico possível ao nomear um rótulo e mantenha a taxonomia o mais simples possível inicialmente (não adicione muitos rótulos filhos). É melhor ser o mais específico possível com seu nome de rótulo desde o início, pois você sempre pode alterar e reestruturar a hierarquia posteriormente. Nesta etapa, você deve adicionar o maior número possível de rótulos a uma mensagem, pois sempre é possível voltar e excluí-los depois, o que é mais rápido e fácil do que expandir um rótulo existente.
- Lembre-se de que geralmente é mais fácil criar uma taxonomia mais específica e mais refinada na primeira instância. Se for muito detalhado, será fácil editar e podar sua taxonomia posteriormente. Isso significa adicionar mais, e não menos rótulos e sub-rótulos
- É bom começar com rótulos em uma hierarquia horizontal (não adicionando muitos sub-rótulos) – você sempre pode reestruturar a taxonomia para uma estrutura mais hierárquica posteriormente
- Cada mensagem pode ter vários rótulos atribuídos a ela – certifique-se de aplicar todos os rótulos relevantes, caso contrário você estará ensinando o modelo a não associá-lo ao rótulo que você omitiu
- É melhor reservar um tempo para anotar com cuidado agora, para que a máquina possa prever rótulos com rapidez e precisão no futuro
- Nem todos os clusters terão intenções claramente semelhantes e não há problema em seguir em frente se forem todos diferentes
Quando você cria um novo conjunto de dados pela primeira vez, pode descobrir que Discover está vazio, conforme mostrado abaixo. Não se preocupe, isso ocorre simplesmente porque os algoritmos da plataforma estão ocupados trabalhando em segundo plano para agrupar suas mensagens em clusters. Dependendo do número de mensagens na origem de dados, isso pode levar algumas horas para ser processado.
O layout do Discover e um cluster de exemplo são mostrados abaixo. Neste exemplo, a plataforma detectou que essas mensagens compartilham o tema comum do conforto das camadas de hotél:
Layout explicado:
A
- Clique no botão para alternar entre os modos "Cluster" e "Pesquisa"B
- Menu suspenso que permite alternar entre diferentes clustersC
— botão para aplicar um rótulo a todas as mensagens mostradas na páginaD
– Uma das seis mensagens exibidas do cluster n.º 7 (cada cluster contém 12 mensagens)E
- Botão para aplicar um rótulo a uma mensagem individualF
- Menu suspenso para ajustar a quantidade de mensagens exibidas na página (entre 6 e 12)G
— Botões para ajustar e reverter a seleção de mensagens na páginaH
- Botão para desmarcar uma mensagem para excluí-la de rótulos adicionados em massa
Conforme destacado na imagem abaixo, o Discover destaca as partes de uma mensagem que mais contribuem para que essa mensagem seja incluída no cluster, ajudando você a identificar os temas comuns mais rapidamente:
Descubra como destacar temas comuns
- As linhas mais escuras indicam partes mais importantesdo período (isso é explicado quando você passa o mouse sobre ele)
- As linhas coloridos mais claros indicam uma contribuição média e ligeiramente mais fraca para o cluster
1. Revise cada mensagem no cluster
2. Se você acha que existe um rótulo que se aplica a todas as mensagens na página, selecione 'Adicionar rótulo'
3.Digite o nome do rótulo e pressione Enter ou clique no botão fixar que aparece (você pode adicionar vários rótulos de uma só vez dessa forma, basta digitar outro rótulo e clicar no botão fixar novamente).
4. Clique no botão ' Aplicar rótulos' para atribuir o(s) rótulo(s) às mensagens. Os rótulos atribuídos agora aparecerão abaixo de cada mensagem na página.
Como alternativa, você pode adicionar um rótulo às mensagens individuais clicando no botão ' Adicionar rótulo +' destacado abaixo dela.
Se você quiser adicionar um rótulo a um grupo de mensagens na página, mas deseja excluir uma ou várias, você pode desmarcá-las usando o botão de alternância destacado (A). Você pode reverter a seleção ou desmarcar/remarcar tudousando os botões destacados na parte superior (B).
Você pode visualizar diferentes páginas do mesmo cluster (A) e ajustar o número de mensagens por página (B) usando os botões realçados. Depois que o cluster for anotado, você pode passar para um novo cluster usando a lista suspensa abaixo (C).
O modelo apresentará 30 clusters , e é importante trabalhar neles para criar uma base sólida para a fase Explorar. Entretanto, se um cluster não for relevante para você, basta ignorá-lo.
O Discover começa a ser retreinado após uma quantidade significativa de treinamento ser concluída. Depois que 180 mensagens forem anotadas (metade dos clusters), o Discover treinará novamente e atualizará os clusters. Não desista, basta continuar trabalhando com eles até que você tenha revisado pelo menos30.