- Introdução
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais (anteriormente entidades)
- Rótulos (previsões, níveis de confiança, hierarquia etc.)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens revisadas e não revisadas
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Create or delete a data source in the GUI
- Carregar um arquivo CSV para uma origem
- Preparando dados para carregamento de .CSV
- Criar um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Corrigir configurações de conjunto de dados
- Excluir mensagens por meio da interface do usuário
- Excluir um conjunto de dados
- Exportar um conjunto de dados
- Usando integrações do Exchange
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulo e práticas recomendadas
- Definição dos seus objetivos de taxonomia
- Casos de uso de análise versus automação
- Transformando seus objetivos em rótulos
- Criação da sua estrutura taxonômica
- Práticas recomendadas de design de taxonomia
- Importando sua taxonomia
- Visão geral do processo de treinamento do modelo
- Anotação Generativa (Novo)
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Compreensão dos requisitos de dados
- Treinamento
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como funciona a Validação?
- Compreender e melhorar o desempenho do modelo
- Por que um rótulo pode ter uma precisão média baixa?
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining
- Informações de licenciamento
- Perguntas frequentes e mais
Guia do usuário do Communications Mining
Perguntas frequentes do treinamento do modelo
- Treinamento geral do modelo
- Treinamento de rótulo
O objetivo do treinamento de um modelo é criar um conjunto de dados de treinamento que seja o mais representativo possível do conjunto de dados como um todo, para que a plataforma possa prever com precisão e confiança os rótulos relevantes e campos gerais para cada mensagem. Os rótulos e campos gerais dentro de um conjunto de dados devem estar intrínsecos aos objetivos gerais do caso de uso e fornecer valor de negócio significativo.
Assim que os dados são carregados para a plataforma, a plataforma inicia um processo chamado aprendizado não supervisionado, pelo qual agrupa mensagens em clusters de intenção semântica semelhante. Esse processo pode levar algumas horas, dependendo do tamanho do conjunto de dados, e os clusters aparecerão assim que estiver concluído.
Para poder treinar um modelo, você precisa de uma quantidade mínima de dados históricos existentes. Isso é usado como dados de treinamento para fornecer à plataforma as informações necessárias para prever com confiança cada um dos conceitos relevantes para sua análise e/ou automação.
A recomendação para qualquer caso de uso é de um mínimo de 12 meses de dados históricos, a fim de capturar adequadamente qualquer Sazonalidade ou irregularidade nos dados (por exemplo, processos de fim de mês e períodos de maior atividade).
Não, você não precisa salvar seu modelo após qualquer alteração ser feita. Toda vez que você treinar a plataforma em seus dados (ou seja, anotando qualquer mensagem), uma nova versão do modelo é criada para seu conjunto de dados. As estatísticas de desempenho para versões de modelo mais antigas podem ser exibidas na Validação.
Confira a página Validação na plataforma, que relata várias medidas de desempenho e fornece uma classificação holística da integridade do modelo. Esta página é atualizada após cada evento de treinamento e pode ser usada para identificar áreas em que o modelo pode precisar de mais exemplos de treinamento ou algumas correções de rótulo para garantir a consistência.
Consulte a página Validação para obter explicações completas sobre o desempenho do modelo e como melhorá-lo.
Os clusters são uma maneira útil de ajudar você a criar rapidamente sua taxonomia, mas os usuários passarão a maior parte do tempo treinando em Explorar em vez de Descobrir.
Se os usuários gastam muito tempo anotando por meio de clusters, existe o risco de sobreajuste o modelo para procurar mensagens que só se encaixam nesses clusters ao fazer previsões. Quanto mais exemplos variados houver para cada rótulo, melhor será o modelo para encontrar as diferentes maneiras de expressar a mesma intenção ou conceito. Esse é um dos principais motivos pelos quais mostramos apenas 30 clusters de cada vez.
Entretanto, após um treinamento suficiente ser concluído ou um volume significativo de dados ser adicionado à plataforma (consulte aqui), o Discover faz retreinamento. Quando retreina, ele leva em consideração o treinamento existente até hoje e tenta apresentar novos clusters que não são bem cobertos pela taxonomia atual.
Para obter mais informações sobre o Discover, consulte aqui.
Há 30 clusters no total, cada um contendo 12 mensagens. Na plataforma, é possível filtrar o número de mensagens exibidas na página em incrementos entre 6 e 12 por página. Nossa recomendação é anotar seis de cada vez para garantir que você reduza o risco de anotar parcialmente qualquer mensagem.
Precisão e recall são métricas usadas para medir o desempenho de um modelo de aprendizado de máquina. Uma descrição detalhada de cada uma pode ser encontrada na seção Usando a validação de nossos guias de instruções.
Você pode acessar a visão geral da validação de modelos anteriores, passando o mouse sobre "Versão do modelo", no canto superior esquerdo da página Validação. Isso pode ser útil para rastrear e comparar o progresso à medida que você treina seu modelo.
Se você precisar reverter seu modelo para uma versão anterior fixada, consulte aqui para obter mais detalhes.
Sim, é muito fácil de fazer. Você pode acessar as configurações de cada rótulo e renomeá-lo quando quiser. Você pode ver como fazer isso aqui.
Informações sobre seu conjunto de dados, incluindo quantas mensagens foram anotadas, são exibidas na página Configurações de conjuntos de dados. Para ver como acessá-lo, clique aqui.
Se você puder ver na página Validação que seu rótulo está apresentando um desempenho ruim, existem várias maneiras de melhorá-lo. Veja aqui para entender mais.
Os pequenos seletores vermelhas ao lado de cada rótulo/campo geral indicam se mais exemplos são necessários para a plataforma estimar com precisão o desempenho do rótulo/campo geral. Os seletores começam a desaparecer à medida que você fornece mais exemplos de treinamento e desaparecerão completamente quando você atingir 25 exemplos.
Depois disso, a plataforma conseguirá avaliar com eficiência o desempenho de um determinado rótulo/campo geral e poderá retornar um aviso de desempenho se o rótulo/campo geral não estiver íntegro.
A plataforma é capaz de aprender com mensagens vazias e mensagens não informativas, desde que sejam anotadas corretamente. No entanto, vale a pena observar que rótulos não informativos provavelmente precisarão de um número significativo de exemplos de treinamento, além de serem ligeiramente agrupados por conceito, para garantir o melhor desempenho.
- Treinamento geral do modelo
- Qual é o objetivo de treinar um modelo?
- Por que não consigo ver nada no Discover se eu acabava de carregar dados na plataforma?
- Quantos dados históricos preciso para treinar um modelo?
- Preciso salvar meu modelo toda vez que fizer uma alteração?
- Como saber qual é o desempenho do modelo?
- Por que há apenas 30 clusters disponíveis e podemos defini-los individualmente?
- Quantas mensagens há em cada cluster?
- O que significa precisão e recall?
- Posso voltar para uma versão anterior do meu modelo?
- Treinamento de rótulo
- Posso alterar o nome de um rótulo mais tarde?
- Como posso saber o número de mensagens que anotei?
- Um dos meus rótulos está apresentando baixo desempenho. O que posso fazer para melhorá-lo?
- O que o mostrador vermelho ao lado do meu rótulo ou campo geral indica? Como posso me livrar dele?
- Deve-se evitar anotar mensagens vazias/sem informações?