- Introdução
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Campos gerais (anteriormente entidades)
- Rótulos (previsões, níveis de confiança, hierarquia etc.)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens revisadas e não revisadas
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Administração
- Gerencie origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Crie uma origem de dados na GUI
- Carregar um arquivo CSV para uma origem
- Criar um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Corrigir configurações de conjunto de dados
- Excluir mensagens por meio da interface do usuário
- Excluir um conjunto de dados
- Excluir uma origem
- Exportar um conjunto de dados
- Usando integrações do Exchange
- Preparando dados para carregamento de .CSV
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, campos gerais e metadados
- Hierarquia de rótulo e práticas recomendadas
- Definição dos seus objetivos de taxonomia
- Casos de uso de análise versus automação
- Transformando seus objetivos em rótulos
- Criação da sua estrutura taxonômica
- Práticas recomendadas de design de taxonomia
- Importando sua taxonomia
- Visão geral do processo de treinamento do modelo
- Anotação Generativa (Novo)
- Status do conjunto de dados
- Treinamento de modelos e práticas recomendadas de anotação
- Treinamento com análise de sentimento de rótulo habilitada
- Treinamento
- Introdução ao Refine
- Precisão e recall explicados
- Precisão e recall
- Como funciona a Validação?
- Compreender e melhorar o desempenho do modelo
- Por que um rótulo pode ter uma precisão média baixa?
- Treinamento usando Check label e Perda de rótulo
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Melhorando o balanceamento e usando o Rebalanceamento
- Quando parar de treinar seu modelo
- Uso dos campos gerais
- Extração generativa
- Uso de análise e monitoramento
- Automations e Communications Mining
- Informações de licenciamento
- Perguntas frequentes e mais
Visão geral
A página Explorar tem vários modos de treinamento, e esta fase se concentra principalmente em três deles:
'Aleatório' - mostra uma seleção aleatória de mensagens para os usuários anotarem. É vital concluir uma parte significativa do treinamento na atividade Aleatório, para criar um conjunto de exemplos de treinamento que seja representativo do conjunto de dados mais amplo.
"Ensinar" (para mensagens não revisadas) - assim que a plataforma estiver fazendo previsões razoável para um rótulo, você poderá melhorar sua capacidade de prever o rótulo em relação aos exemplos mais variados. Basta revisar as mensagens no modo padrão Ensinar (que é para mensagens não revisadas mensagens). Isso mostrará mensagens em que a plataforma não tem certeza se o rótulo selecionado se aplica ou não.
“Baixa confiança” - mostra mensagens que não são bem cobertas pelas previsões informativas do rótulo. Essas mensagens não terão previsões ou previsões de confiança muito baixa para rótulos que a plataforma entende como informativos.
Esta seção da Base de Conhecimento também abordará o treinamento usando a PesquisanoExplorar , que é muito semelhante ao treinamento usando a Pesquisa no Descubra.
Há outro modo de treinamento em Explorar — Ensinar (para mensagens revisadas) — que está explicado na seção “Refinando modelos e usando a validação” da Base de Conhecimento aqui.
Layout explicado:
A | Ajuste o intervalo de datas ou período das mensagens exibidas |
B | Adicione vários outros filtros com base nos metadados das mensagens, por exemplo pontuação ou remetente |
C | Adicione um filtro de campo geral |
D | Alterna de todas as mensagens para mensagens revisadas ou não revisadas, também ajusta as contagens de rótulos fixados versus previstos |
E | Adicione um filtro de rótulo |
F | Pesquise rótulos específicos em sua taxonomia |
G | Adicionar rótulos adicionais |
H | Expandir metadados da mensagem |
I | Atualizar a consulta atual |
J | Alterne entre diferentes modos de treinamento, como recente, aleatório, instruído e baixa confiança, e selecione o rótulo para classificar |
K | Pesquise o conjunto de dados em busca de mensagens que contenham palavras ou frases específicas |
L | Faça o download de todas as mensagens nesta página ou exporte o conjunto de dados com os filtros aplicados como um arquivo CSV |
O número de exemplos necessários para prever com precisão cada rótulo pode variar muito, dependendo da extensão ou especificidade de um conceito de rótulo.
Pode ser que um rótulo esteja normalmente associado a palavras, frases ou intenções muito específicas e facilmente identificáveis, e a plataforma seja capaz de prever isso de forma consistente com relação a poucos exemplos de treinamento. Também pode ser que um rótulo capture um tópico amplo com muitas variações diferentes de idioma que seriam associados a ele, caso em que pode exigir muito mais exemplos de treinamento para permitir que a plataforma identifique de forma consistente instâncias em que o rótulo deve ser aplicado.
Muitas vezes, a plataforma pode começar a fazer previsões para um rótulo com apenas cinco exemplos. Porém, para estimar com precisão o desempenho de um rótulo (o quão bem a plataforma é capaz de prevê-lo), cada rótulo exija pelo menos 25 exemplos.
Ao anotar no Explorar, os pequenos seletores vermelhas (exemplos mostrados abaixo) ao lado de cada rótulo indicam se mais exemplos são necessários para estimar com precisão o desempenho do rótulo. O mostrador começa a desaparecer à medida que você fornece mais exemplos de treinamento e desaparecerá completamente quando você atingir 25.
Isso não significa que, com 25 exemplos, a plataforma será capaz de prever com precisão todos os rótulos, mas pelo menos poderá validar o quão bem é capaz de prever cada rótulo e alertar você se for necessário um treinamento adicional.
Portanto, durante a fase Explorar, você deve fornecer pelo menos 25 exemplos para todos os rótulos nos quais está interessado, usando uma combinação das etapas mencionadas acima (principalmente Aleatório e Teach + Não revisado).
Durante a fase de Refinar, pode ficar claro que mais treinamento é necessário para determinados rótulos melhorarem seu desempenho, e isso é abordado em detalhes aqui.
No Explorar, quando você atingir 25 exemplos fixados para um rótulo, você poderá ver um dos indicadores de desempenho do rótulo abaixo no lugar do mostrador de treinamento:
- O círculo cinza é um indicador de que a plataforma está calculando o desempenho desse rótulo. Ele será atualizado para desaparecer ou se tornar um círculo amarelo ou vermelho após o cálculo
- Âncora é um indicador de que o rótulo tem um desempenho um pouco menos satisfatório e pode ser melhorado
- A cor vermelha indica que o rótulo está apresentando um desempenho ruim e precisa de treinamento adicional/ações corretivas para melhorá-lo
- Se não houver nenhum círculo, isso significa que o rótulo está funcionando em um nível satisfatório (mas ainda pode precisar de melhorias, dependendo do caso de uso e dos níveis de precisão desejados)
- Para entender mais sobre o desempenho do rótulo e como melhorá-lo, comece por aqui
Se você clicar no ícone de verificação (conforme mostrado abaixo) na parte superior da barra do filtro de rótulos para filtrar para mensagens revisadas, você verá o número de mensagens revisadas que têm esse rótulo aplicado.
Se você clicar no ícone do computador para filtrar para mensagens não revisadas, você será mostrado para o número total de previsões para esse rótulo (que inclui também o número de exemplos revisados).
No Explorar, quando nem revisadas nem não revisadas estiverem selecionadas, a plataforma mostra o número total de mensagens fixadas para um rótulo como padrão. Em Relatórios, o padrão é mostrar o total previsto.
- O modelo pode começar a fazer previsões com apenas algumas mensagens anotadas, embora, para que ele faça previsões confiáveis, você deva anotar no mínimo 25 mensagens por rótulo. Alguns exigirão mais do que isso, dependendo da complexidade dos dados, do rótulo e da consistência com os rótulos aplicados
- Em Explorar, você também deve tentar encontrar mensagens nas quais o modelo tenha previsto um rótulo incorretamente. Você deve remover rótulos incorretos e aplicar os corretos. Esse processo ajuda a evitar que o modelo faça uma previsão incorreta semelhante no futuro