- Introdução
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Entidades
- Rótulos (previsões, níveis de confiança, hierarquia etc.)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens revisadas e não revisadas
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Administração
- Gerenciar origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Crie uma origem de dados na GUI
- Carregar um arquivo CSV para uma origem
- Criar um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Corrigir configurações de conjunto de dados
- Excluir mensagens por meio da interface do usuário
- Excluir um conjunto de dados
- Exportar um conjunto de dados
- Usando integrações do Exchange
- Preparando dados para upload de .CSV
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, entidades e metadados
- Hierarquia de rótulo e práticas recomendadas
- Definição dos seus objetivos de taxonomia
- Casos de uso de análise versus automação
- Transformando seus objetivos em rótulos
- Criação da sua estrutura taxonômica
- Práticas recomendadas de design de taxonomia
- Importando sua taxonomia
- Visão geral do processo de treinamento do modelo
- Anotação Generativa (Novo)
- Entendendo o status do seu conjunto de dados
- Práticas recomendadas de treinamento e rotulagem de modelos
- Treinamento com análise de sentimento de rótulo habilitada
- Treinamento
- Introdução a "Refinar"
- Precisão e recall explicados
- Precisão e recall
- Como funciona a Validação?
- Compreender e melhorar o desempenho do modelo
- Por que um rótulo pode ter uma precisão média baixa?
- Treinamento usando "Check label" e "Missed label"
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Como melhorar o balanceamento e usar o 'Rebalance'
- Quando parar de treinar seu modelo
- Definição e configuração de suas entidades
- Noções Básicas sobre Entidades
- Quais entidades pré-treinadas estão disponíveis?
- Habilitar, desabilitar, atualizar e criar entidades
- Filtragem de entidades
- Revisar e aplicar entidades
- Validação para entidades
- Melhoria do desempenho de entidade
- Como criar entidades regex personalizadas
- Uso de Análise e Monitoramento
- Automations e Communications Mining
- Perguntas frequentes e mais
Cobertura
Cobertura é um termo frequentemente usado em Machine Learning e está relacionado a quão bem um modelo "cobre" os dados que ele usa para analisar. No Communications Mining, isso está relacionado à proporção de mensagens no conjunto de dados que possuem previsões informativas do rótulo, e é apresentado na Validação como uma pontuação percentual.
Os "Rótulos informativos " são aqueles que a plataforma entende serem úteis como rótulos independentes, considerando a frequência com que são atribuídos a outros rótulos. Rótulos que são sempre atribuídos com outro rótulo, por exemplo, rótulos pais que nunca são atribuídos por conta própria ou 'Urgent' se sempre for atribuído com outro rótulo, recebem um peso menor quando a pontuação é calculada.
O visual abaixo dá uma indicação de como seria a aparência de baixa cobertura versus alta cobertura em todo um conjunto de dados. Imagine que os círculos sombreados sejam mensagens que têm previsões de rótulos informativos.
Como uma métrica, a cobertura é uma maneira muito útil de entender se você capturou todos os diferentes conceitos potenciais em seu conjunto de dados e se você forneceu exemplos de treinamento variados o suficiente para eles para que a plataforma possa prevê-los com eficácia.
Em quase todos os casos, quanto maior a cobertura de um modelo, melhor seu desempenho, porém não deve ser considerado isoladamente ao verificar o desempenho do modelo.
Também é muito importante que os rótulos na taxonomia sejam íntegros, o que significa que têm precisão média alta e nenhum outro alerta de desempenho, e que os dados de treinamento sejam uma representação equilibrada do conjunto de dados como um todo.
Se seus rótulos não estiverem íntegros ou os dados de treinamento não forem representativos do conjunto de dados, então a cobertura do seu modelo calculada pela plataforma não será confiável.
Ter um modelo de alta cobertura é particularmente importante se você o estiver usando para orientar processos automatizados.
Para obter mais detalhes sobre a cobertura do modelo e como verificar a cobertura do seu modelo, consulte aqui.