Extração e Processamento Inteligente

ixp

latest

false

Guia do usuário do Communications Mining

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Cobertura

Cobertura é um termo frequentemente usado em machine learning (ML) e está relacionado a quão bem um modelo cobre os dados usados para analisar. No Communications Mining™, isso está relacionado à proporção de mensagens no conjunto de dados que têm previsões de rótulos informativas e é apresentado na página Validação como uma pontuação percentual.

Rótulos informativos são aqueles que a plataforma entende como úteis como rótulos independentes, examinando a frequência com que são atribuídos com outros rótulos. Os rótulos que são sempre atribuídos com outro rótulo têm um peso reduzido quando a pontuação é calculada. Por exemplo, rótulos pai que nunca são atribuídos por conta própria ou Urgente, se for sempre atribuído com outro rótulo.

O visual a seguir mostra como seria a cobertura baixa versus alta em todo um conjunto de dados. Imagine que os círculos sombreados são mensagens que possuem previsões de rótulos informativos:

Como uma métrica, a cobertura é uma maneira muito útil de entender se você capturou todos os diferentes conceitos potenciais em seu conjunto de dados e se você forneceu exemplos de treinamento variados o suficiente para eles para que a plataforma possa previ-los com eficiência.

Em quase todos os casos, quanto maior a cobertura de um modelo, melhor ele funciona, mas você não deve considerá-la isoladamente ao verificar o desempenho do modelo.

Também é muito importante que os rótulos na taxonomia estejam íntegros, o que significa que tenham alta precisão média, e nenhum outro aviso de desempenho, e que os dados de treinamento sejam uma representação equilibrada do conjunto de dados como um todo.

Quando a cobertura não é confiável

Se seus rótulos não estiverem íntegros ou os dados de treinamento não forem representativos do conjunto de dados, a cobertura do seu modelo que a plataforma calcula não será confiável.

Seu modelo com alta cobertura é particularmente importante se você o estiver usando para orientar processos automatizados.

Para obter mais detalhes sobre a cobertura do modelo e como verificar a cobertura do seu modelo, consulte Compreensão e melhoria do desempenho do modelo.

Nesta página

Quando a cobertura não é confiável

Esta página foi útil?

AnteriorDesvio de conceito

AvançarConjuntos de dados

Quando a cobertura não é confiável​

Esta página foi útil?

Quando a cobertura não é confiável