- Introdução
- Balanceamento
- Clusters
- Desvio de conceito
- Cobertura
- Conjuntos de dados
- Entidades
- Rótulos (previsões, níveis de confiança, hierarquia etc.)
- Modelos
- Transmissões
- Classificação do Modelo
- Projetos
- Precisão
- Lembrar
- Mensagens revisadas e não revisadas
- Fontes
- Taxonomias
- Treinamento
- Previsões positivos e negativos verdadeiros e falsos
- Validação
- Mensagens
- Administração
- Gerenciar origens e conjuntos de dados
- Entender a estrutura de dados e permissões
- Crie uma origem de dados na GUI
- Carregar um arquivo CSV para uma origem
- Criar um conjunto de dados
- Origens e conjuntos de dados multilíngues
- Habilitando o sentimento em um conjunto de dados
- Corrigir configurações de conjunto de dados
- Excluir mensagens por meio da interface do usuário
- Excluir um conjunto de dados
- Exportar um conjunto de dados
- Usando integrações do Exchange
- Preparando dados para upload de .CSV
- Treinamento e manutenção do modelo
- Noções Básicas sobre rótulos, entidades e metadados
- Hierarquia de rótulo e práticas recomendadas
- Definição dos seus objetivos de taxonomia
- Casos de uso de análise versus automação
- Transformando seus objetivos em rótulos
- Criação da sua estrutura taxonômica
- Práticas recomendadas de design de taxonomia
- Importando sua taxonomia
- Visão geral do processo de treinamento do modelo
- Anotação Generativa (Novo)
- Entendendo o status do seu conjunto de dados
- Práticas recomendadas de treinamento e rotulagem de modelos
- Treinamento com análise de sentimento de rótulo habilitada
- Treinamento
- Introdução a "Refinar"
- Precisão e recall explicados
- Precisão e recall
- Como funciona a Validação?
- Compreender e melhorar o desempenho do modelo
- Por que um rótulo pode ter uma precisão média baixa?
- Treinamento usando "Check label" e "Missed label"
- Treinamento usando Ensinar rótulo (Refinar)
- Treinamento usando a Pesquisa (Refinamento)
- Noções Básicas e Aumentando a Cobertura
- Como melhorar o balanceamento e usar o 'Rebalance'
- Quando parar de treinar seu modelo
- Definição e configuração de suas entidades
- Noções Básicas sobre Entidades
- Quais entidades pré-treinadas estão disponíveis?
- Habilitar, desabilitar, atualizar e criar entidades
- Filtragem de entidades
- Revisar e aplicar entidades
- Validação para entidades
- Melhoria do desempenho de entidade
- Como criar entidades regex personalizadas
- Uso de Análise e Monitoramento
- Automations e Communications Mining
- Perguntas frequentes e mais
Noções Básicas sobre Entidades
O que são entidades?
As entidades são elementos adicionais de dados estruturados que podem ser extraídos de dentro das mensagens em seu conjunto de dados. As entidades incluem pontos de dados como quantidades monetários, datas, códigos de moeda, endereços de e-mail, URLs, assim como muitas outras categorias específicas do setor (veja abaixo um exemplo).
Ao contrário dos rótulos, a plataforma é capaz de prever a maioria das entidades (exceto aquelas treinadas do zero) assim que são habilitadas, pois pode identificá-las com base em seu formato típico ou, em alguns casos, muito específico, bem como em um conjunto de treinamento de entidades semelhantes .
Assim como os rótulos, os usuários podem aceitar ou rejeitar entidades que sejam previsões corretas ou incorretas, aprimorando a capacidade do modelo de identificá-las no futuro.
Tipos de entidades
Há atualmente dois tipos principais de entidades:
- Entidades pré-treinadas que normalmente são baseadas em um conjunto de regras padrão ou personalizadas - por exemplo, Quantidade monetário, URL e Data
- Entidades treinadas do zero por um usuário (da mesma forma que treinariam rótulos) baseadas em aprendizado de máquina
Entidades treináveis versus não treináveis
Todas as entidades são "treináveis" por natureza (entidades treinadas do zero), ou podem ser tornadas "treináveis" quando estão habilitadas (todos os outros tipos de entidade).
Entidades "treináveis" são aquelas que serão atualizadas ao vivo na plataforma com base no treinamento fornecido pelos usuários. Para obter mais detalhes sobre entidades de treinamento, consulte aqui.
Se você habilitar o treinamento em uma entidade pré-treinada que normalmente é baseada em um conjunto de regras padrão ou personalizadas definidas, você pode refinar a compreensão da plataforma dessa entidade dentro dos parâmetros dessas regras. Essencialmente, o treinamento adicional reduzirá o escopo do que a plataforma pode considerar essa entidade, mas não o aumentará.
Isso ocorre porque muitas dessas entidades, como datas (por exemplo, 'amanhã') e quantidades numéricas (por exemplo, GBP 20), precisam ser normalizados em um formato de dados estruturados para sistemas downstream. Além disso, para entidades como ISINs ou CUSIPs, elas devem ter um formato definido, para que a plataforma não seja treinada a prever algo que não esteja em conformidade com seus formatos definidos.
Quando alguma entidade treinável é atribuída, a plataforma considera o texto da entidade, além do contexto da entidade no restante da comunicação, ou seja, o que está acontecendo antes e depois do valor da entidade (no mesmo parágrafo, e a de cima e a de baixo). Ele aprende a prever melhor a entidade com base nos próprios valores e também em como o valor aparece dentro do contexto da comunicação.
Se uma entidade pré-treinada não for definida como treinável (consulte detalhes sobre como habilitar entidades em um conjunto de dados aqui), os usuários ainda poderão aceitar ou rejeitar as previsões de entidades que visualizam em seu conjunto de dados. Elas são atualizadas e refinadas offline usando esse feedback na plataforma fornecido pelos usuários. Portanto, ainda é útil para os usuários aceitar ou rejeitar essas entidades ao revisar as mensagens.