Communications Mining
Mais recente
falso
Imagem de fundo do banner
Guia do usuário do Communications Mining
Última atualização 18 de abr de 2024

Noções Básicas sobre Entidades

O que são entidades?

As entidades são elementos adicionais de dados estruturados que podem ser extraídos de dentro das mensagens em seu conjunto de dados. As entidades incluem pontos de dados como quantidades monetários, datas, códigos de moeda, endereços de e-mail, URLs, assim como muitas outras categorias específicas do setor (veja abaixo um exemplo).

Exemplo de mensagem de email com entidades de linha de endereço, nome da cidade e número de política previstos

Ao contrário dos rótulos, a plataforma é capaz de prever a maioria das entidades (exceto aquelas treinadas do zero) assim que são habilitadas, pois pode identificá-las com base em seu formato típico ou, em alguns casos, muito específico, bem como em um conjunto de treinamento de entidades semelhantes .

Assim como os rótulos, os usuários podem aceitar ou rejeitar entidades que sejam previsões corretas ou incorretas, aprimorando a capacidade do modelo de identificá-las no futuro.

Tipos de entidades

Há atualmente dois tipos principais de entidades:

  • Entidades pré-treinadas que normalmente são baseadas em um conjunto de regras padrão ou personalizadas - por exemplo, Quantidade monetário, URL e Data
  • Entidades treinadas do zero por um usuário (da mesma forma que treinariam rótulos) baseadas em aprendizado de máquina

Entidades treináveis versus não treináveis

Todas as entidades são "treináveis" por natureza (entidades treinadas do zero), ou podem ser tornadas "treináveis" quando estão habilitadas (todos os outros tipos de entidade).

Entidades "treináveis" são aquelas que serão atualizadas ao vivo na plataforma com base no treinamento fornecido pelos usuários. Para obter mais detalhes sobre entidades de treinamento, consulte aqui.

Se você habilitar o treinamento em uma entidade pré-treinada que normalmente é baseada em um conjunto de regras padrão ou personalizadas definidas, você pode refinar a compreensão da plataforma dessa entidade dentro dos parâmetros dessas regras. Essencialmente, o treinamento adicional reduzirá o escopo do que a plataforma pode considerar essa entidade, mas não o aumentará.

Isso ocorre porque muitas dessas entidades, como datas (por exemplo, 'amanhã') e quantidades numéricas (por exemplo, GBP 20), precisam ser normalizados em um formato de dados estruturados para sistemas downstream. Além disso, para entidades como ISINs ou CUSIPs, elas devem ter um formato definido, para que a plataforma não seja treinada a prever algo que não esteja em conformidade com seus formatos definidos.

Quando alguma entidade treinável é atribuída, a plataforma considera o texto da entidade, além do contexto da entidade no restante da comunicação, ou seja, o que está acontecendo antes e depois do valor da entidade (no mesmo parágrafo, e a de cima e a de baixo). Ele aprende a prever melhor a entidade com base nos próprios valores e também em como o valor aparece dentro do contexto da comunicação.

Se uma entidade pré-treinada não for definida como treinável (consulte detalhes sobre como habilitar entidades em um conjunto de dados aqui), os usuários ainda poderão aceitar ou rejeitar as previsões de entidades que visualizam em seu conjunto de dados. Elas são atualizadas e refinadas offline usando esse feedback na plataforma fornecido pelos usuários. Portanto, ainda é útil para os usuários aceitar ou rejeitar essas entidades ao revisar as mensagens.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.