Document Understanding - Classificador inteligente de palavras-chave

document-understanding

2022.4

true

Guia do usuário do Document Understanding.

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Intelligent Keyword Classifier

O que é o Classificador inteligente de palavras-chave

O Classificador inteligente de palavras-chave é um classificador que usa o vetor de palavras que aprende a partir de arquivos de certos tipos de documentos para realizar a classificação de documentos.

O algoritmo é construído em torno do conceito de repetição de conteúdo para o mesmo tipo de documento e parte da premissa de que os tipos de documentos possuem uma série de palavras que geralmente ocorrem nesses tipos de documentos, permitindo assim um cálculo de similaridade vetorial.

Ao classificar um arquivo em um tipo de documento, o Classificador inteligente de palavras-chave:

encontra o vetor de palavras mais próximo ao qual um arquivo é mais semelhante,
reporta sobre o tipo de documento de pontuação mais alta, com as palavras principais correspondentes subjacentes.

O Classificador inteligente de palavras-chave também possui recursos de divisão de arquivos, o que significa que ele pode relatar mais de uma classe para um determinado arquivo, para intervalos de páginas separados.

Quando usar

Você deve considerar usar este classificador se:

seus arquivos contêm um ou mais tipos de documentos em um único arquivo
seus tipos de documento são relativamente fáceis de diferenciar no que diz respeito ao conteúdo.

Como treinar

Coloque a atividade Intelligent Keyword Classifier Trainer em um Train Classifiers Scope e configure-o adequadamente.

Não podemos impor a consistência do arquivo de treinamento em treinamentos paralelos ao nível de atividade. Duas soluções possíveis para este problema são fornecidas pelo Document Understanding Process. Ambos consistem em controle de tráfego:

arquivos de bloqueio (implementado por padrão no processo): renomeie o arquivo usando a extensão .lock, modifique e salve o arquivo, depois renomeie o arquivo novamente, removendo a extensão .lock
configuração manual de uma fila especial: crie uma fila vazia no Orchestrator e integre suas duas atividades do projeto.

Para obter mais informações sobre como treinar um Classificador, consulte esta página que descreve o processo de uso do assistente Gerenciar Aprendizagem.

Saiba mais

Saiba mais sobre o Intelligent Keyword Classifier, seguindo este link.

Nesta página

O que é o Classificador inteligente de palavras-chave
Quando usar
Como treinar
Saiba mais

Esta página foi útil?

AnteriorRequisitos especiais

AvançarRequisitos especiais