- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Pipelines
- Document Manager
- Serviços de OCR
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Aprendizagem profunda
- Licenciamento
- Referências
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Intelligent Keyword Classifier
O Classificador inteligente de palavras-chave é um classificador que usa o vetor de palavras que aprende a partir de arquivos de certos tipos de documentos para realizar a classificação de documentos.
O algoritmo é construído em torno do conceito de repetição de conteúdo para o mesmo tipo de documento e parte da premissa de que os tipos de documentos possuem uma série de palavras que geralmente ocorrem nesses tipos de documentos, permitindo assim um cálculo de similaridade vetorial.
Ao classificar um arquivo em um tipo de documento, o Classificador inteligente de palavras-chave:
- encontra o vetor de palavras mais próximo ao qual um arquivo é mais semelhante,
- reporta sobre o tipo de documento de pontuação mais alta, com as palavras principais correspondentes subjacentes.
O Classificador inteligente de palavras-chave também possui recursos de divisão de arquivos, o que significa que ele pode relatar mais de uma classe para um determinado arquivo, para intervalos de páginas separados.
Você deve considerar usar este classificador se:
- seus arquivos contêm um ou mais tipos de documentos em um único arquivo
- seus tipos de documento são relativamente fáceis de diferenciar no que diz respeito ao conteúdo.
Coloque a atividade Intelligent Keyword Classifier Trainer em um Train Classifiers Scope e configure-o adequadamente.
Não podemos impor a consistência do arquivo de treinamento em treinamentos paralelos ao nível de atividade. Duas soluções possíveis para este problema são fornecidas pelo Document Understanding Process. Ambos consistem em controle de tráfego:
- arquivos de bloqueio (implementado por padrão no processo): renomeie o arquivo usando a extensão
.lock
, modifique e salve o arquivo, depois renomeie o arquivo novamente, removendo a extensão.lock
- configuração manual de uma fila especial: crie uma fila vazia no Orchestrator e integre suas duas atividades do projeto.
Para obter mais informações sobre como treinar um Classificador, consulte esta página que descreve o processo de uso do assistente Gerenciar Aprendizagem.
Saiba mais sobre o Intelligent Keyword Classifier, seguindo este link.