- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Visão geral do treinamento em classificação de documentos
- Assistente para configurar classificadores do Train Classifiers Scope
- Machine Learning Classifier Trainer
- Atividades relacionadas ao treinamento em classificação de documentos
- Consumo de dados
- Pacotes de ML
- Pipelines
- Document Manager
- Serviços de OCR
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Aprendizagem profunda
- Licenciamento
- Referências
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Visão geral do treinamento em classificação de documentos
O Document Classification Training é um componente do framework Document Understanding que ajuda a fechar o ciclo de feedback para classificadores que são capazes de aprender com o feedback humano.
Você pode criar processos do Document Understanding que não contenham nenhum componente de treinamento. Isso pode ocorrer por vários motivos, dos quais alguns são:
- os classificadores utilizados não suportam retreinamento
- você não deseja realizar o retreinamento, pois prefere que o processo use sempre o mesmo treinamento
- você deseja atualizar o treinamento do classificador offline e está gerenciando suas atualizações fora do seu processo de DU.
Treinar seus classificadores como parte do uso regular do processo é, no entanto, de grande benefício na maioria dos casos, pois os classificadores podem coletar seus próprios dados de treinamento e realizar suas próprias atualizações ingerindo as informações de validação humana, sem exigir que você atualize seus fluxos de trabalho existentes de qualquer forma. Eles se tornam, por assim dizer, algoritmos de autoaprendizagem que podem aprender a agir melhor no futuro, com base no que os humanos validaram como dados corretos.
O treinamento de classificação é feito por meio da atividade Train Classifiers Scope. Você pode treinar um ou mais classificadores, pois a atividade de escopo tem a função de configurar e executar um ou mais algoritmos para treinamento de classificação de uma só vez.
O treinamento de classificação geralmente é executado após o Document Classification Validation: somente feedback confirmado por humanos deve ser enviado de volta aos classificadores para treinamento, para garantir a precisão dos dados de treinamento recebidos pelos algoritmos.
O treinamento de classificação deve ser executado tanto no caso de uma classificação com falha (sem classificação automática, ou classificação automática que foi corrigida pelo trabalhador do conhecimento), quanto no caso de uma classificação bem-sucedida (sem correções feitas pelo usuário no estágio de validação, todos os resultados automáticos confirmados). Isso ocorre porque ambos os casos são úteis para os algoritmos aprenderem.
Você pode treinar classificadores que foram usados na fase do Document Classification, bem como classificadores que não foram usados para previsão de classificação. A última abordagem é usada para coletar dados de treinamento e treinar um classificador do zero, com a intenção de usá-lo posteriormente adicionando-o aos fluxos de trabalho do Document Understanding.
Resumindo, é isso que o Train Classifiers Scope faz:
- Fornece a todos os treinadores de classificadores (algoritmos de treinamento) as configurações necessárias para sua execução.
- Aceita um ou mais treinadores de classificadores.
- Permite filtragem de tipo de documento e mapeamento de taxonomia entre a taxonomia do projeto e quaisquer taxonomias do classificador interno.
O Train Classifiers Scope permite configurá-lo usando o assistente Configurar Classificadores. Você pode personalizar
- quais tipos de documentos são enviados para treinamento para qual treinador de classificador,
- qual é o mapeamento de taxonomia, em nível de tipo de documento, entre a taxonomia do projeto e a taxonomia interna do classificador (se houver).
Classificadores e suas respectivas atividades de treinamento podem ser encontrados nos pacotes UiPath.IntelligentOCR.Activities.
Os treinadores de classificadores disponíveis são:
- Keyword Based Classifier Trainer, atividade do treinador para o Keyword Based Classifier
- Intelligent Keyword Classifier Trainer, atividade do treinador para o Intelligent Keyword Classifier