- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Visão geral
- Atividades do Document Understanding
- Assistente para configurar classificadores do Train Classifiers Scope
- Visão geral do treinamento em classificação de documentos
- Atividades relacionadas ao treinamento em classificação de documentos
- Machine Learning Classifier Trainer
- Consumo de dados
- Chamadas de API
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Visão geral do treinamento em classificação de documentos
Document Classification Training is a component in the Document UnderstandingTM Framework that helps in closing the feedback loop for classifiers that are capable of learning from human feedback.
Você pode criar processos do Document Understanding que não contenham nenhum componente de treinamento. Isso pode ocorrer por vários motivos, dos quais alguns são:
- os classificadores utilizados não suportam retreinamento
- você não deseja realizar o retreinamento, pois prefere que o processo use sempre o mesmo treinamento
- você deseja atualizar o treinamento do classificador offline e está gerenciando suas atualizações fora do seu processo de DU.
Treinar seus classificadores como parte do uso regular do processo é, no entanto, de grande benefício na maioria dos casos, pois os classificadores podem coletar seus próprios dados de treinamento e realizar suas próprias atualizações ingerindo as informações de validação humana, sem exigir que você atualize seus fluxos de trabalho existentes de qualquer forma. Eles se tornam, por assim dizer, algoritmos de autoaprendizagem que podem aprender a agir melhor no futuro, com base no que os humanos validaram como dados corretos.
O treinamento de classificação é feito por meio da atividade Train Classifiers Scope. Você pode treinar um ou mais classificadores, pois a atividade de escopo tem a função de configurar e executar um ou mais algoritmos para treinamento de classificação de uma só vez.
O treinamento de classificação geralmente é executado após o Document Classification Validation: somente feedback confirmado por humanos deve ser enviado de volta aos classificadores para treinamento, para garantir a precisão dos dados de treinamento recebidos pelos algoritmos.
O treinamento de classificação deve ser executado tanto no caso de uma classificação com falha (sem classificação automática, ou classificação automática que foi corrigida pelo trabalhador do conhecimento), quanto no caso de uma classificação bem-sucedida (sem correções feitas pelo usuário no estágio de validação, todos os resultados automáticos confirmados). Isso ocorre porque ambos os casos são úteis para os algoritmos aprenderem.
Você pode treinar classificadores que foram usados na fase do Document Classification, bem como classificadores que não foram usados para previsão de classificação. A última abordagem é usada para coletar dados de treinamento e treinar um classificador do zero, com a intenção de usá-lo posteriormente adicionando-o aos fluxos de trabalho do Document Understanding.
Resumindo, é isso que o Train Classifiers Scope faz:
- Fornece a todos os treinadores de classificadores (algoritmos de treinamento) as configurações necessárias para sua execução.
- Aceita um ou mais treinadores de classificadores.
- Permite filtragem de tipo de documento e mapeamento de taxonomia entre a taxonomia do projeto e quaisquer taxonomias do classificador interno.
O Train Classifiers Scope permite configurá-lo usando o assistente Configurar Classificadores. Você pode personalizar
- quais tipos de documentos são enviados para treinamento para qual treinador de classificador,
- qual é o mapeamento de taxonomia, em nível de tipo de documento, entre a taxonomia do projeto e a taxonomia interna do classificador (se houver).
Os classificadores e suas respectivas atividades de treinamento podem ser encontrados nos pacotes UiPath.IntelligentOCR.Activities e UiPath.DocumentUnderstanding.ML.Activities.
Os treinadores de classificadores disponíveis são:
- Keyword Based Classifier Trainer: atividade de treinador para o Keyword Based Classifier
- Intelligent Keyword Classifier Trainer: atividade de treinador para o Intelligent Keyword Classifier
- Machine Learning Classifier Trainer: atividade de treinador para o Classificador de Machine Learning.