document-understanding
2022.10
false
Guia do usuário do Document Understanding.
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 4 de set de 2024

Visão geral do treinamento em classificação de documentos

O que é o Document Classification Training

O Document Classification Training é um componente do framework Document Understanding que ajuda a fechar o ciclo de feedback para classificadores que são capazes de aprender com o feedback humano.

Quando o Classification Training deve ser usado

Você pode criar processos do Document Understanding que não contenham nenhum componente de treinamento. Isso pode ocorrer por vários motivos, dos quais alguns são:

  • os classificadores utilizados não suportam retreinamento
  • você não deseja realizar o retreinamento, pois prefere que o processo use sempre o mesmo treinamento
  • você deseja atualizar o treinamento do classificador offline e está gerenciando suas atualizações fora do seu processo de DU.

Treinar seus classificadores como parte do uso regular do processo é, no entanto, de grande benefício na maioria dos casos, pois os classificadores podem coletar seus próprios dados de treinamento e realizar suas próprias atualizações ingerindo as informações de validação humana, sem exigir que você atualize seus fluxos de trabalho existentes de qualquer forma. Eles se tornam, por assim dizer, algoritmos de autoaprendizagem que podem aprender a agir melhor no futuro, com base no que os humanos validaram como dados corretos.

Como usar o componente Document Classification Training

O treinamento de classificação é feito por meio da atividade Train Classifiers Scope. Você pode treinar um ou mais classificadores, pois a atividade de escopo tem a função de configurar e executar um ou mais algoritmos para treinamento de classificação de uma só vez.

O treinamento de classificação geralmente é executado após o Document Classification Validation: somente feedback confirmado por humanos deve ser enviado de volta aos classificadores para treinamento, para garantir a precisão dos dados de treinamento recebidos pelos algoritmos.

O treinamento de classificação deve ser executado tanto no caso de uma classificação com falha (sem classificação automática, ou classificação automática que foi corrigida pelo trabalhador do conhecimento), quanto no caso de uma classificação bem-sucedida (sem correções feitas pelo usuário no estágio de validação, todos os resultados automáticos confirmados). Isso ocorre porque ambos os casos são úteis para os algoritmos aprenderem.

Você pode treinar classificadores que foram usados na fase do Document Classification, bem como classificadores que não foram usados para previsão de classificação. A última abordagem é usada para coletar dados de treinamento e treinar um classificador do zero, com a intenção de usá-lo posteriormente adicionando-o aos fluxos de trabalho do Document Understanding.

Resumindo, é isso que o Train Classifiers Scope faz:

  • Fornece a todos os treinadores de classificadores (algoritmos de treinamento) as configurações necessárias para sua execução.
  • Aceita um ou mais treinadores de classificadores.
  • Permite filtragem de tipo de documento e mapeamento de taxonomia entre a taxonomia do projeto e quaisquer taxonomias do classificador interno.

O Train Classifiers Scope permite configurá-lo usando o assistente Configurar Classificadores. Você pode personalizar

  • quais tipos de documentos são enviados para treinamento para qual treinador de classificador,
  • qual é o mapeamento de taxonomia, em nível de tipo de documento, entre a taxonomia do projeto e a taxonomia interna do classificador (se houver).

Treinadores de classificadores disponíveis

Classificadores e suas respectivas atividades de treinamento podem ser encontrados nos pacotes UiPath.IntelligentOCR.Activities.

Os treinadores de classificadores disponíveis são:

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.