document-understanding
2023.10
false
- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Sobre pipelines
- Pipelines de treinamento
- Pipelines de avaliação
- Pipelines completos
- Ajuste fino
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Pipelines de avaliação
Guia do usuário do Document Understanding.
Última atualização 18 de dez de 2024
Pipelines de avaliação
Um pipeline de avaliação é usado para avaliar um modelo de ML treinado.
Configure o pipeline de avaliação da seguinte maneira:
- No campo Pipeline type, selecione Execução de avaliação.
- No campo Escolha o pacote, selecione o pacote que deseja avaliar.
- No campo Escolha a versão principal do pacote, selecione uma versão principal para o seu pacote.
- No campo Escolha a versão secundária do pacote, selecione uma versão secundária que deseja avaliar.
- No campo Escolher conjunto de dados de avaliação, selecione um conjunto de dados de avaliação representativo.
- Na seção Insira os parâmetros, há uma variável de ambiente relevante para pipelines de avaliação que você pode usar:
eval.redo_ocr
que, se definido como verdadeiro, permite que você execute novamente o OCR ao executar o pipeline para avaliar o impacto do OCR na precisão da extração. Isso pressupõe que um mecanismo de OCR foi configurado quando o pacote de ML foi criado.- O controle deslizante Habilitar GPU está desabilitado por padrão; nesse caso, o pipeline é executado na CPU. É altamente recomendável que os pipelines de avaliação sejam executados apenas na CPU.
-
Selecione uma das opções quando o pipeline deve ser executado: Executar agora, Agendado ou Recorrente.
Após configurar todos os campos, clique em Criar. O pipeline é criado.
Para um pipeline de avaliação, o painel Saídas também inclui uma pasta artefatos / eval_metrics que contém dois arquivos:
evaluation_default.xlsx
é uma planilha do Excel com três planilhas diferentes:- A primeira planilha apresenta um resumo das pontuações gerais e das pontuações por lote, para cada campo, campos Regular, Coluna e Classificação. Uma porcentagem dos documentos perfeitamente extraídos também é fornecida para documentos por lote e, em geral.
- A segunda planilha apresenta uma comparação lado a lado, codificada por cores, de Campos Regulares, para aumentar a precisão do documento. Os documentos mais imprecisos são apresentados na parte superior para facilitar o diagnóstico e a solução de problemas.
-
A terceira planilha apresenta uma comparação de cores lado a lado, codificada, dos Campos da Coluna.
Todas as pontuações apresentadas no arquivo Excel representam pontuações de precisão.
evaluation_metrics_default.txt
contém as pontuações F1 dos campos previstos.