- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Passaportes - Pacote de ML
- Contracheques — Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Requisitos de Hardware
- Pipelines
- Document Manager
- Serviços de OCR
- Aprendizagem profunda
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentProcessing.Contracts
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Use o Document Manager
Esta página descreve como usar o Document Manager para rotular um novo conjunto de dados e treinar novamente um modelo de ML.
Inicie a sessão de rotulagem de dados criada na Experiência da primeira execução e vá para as configurações para configurar o OCR.
Escolha o OCR que pretende usar no menu suspenso Método de OCR. Para UiPathDocumentOCR, cole a chave de licença do Document Understanding (recupere a chave da API Document Understanding a partir da página Administrator > Licença) e então cole o URL do OCR gerado quando você implantou o UiPathDocumentOCR.
Configure a pré-rotulagem com os modelos implantados seguindo as instruções aqui. Cole o ponto de extremidade de habilidade de ML público modelo e a chave de licença do Document Understanding e, em seguida, clique em Salvar.
Para obter mais detalhes, consulte a documentação aqui: Usar um esquema predefinido.
Clique no botão Importar de uma Sessão do Document Manager.
Nomeie o conjunto de dados e clique em Procurar arquivos para upload.
Selecione o documento que deseja carregar.
Clique em SIM.
Clique em para criar campos a serem extraídos.
Você pode criar até 40 campos.
Para este exercício de validação, você pode criar alguns campos de fatura comuns, como data, nome, n.º de fatura e total. Certifique-se de alterar o tipo de conteúdo de acordo - data (data), nome (string), número da fatura (string) e total (número).
Agora, você pode começar a rotular os documentos.
Clique no botão prever na parte superior para usar o modelo de fatura base e prever os rótulos para os campos definidos e corrija se a previsão estiver errada.
d
para rotular data no exemplo abaixo).
Use a seta na parte superior para mudar para o próximo documento até terminar a validação dos rótulos para todas as faturas carregadas.
Certifique-se de selecionar o conjunto de dados correto na filtragem do conjunto de dados e clique no botão Exportar .
Clique em Exportar.
Acesse Conjunto de dados no mesmo projeto do AI Center, o conjunto de dados de treinamento exportado deve ser exibido.
Treinamento de um modelo personalizado no AI Center
Acesse Pipelines > Criar novo. Selecione o tipo de execução de avaliação, selecione o pacote de modelo e o conjunto de dados de entrada.
Selecione a subpasta em Exportar como conjunto de dados de entrada.
Clique em Criar para iniciar o pipeline. Pode levar de 1 a 2 horas para que o pipeline seja executado em máquinas de CPU.
Acesse Habilidades de ML e crie uma nova Habilidade de ML.
Escolha o mesmo pacote de modelo de fatura criado anteriormente. Como retreinamos o modelo, agora há uma nova versão secundária de pacote (1 vs 0). Certifique-se de selecionar a mais recente.
Depois que a habilidade de ML for criada, vá para Modificar a implantação atual para tornar a habilidade de ML pública. Clique no botão de alternância e em Confirmar.
Copie o URL da habilidade de ML pública para uso posterior.
Parabéns! Você treinou novamente um modelo de Fatura com seu próprio conjunto de dados e criou o ponto de extremidade para acessá-lo.