UiPath Documentation
document-understanding
2022.4
false
  • Visão geral
    • Introdução
    • Suporte a idiomas
    • Relação do AI Center com a compreensão de documentos
  • Processo do Document Understanding
    • Processo do Document Understanding: modelo Studio
  • Tutoriais de início rápido
    • Como extrair dados de recibos
    • Faturas retreinadas com um campo adicional
    • Como extrair dados de formulários
  • Componentes do framework
    • Taxonomia
      • Visão geral da taxonomia
      • Gerenciador de Taxonomia
      • Atividades relacionadas à taxonomia
    • Digitalização
      • Visão geral da digitalização
      • Mecanismos OCR
      • Atividades relacionadas à digitalização
    • Classificação de Documento
      • Visão geral da classificação de documentos
      • Assistente para configurar classificadores de Classificar Escopo de Documento
      • Classificador baseado em palavra-chave
        • Requisitos especiais
      • Intelligent Keyword Classifier
        • Requisitos especiais
      • Classificador do FlexiCapture
      • Machine Learning Classifier
      • Atividades relacionadas à classificação de documentos
    • Validação da classificação de documentos
      • Visão geral da validação da classificação de documentos
      • Classification Station
      • Atividades relacionadas à validação de classificação de documentos
    • Treinamento em classificação de documentos
      • Visão geral do treinamento em classificação de documentos
      • Assistente para configurar classificadores do Train Classifiers Scope
      • Machine Learning Classifier Trainer
      • Atividades relacionadas ao treinamento em classificação de documentos
    • Extração de Dados
      • Visão geral de extração de dados
      • Assistente para configurar extratores de Escopo de Extração de Dados
      • Regex Based Extractor
        • Requisitos especiais
      • Form Extractor
        • Requisitos especiais
      • Intelligent Form Extractor
        • Requisitos especiais
      • Machine Learning Extractor
      • Extrator do FlexiCapture
      • Atividades relacionadas à extração de dados
    • Validação de extração de dados
      • Visão geral da validação de extração de dados
      • Validation Station
      • Atividades relacionadas à validação de extração de dados
    • Treinamento em extração de dados
      • Visão geral do treinamento em extração de dados
      • Assistente para configurar extratores de Train Extractors Scope
      • Machine Learning Extractor Trainer
      • Atividades relacionadas ao treinamento em extração de dados
    • Consumo de dados
      • Visão geral do consumo de dados
      • Atividades relacionadas ao consumo de dados
  • Pacotes de ML
    • Sobre os pacotes de ML
    • Requisitos de Hardware
    • Idiomas suportados
      • OCR
      • Pacotes de ML
      • Outros Serviços
    • Configuração de OCR
  • Pipelines
    • Sobre pipelines
    • Pipelines de treinamento
    • Pipelines de avaliação
    • Pipelines completos
    • Ajuste fino
    • O loop de ajuste fino automático (pré-visualização pública)
  • Gerenciador de Dados
    • Sobre o Data Manager
    • Acessar Data Manager
    • Criar e configurar campos
    • Usar um esquema pré-definido
    • Importar documentos
    • Rotular documentos
    • Pesquisar documentos
    • Exportar documentos
    • Caixas de seleção e assinaturas
  • Serviços de OCR
    • Serviços de OCR
  • Document Understanding implantado no Automation Suite
    • Instalar e usar
    • Experiência de primeira execução
    • Implantar o UiPathDocumentOCR
    • Implante um Pacote de ML pré-configurado
    • Instalação offline de pacotes de ML
      • Pacotes offline 2022.4.15
      • Pacotes offline 2022.4.14
      • Pacotes offline 2022.4.13
      • Pacotes offline 2022.4.12
      • Pacotes offline 2022.4.11
      • Pacotes offline 2022.4.9
      • Pacotes offline 2022.4.7
      • Pacotes offline 2022.4.5
      • Pacotes offline 2022.4.0
    • Use o Document Manager
    • Usar o Framework
  • Document Understanding implantado no AI Center autônomo
    • Instalar e usar
      • Requisitos de Hardware
      • Requisitos do servidor SQL
    • Experiência de primeira execução
      • Ative a licença
      • Crie um projeto no AI Center
      • Carregar os Pacotes de ML do Document Understanding
      • Criar uma sessão de rotulagem de dados
      • Inicie a sessão de rotulagem de dados
    • Implantar o UiPathDocumentOCR
    • Implante um Pacote de ML pré-configurado
      • Criar um Pacote de ML de Faturas
      • Implantar o Pacote de ML de Faturas como uma Habilidade de ML
    • Instalação offline de pacotes de ML
    • Use o Document Manager
    • Usar o Framework
      • Usar modelos do Document Understanding (incluindo UiPathDocumentOCR)
  • Aprendizagem profunda
    • Treinamento de modelos de alto desempenho
      • Crie um modelo de ML de alto desempenho
        • 5. Configure os campos
        • 6. Rotule o conjunto de dados de treinamento
        • 13. Implante sua automação
  • Licenciamento
    • Endpoints públicos
    • Chave de API
    • Uso na nuvem e local
      • Machine Learning Extractor
    • Lógica de medição e carregamento
    • Informações legais
  • Referências
    • Pacotes de atividades
      • UiPath.Abbyy.Activities
      • UiPath.AbbyyEmbedded.Activities
      • UiPath.DocumentUnderstanding.ML.Activities
      • UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
      • UiPath.IntelligentOCR.Activities
      • UiPath.OCR.Activities
      • UiPath.OCR.Contracts
      • UiPath.DocumentProcessing.Contracts
      • UiPath.OmniPage.Activities
      • UiPath.PDF.Activities
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.
UiPath logo, featuring letters U and I in white

Guia do usuário do Document Understanding.

Última atualização 4 de abr de 2025

Form Extractor

O que é Form Extractor

O Form Extractor é mais adequado para extrair, combinar e relatar informações específicas, analisando a posição da palavra dentro do documento ou detectando uma assinatura.

O Form Extractor utiliza modelos definidos antecipadamente, na fase de projeto. Um conjunto complexo de regras aplica os modelos configurados aos documentos recebidos que devem ser processados, identificando e relatando as informações esperadas.

A atividade vem com um assistente de configuração que ajuda a definir os modelos para os tipos de documentos e campos que você deseja direcionar para a extração de dados.

A atividade oferece suporte à extração de campo simples e campo de tabela e, conforme mencionado anteriormente, pode detectar um campo de assinatura.

Observação:

Mais informações relacionadas ao Form Extractor:

Recomenda-se procurar outros métodos de extração no caso de:

  • haver muitos layouts que precisam ser manipulados
  • os documentos não são apenas distorcidos, rotacionados ou de tamanhos diferentes, mas também manifestam "deformações" (curvas em determinadas áreas).

    Observação:

    Na extração de formulários fixos, para avaliar se os layouts de dois arquivos são iguais, tente sobrepô-los em uma ferramenta, com alguma transparência, para verificar se todo o conteúdo não variável se sobrepõe (após reverter a rotação, distorção e configurando ambas as imagens para a mesma escala).

    Se você notar variabilidade (o conteúdo não variável aparece mais à esquerda / direita / parte superior / inferior para determinadas áreas do documento), os layouts não são considerados iguais.

    O Form Extractor permite definir vários modelos para o mesmo tipo de documento e, durante a execução, ele:

  • identifica o melhor modelo correspondente para o documento recebido e o tipo de documento
  • aplica o algoritmo de correspondência de modelo, com base em âncoras de nível de página, a cada página de onde os dados precisam ser extraídos (páginas ausentes ou repetidas não são suportadas)
  • aplica todas as configurações de âncora ao nível de campo a cada página para capturar valores associados a possíveis correspondências
  • relata as informações identificadas das áreas de valor alvo.

Ele também suporta o ajuste fino do processamento de campos de lista de verificação / booleanos, permitindo a configuração do valor "Sinônimos para Sim" ou "Sinônimos para Não", de acordo com o seu caso de uso.

Este extrator não possui recursos de aprendizado (treinamento) e requer configuração.

Como configurar

Configuração da atividade

O Form Extractor possui duas configurações principais a serem consideradas:

  • o assistente do Gerenciador de Modelos - que permite definir modelos a serem aplicados aos documentos recebidos. Este assistente habilita o Editor de Modelos e as configurações de Interpretação de campo booleano.
  • a configuração MinOverlapPercentage - que permite que você controle quão rigorosa deve ser a correspondência da área de valor. Aceita um valor entre 0 e 100 e controla quais palavras são aceitas ou rejeitadas como parte de um determinado valor, com base em quão bem sua localização se ajusta à área definida no modelo.

Mais informações sobre como usar o assistente de atividade Form Extractor podem ser encontradas aqui.

  • O que é Form Extractor
  • Como configurar
  • Configuração da atividade

Esta página foi útil?

Conectar

Precisa de ajuda? Suporte

Quer aprender? Academia UiPath

Tem perguntas? Fórum do UiPath

Fique por dentro das novidades