- Visão geral
- Introdução
- Suporte a idiomas
- Relação do AI Center com a compreensão de documentos
- Processo do Document Understanding
- Processo do Document Understanding: modelo Studio
- Tutoriais de início rápido
- Como extrair dados de recibos
- Faturas retreinadas com um campo adicional
- Como extrair dados de formulários
- Componentes do framework
- Taxonomia
- Visão geral da taxonomia
- Gerenciador de Taxonomia
- Atividades relacionadas à taxonomia
- Digitalização
- Visão geral da digitalização
- Mecanismos OCR
- Atividades relacionadas à digitalização
- Classificação de Documento
- Visão geral da classificação de documentos
- Assistente para configurar classificadores de Classificar Escopo de Documento
- Classificador baseado em palavra-chave
- Requisitos especiais
- Intelligent Keyword Classifier
- Requisitos especiais
- Classificador do FlexiCapture
- Machine Learning Classifier
- Atividades relacionadas à classificação de documentos
- Validação da classificação de documentos
- Visão geral da validação da classificação de documentos
- Classification Station
- Atividades relacionadas à validação de classificação de documentos
- Treinamento em classificação de documentos
- Visão geral do treinamento em classificação de documentos
- Assistente para configurar classificadores do Train Classifiers Scope
- Machine Learning Classifier Trainer
- Atividades relacionadas ao treinamento em classificação de documentos
- Extração de Dados
- Visão geral de extração de dados
- Assistente para configurar extratores de Escopo de Extração de Dados
- Regex Based Extractor
- Requisitos especiais
- Form Extractor
- Requisitos especiais
- Intelligent Form Extractor
- Requisitos especiais
- Machine Learning Extractor
- Extrator do FlexiCapture
- Atividades relacionadas à extração de dados
- Validação de extração de dados
- Visão geral da validação de extração de dados
- Validation Station
- Atividades relacionadas à validação de extração de dados
- Treinamento em extração de dados
- Visão geral do treinamento em extração de dados
- Assistente para configurar extratores de Train Extractors Scope
- Machine Learning Extractor Trainer
- Atividades relacionadas ao treinamento em extração de dados
- Consumo de dados
- Visão geral do consumo de dados
- Atividades relacionadas ao consumo de dados
- Pacotes de ML
- Sobre os pacotes de ML
- Requisitos de Hardware
- Idiomas suportados
- OCR
- Pacotes de ML
- Outros Serviços
- Configuração de OCR
- Pipelines
- Sobre pipelines
- Pipelines de treinamento
- Pipelines de avaliação
- Pipelines completos
- Ajuste fino
- O loop de ajuste fino automático (pré-visualização pública)
- Gerenciador de Dados
- Sobre o Data Manager
- Acessar Data Manager
- Criar e configurar campos
- Usar um esquema pré-definido
- Importar documentos
- Rotular documentos
- Pesquisar documentos
- Exportar documentos
- Caixas de seleção e assinaturas
- Serviços de OCR
- Serviços de OCR
- Document Understanding implantado no Automation Suite
- Instalar e usar
- Experiência de primeira execução
- Implantar o UiPathDocumentOCR
- Implante um Pacote de ML pré-configurado
- Instalação offline de pacotes de ML
- Pacotes offline 2022.4.15
- Pacotes offline 2022.4.14
- Pacotes offline 2022.4.13
- Pacotes offline 2022.4.12
- Pacotes offline 2022.4.11
- Pacotes offline 2022.4.9
- Pacotes offline 2022.4.7
- Pacotes offline 2022.4.5
- Pacotes offline 2022.4.0
- Use o Document Manager
- Usar o Framework
- Document Understanding implantado no AI Center autônomo
- Instalar e usar
- Requisitos de Hardware
- Requisitos do servidor SQL
- Experiência de primeira execução
- Ative a licença
- Crie um projeto no AI Center
- Carregar os Pacotes de ML do Document Understanding
- Criar uma sessão de rotulagem de dados
- Inicie a sessão de rotulagem de dados
- Implantar o UiPathDocumentOCR
- Implante um Pacote de ML pré-configurado
- Criar um Pacote de ML de Faturas
- Implantar o Pacote de ML de Faturas como uma Habilidade de ML
- Instalação offline de pacotes de ML
- Use o Document Manager
- Usar o Framework
- Usar modelos do Document Understanding (incluindo UiPathDocumentOCR)
- Aprendizagem profunda
- Treinamento de modelos de alto desempenho
- Crie um modelo de ML de alto desempenho
- 5. Configure os campos
- 6. Rotule o conjunto de dados de treinamento
- 13. Implante sua automação
- Licenciamento
- Endpoints públicos
- Chave de API
- Uso na nuvem e local
- Machine Learning Extractor
- Lógica de medição e carregamento
- Informações legais
- Referências
- Pacotes de atividades
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities

Guia do usuário do Document Understanding.
O Form Extractor é mais adequado para extrair, combinar e relatar informações específicas, analisando a posição da palavra dentro do documento ou detectando uma assinatura.
O Form Extractor utiliza modelos definidos antecipadamente, na fase de projeto. Um conjunto complexo de regras aplica os modelos configurados aos documentos recebidos que devem ser processados, identificando e relatando as informações esperadas.
A atividade vem com um assistente de configuração que ajuda a definir os modelos para os tipos de documentos e campos que você deseja direcionar para a extração de dados.
A atividade oferece suporte à extração de campo simples e campo de tabela e, conforme mencionado anteriormente, pode detectar um campo de assinatura.
Mais informações relacionadas ao Form Extractor:
- Página da atividade Form Extractor
- Gerenciador de Taxonomia - instruções de configuração
- Assistente do Gerenciador de Modelo - instruções de configuração
- Exemplo de fluxo de trabalho ancorado
Recomenda-se procurar outros métodos de extração no caso de:
- haver muitos layouts que precisam ser manipulados
-
os documentos não são apenas distorcidos, rotacionados ou de tamanhos diferentes, mas também manifestam "deformações" (curvas em determinadas áreas).
Observação:Na extração de formulários fixos, para avaliar se os layouts de dois arquivos são iguais, tente sobrepô-los em uma ferramenta, com alguma transparência, para verificar se todo o conteúdo não variável se sobrepõe (após reverter a rotação, distorção e configurando ambas as imagens para a mesma escala).
Se você notar variabilidade (o conteúdo não variável aparece mais à esquerda / direita / parte superior / inferior para determinadas áreas do documento), os layouts não são considerados iguais.
O Form Extractor permite definir vários modelos para o mesmo tipo de documento e, durante a execução, ele:
- identifica o melhor modelo correspondente para o documento recebido e o tipo de documento
- aplica o algoritmo de correspondência de modelo, com base em âncoras de nível de página, a cada página de onde os dados precisam ser extraídos (páginas ausentes ou repetidas não são suportadas)
- aplica todas as configurações de âncora ao nível de campo a cada página para capturar valores associados a possíveis correspondências
- relata as informações identificadas das áreas de valor alvo.
Ele também suporta o ajuste fino do processamento de campos de lista de verificação / booleanos, permitindo a configuração do valor "Sinônimos para Sim" ou "Sinônimos para Não", de acordo com o seu caso de uso.
Este extrator não possui recursos de aprendizado (treinamento) e requer configuração.
Configuração da atividade
O Form Extractor possui duas configurações principais a serem consideradas:
- o assistente do Gerenciador de Modelos - que permite definir modelos a serem aplicados aos documentos recebidos. Este assistente habilita o Editor de Modelos e as configurações de Interpretação de campo booleano.
- a configuração MinOverlapPercentage - que permite que você controle quão rigorosa deve ser a correspondência da área de valor. Aceita um valor entre
0e100e controla quais palavras são aceitas ou rejeitadas como parte de um determinado valor, com base em quão bem sua localização se ajusta à área definida no modelo.
Mais informações sobre como usar o assistente de atividade Form Extractor podem ser encontradas aqui.