document-understanding
latest
false
- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Dados e segurança
- Licenciamento
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário do Document Understanding.
Última atualização 2 de dez de 2025
Com as atividades Intelligent OCR, você pode processar documentos de maneira abrangente, permitindo que você não apenas digitalize, extraia, classifique e valide documentos, mas também treine seu extrator e classificadores em seus dados específicos, para que possam ser mais rápidos e mais precisos. As etapas envolvidas na criação de processos do Document UnderstandingTM usando atividades Intelligent OCR são:
- Criar a Taxonomia: defina tipos de documentos e converta-os em uma variável Document Object Model usando a atividade Load Taxonomy.
- Digitalizar documentos: prepare documentos para que os UiPath Robots possam processá-los usando um mecanismo de OCR, armazenando seu texto dentro de uma variável String e informações básicas sobre eles dentro de um arquivo Modelo de Objeto de Documento.
- Classificar documentos: prepare documentos usando certos classificadores, para que os UiPath Robots possam identificar quais tipos de arquivos eles estão processando.
- Validar a classificação de documentos: verifique e valide se os documentos foram classificados corretamente.
- Treinar seus classificadores: configure seus classificadores com base na entrada recebida ao validar a classificação
- Extrair dados de documentos: identifique e extraia informações específicas de seus documentos usando vários extratores para enviá-los para validação.
- Validar os documentos de extrações: verifique e valide os documentos que você processou, classificou e extraiu, usando a entrada dos membros da sua equipe dentro do Action Center.
- Treinar seus extratores: configure seus extratores com base na entrada recebida ao validar a extração.
- Consumir dados exportados: depois de validar os dados extraídos, você pode usá-los como são ou exportá-los como uma variável DataSet usando a atividade Export Extraction Results.
Antes de começar a usar o IntelligentOCR.Activities, verifique as seguintes características:
- Alta configurabilidade, que também envolve uma alta curva de aprendizado.
- A presença de vários objetos e atividades, projetados para atender à flexibilidade.
- Reutilização reduzida, devido às seguintes complexidades:
- Você precisa configurar várias configurações dentro do fluxo de trabalho.
- Você precisa passar argumentos explícitos de uma atividade para outra repetidamente, como:
- Taxonomia
- Modelo de Objeto do Documento
- Texto
- Resultados de Classificação
- Resultados da extração