document-understanding
latest
false
- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Detalhes do modelo
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Dados e segurança
- Lógica de licenciamento e carregamento
Importante :
A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Document Understanding classic user guide
Última atualização 23 de abr de 2026
Atividades IntelligentOCR
With Intelligent OCR activities you can process documents in a comprehensive manner, allowing you to not only digitize, extract, classify, and validate documents, but also train your extractor and classifiers on your specific data, so they can be faster and more accurate. The steps involved in creating Document UnderstandingTM processes using Intelligent OCR activities are:
- Create the Taxonomy: Define document types and convert them into a Document Object Model variable using the Load Taxonomy activity.
- Digitize documents: Prepare documents so robots can process them using an OCR engine, by storing their text inside a String variable, and basic information about them inside a Document Object Model file.
- Classify documents: Prepare documents using certain classifiers, so robots can identify what types of files they're processing.
- Validate the classification of documents: Verify and validate that the documents have been correctly classified.
- Train your classifiers: Configure your classifiers based on input received while validating the classification
- Extract data from documents: Identify and extract specific information from your documents using various extractors to send it for validation.
- Validate the extractions documents: Verify and validate the documents you processed, classified, and extracted, using the input of your team members within Action Center.
- Train your extractors: Configure your extractors based on input received while validating the extraction.
- Consume exported data: Once you validate the extracted data, you can use it as it is or export it as a DataSet variable using the Export Extraction Results activity.
Antes de começar
Antes de começar a usar o IntelligentOCR.Activities, verifique as seguintes características:
- Alta configurabilidade, que também envolve uma alta curva de aprendizado.
- A presença de vários objetos e atividades, projetados para atender à flexibilidade.
- Reutilização reduzida, devido às seguintes complexidades:
- Você precisa configurar várias configurações dentro do fluxo de trabalho.
- Você precisa passar argumentos explícitos de uma atividade para outra repetidamente, como:
- Taxonomia
- Modelo de Objeto do Documento
- Texto
- Resultados de Classificação
- Resultados da extração