- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Visão geral
- Atividades do Document Understanding
- Chamadas de API
- Detalhes do modelo
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Dados e segurança
- Lógica de licenciamento e carregamento

Document Understanding classic user guide
Atividades do Document Understanding
With DocumentUnderstanding.Activities, you can manage documents using a unified approach, by storing every information from the Document UnderstandingTM process within a Document Data object. Moreover, DocumentUnderstanding.Activities is integrated with Modern projects, enabling reusability.
Restrições conhecidas
Estamos cientes das limitações atuais que o pacote DocumentUnderstanding.Activities tem, pois planejamos resolvê-las em breve. As seguintes funcionalidades ainda não estão disponíveis:
- Compatibilidade com divisão de documentos.
- Regras de negócios.
- Modelos de treinamento.
- Compatibilidade com modelos de tenants diferentes de onde a automação é implantada.
- Compatibilidade com o Automation Suite.
1. Processamento de documentos
O processamento de documentos envolve a preparação dos arquivos PDF para extração. Com as atividades Document Understanding, você pode:
- Extraia texto, imagens, páginas específicas ou mescle vários PDFs.
- Alterar a senha de documentos de PDF criptografados
Para processar arquivos PDF com atividades Document Understanding, use as seguintes atividades:
| Atividade | Description |
|---|---|
| Definir Senha do PDF | Altera a senha de um arquivo PDF especificado. |
| Merge PDFs | Associa uma coleção de objetos de arquivo. |
| Get PDF Page Count | Fornece o número total de páginas em um arquivo PDF. |
| Extract PDF Text | Extrai o texto de um documento PDF. |
| Extract PDF Images | A atividade extrai todas as imagens que encontra no arquivo PDF. |
| Extract PDF Page Range | Extrai um intervalo especificado de páginas de um documento PDF. |
2. Extração de dados
Use a atividade Extract Document Data para:
- Extrair dados de um arquivo de entrada salvo como um objeto Document Data.
- Armazenar os resultados da extração no mesmo objeto Document Data.
Document Data is a resource that serves both as an input and output variable, within your Document Understanding workflows. The Document Data object holds all the necessary information about a single document. If you classify a document, the object includes the Document Type. If you extract data, the object contains the corresponding extracted fields. Irrespective of the activity, Document Data consistently contains the document's text and DOM (Document Object Model).
Forneça o arquivo como entrada apenas na primeira vez que você usar Extract Document Data. A saída, conhecida como Documento Data, deve ser reutilizada em todo o fluxo de trabalho para evitar uma nova digitalização mesmo arquivo, que custa 1 AI Unit por página.
Acesse Document Data para obter mais detalhes.
3. Classificação de dados
Use a atividade Classify Document para:
- Escolher entre vários modelos de classificação.
- Produza os dados classificados em um objeto Document Data.
4. Validação de dados
A etapa de validação do processo de documentos significa enviar os documentos processados para validação com membros da sua equipe dentro do Action Center. Você também pode configurar o processo de validação de documentos no Action Center usando as seguintes atividades:
| Atividade | Description |
|---|---|
| Create Validation Task | Cria uma ação de validação para suspender o fluxo de trabalho até que seja concluído. |
| Aguarde a tarefa de validação e retome | Pausa a ação até que a validação seja concluída e, em seguida, retoma-a automaticamente. |
| Criar tarefa de validação e aguardar | Cria uma ação no Action Center para visualizar e modificar resultados da extração e pausa o fluxo de trabalho até que a ação seja concluída. |
| Create Classification Validation Task | Cria uma ação para verificar dados de documentos classificados sem aguardar sua conclusão. |
| Create Classification Validation Task and Wait | Cria uma ação para verificar dados classificados e aguarda sua conclusão antes de retomar o fluxo de trabalho. |
| Aguardar a tarefa de Validação de Classificação e retomar | Aguarda uma ação de Validação de classificação para concluir antes de retomar o fluxo de trabalho. |