- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Visão geral
- Atividades do Document Understanding
- Chamadas de API
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Guia do usuário do Document Understanding.
Atividades do Document Understanding
Com o DocumentUnderstanding.Activities, você pode gerenciar documentos usando uma abordagem unificada, armazenando todas as informações do processo do Document UnderstandingTM dentro de um objeto Dados de documentos. Além disso, o DocumentUnderstanding.Activities é integrado a projetos Modernos, permitindo a reutilização.
Estamos cientes das limitações atuais que o pacote DocumentUnderstanding.Activities tem, pois planejamos resolvê-las em breve. As seguintes funcionalidades ainda não estão disponíveis:
- Compatibilidade com divisão de documentos.
- Regras de negócios.
- Modelos de treinamento.
- Compatibilidade com modelos de tenants diferentes de onde a automação é implantada.
- Compatibilidade com o Automation Suite.
As seções abaixo descrevem cada fase do processo do Document Understanding usando as atividades Document Understanding.
O processamento de documentos envolve a preparação dos arquivos PDF para extração. Com as atividades Document Understanding, você pode:
- Extraia texto, imagens, páginas específicas ou mescle vários PDFs.
- Alterar a senha de documentos de PDF criptografados
Para processar arquivos PDF com atividades Document Understanding, use as seguintes atividades:
Atividade | Description |
---|---|
Definir Senha do PDF | Altera a senha de um arquivo PDF especificado. |
Merge PDFs | Associa uma coleção de objetos de arquivo. |
Get PDF Page Count | Fornece o número total de páginas em um arquivo PDF. |
Extract PDF Text | Extrai o texto de um documento PDF. |
Extract PDF Images | A atividade extrai todas as imagens que encontra no arquivo PDF. |
Extract PDF Page Range | Extrai um intervalo especificado de páginas de um documento PDF. |
Use a atividade Extract Document Data para:
- Extrair dados de um arquivo de entrada salvo como um objeto Document Data.
- Armazenar os resultados da extração no mesmo objeto Document Data.
O Document Data é um recurso que serve como uma variável de entrada e saída dentro dos seus fluxos de trabalho do Document Understanding. O objeto Document Data contém todas as informações necessárias sobre um único documento. Se você classificar um documento, o objeto inclui o Tipo de documento. Se você extrair dados, o objeto contém os campos extraídos correspondentes. Independentemente da atividade, o Document Data contém consistentemente o texto do documento e o DOM (Modelo de Objeto de Documento).
Forneça o arquivo como entrada apenas na primeira vez que você usar Extract Document Data. A saída, conhecida como Documento Data, deve ser reutilizada em todo o fluxo de trabalho para evitar uma nova digitalização mesmo arquivo, que custa 1 AI Unit por página.
Acesse Document Data para obter mais detalhes.
Use a atividade Classify Document para:
- Escolher entre vários modelos de classificação.
- Produza os dados classificados em um objeto Document Data.
A etapa de validação do processo de documentos significa enviar os documentos processados para validação com membros da sua equipe dentro do Action Center. Você também pode configurar o processo de validação de documentos no Action Center usando as seguintes atividades:
Atividade | Description |
---|---|
Create Validation Task | Cria uma ação de validação para suspender o fluxo de trabalho até que seja concluído. |
Aguarde a tarefa de validação e retome | Pausa a ação até que a validação seja concluída e, em seguida, retoma-a automaticamente. |
Criar tarefa de validação e aguardar | Cria uma ação no Action Center para visualizar e modificar resultados da extração e pausa o fluxo de trabalho até que a ação seja concluída. |
Create Classification Validation Task | Cria uma ação para verificar dados de documentos classificados sem aguardar sua conclusão. |
Create Classification Validation Task and Wait | Cria uma ação para verificar dados classificados e aguarda sua conclusão antes de retomar o fluxo de trabalho. |
Aguardar a tarefa de Validação de Classificação e retomar | Aguarda uma ação de Validação de classificação para concluir antes de retomar o fluxo de trabalho. |