- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 – tipo de documento
- 1040 Agendamento C – tipo de documento
- 1040 Agendamento D – tipo de documento
- 1040 Agendamento E – tipo de documento
- 1040x – tipo de documento
- 3949a – tipo de documento
- 4506T – tipo de documento
- 709 – tipo de documento
- 941x – tipo de documento
- 9465 – tipo de documento
- ACORD125 – tipo de documento
- ACORD126 – tipo de documento
- ACORD131 – tipo de documento
- ACORD140 – tipo de documento
- ACORD25 – tipo de documento
- Extratos bancários – tipo de documento
- Conhecimentos de embarque – tipo de documento
- Certificado de incorporação – tipo de documento
- Certificado de origem – tipo de documento
- Verificações – tipo de documento
- Certificado de produto infantil – tipo de documento
- CMS 1500 – tipo de documento
- Declaração de conformidade UE – tipo de documento
- Demonstrações financeiras – tipo de documento
- FM1003 – tipo de documento
- I9 – tipo de documento
- Cartões de identificação – tipo de documento
- Faturas – tipo de documento
- Faturas2 - tipo de documento
- Faturas Austrália – tipo de documento
- Faturas China – tipo de documento
- Faturas hebraicas – tipo de documento
- Faturas Índia – tipo de documento
- Faturas Japão – tipo de documento
- Faturas de Envio – tipo de documento
- Listas de embalagem – tipo de documento
- Holerites – tipo de documento
- Passaportes – tipo de documento
- Ordens de compra – tipo de documento
- Recibos – tipo de documento.
- Recibos2 - tipo de documento
- Recibos Japão – tipo de documento
- Avisos de Remessa – tipo de documento
- UB04 – tipo de documento
- Divulgações de fechamentos de hipotecas dos EUA - tipo de documento
- Contas de serviços públicos – tipo de documento
- Títulos de veículos – tipo de documento
- W2 – tipo de documento
- W9 – tipo de documento
- Idiomas suportados
- Painéis de insights
- Document Understanding implantado no Automation Suite
- Geração de logs
- Lógica de licenciamento e carregamento
- Como fazer
- Solução de problemas

Document Understanding modern projects user guide
Tipos de Documento
Um tipo de documento é a definição de um tipo lógico de documento que diferentes processos de negócios devem administrar.
O que é um tipo de documento e o que ele pode conter?
Os tipos de documento incluem faturas, históricos médicos, formulários do Imposto de Renda W-2, contratos e outros. Um tipo de documento, além de um nome, grupo e categoria, geralmente contém uma coleção de campos.
Por exemplo, as faturas geralmente contêm as seguintes informações:
- Nome do fornecedor, endereço do fornecedor, nome do faturamento, endereço do faturamento
- Número de fatura, número de ordem de compra, condições de pagamento, data de vencimento
- Valor líquido, valor do imposto, desconto, valor total
- Número de IVA, Taxa de IVA
- Número de conta bancária, nome do banco, SWIFT, IBAN
Figure 1. Invoice example

Formatos de tipos de documento
Os tipos de documento podem ser classificados com base em seu formato. Alguns tipos de documentos têm conteúdo muito estruturado, enquanto outros consistem principalmente em texto livre.
Os documentos são classificados em três formatos principais:
- Structured
- Semiestruturado
- Não estruturado
Documents can often be a combination of these three categories. A file can have a structured heading, followed by an unstructured, free-form content. They can also contain unstructured content with specific information that always appears in a very structured or repeating context.
Documentos estruturados
Os documentos estruturados incluem:
- Pesquisas
- Questionários
- Declarações de imposto
- Passaportes
- Licenças
- Folhas de ponto
Esses documentos destinam-se a coletar informações em um formato específico. Eles geralmente contêm pares de chave-valor, tabelas, texto escrito à mão, assinaturas e caixas de seleção. Esses documentos orientam o usuário fornecendo áreas precisas para inserir cada dado. Esses documentos são comumente chamados formulários e são usados para coletar dados de baixa diversidade.
Figure 2. Driver license, an example of a structured document

Documentos semiestruturados
Documentos semiestruturados são documentos que não seguem um formato estrito, como os formulários estruturados, e não estão associados a campos de dados especificados. Eles não têm uma forma fixa, mas seguem um formato suficientemente comum. Eles contêm partes fixas e variáveis, como tabelas. Eles também podem conter parágrafos, mas os dados são encontrados principalmente em pares de chaves-valores. Os documentos semiestruturados incluem:
- Faturas
- Recebimentos
- Ordens de compra
- Relatórios do laboratórios de exames médicos
- Extratos bancários
- Contas de serviços
Figure 3. Invoice, an example of a semi-structured document

Documentos não estruturados
Os documentos não estruturados são arquivos que não seguem um modelo específico ou organizado. Eles não têm um formato fixo, e as informações que eles contêm são frequentemente apresentadas de maneira não estruturada, tornando difícil para os robôs processarem. Embora os seres humanos possam entender facilmente esses documentos, os dados podem ser difíceis para as máquinas interpretarem. Os documentos não estruturados podem assumir muitas formas, incluindo:
- Contratos
- Locações
- Relatórios anuais
- Contratos
- Artigos de notícias
Figure 4. License agreement, an example of an unstructured document
