document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white
Document Understanding Modern Projects User Guide
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 11 de nov de 2024

Tipos de Documento

Um tipo de documento é a definição de um tipo lógico de documento que diferentes processos de negócios devem administrar.

O que é um tipo de documento e o que ele pode conter?

Os tipos de documento incluem faturas, históricos médicos, formulários do Imposto de Renda W-2, contratos e outros. Um tipo de documento, além de um nome, grupo e categoria, geralmente contém uma coleção de campos.

Por exemplo, as faturas geralmente contêm as seguintes informações:
  • Nome do fornecedor, endereço do fornecedor, nome do faturamento, endereço do faturamento
  • Número de fatura, número de ordem de compra, condições de pagamento, data de vencimento
  • Valor líquido, valor do imposto, desconto, valor total
  • Número de IVA, Taxa de IVA
  • Número de conta bancária, nome do banco, SWIFT, IBAN
Figura 1. Exemplo de fatura

Formatos de tipos de documento

Os tipos de documento podem ser classificados com base em seu formato. Alguns tipos de documentos têm conteúdo muito estruturado, enquanto outros consistem principalmente em texto livre.

Os documentos são classificados em três formatos principais:
  • Structured
  • Semiestruturado
  • Não estruturado
Observação: os documentos podem ser muitas vezes uma combinação dessas três categorias. Um arquivo pode ter um cabeçalho estruturado, seguido por um conteúdo não estruturado de forma livre. Eles também podem conter conteúdo não estruturado com informações específicas que sempre aparecem em um contexto muito estruturado ou de repetição.

Documentos estruturados

Os documentos estruturados incluem:
  • Pesquisas
  • Questionários
  • Declarações de imposto
  • Passaportes
  • Licenças
  • Folhas de ponto

Esses documentos destinam-se a coletar informações em um formato específico. Eles geralmente contêm pares de chave-valor, tabelas, texto escrito à mão, assinaturas e caixas de seleção. Esses documentos orientam o usuário fornecendo áreas precisas para inserir cada dado. Esses documentos são comumente chamados formulários e são usados para coletar dados de baixa diversidade.

Figura 2. Carteira de motorista, um exemplo de um documento estruturado docs image

Documentos semiestruturados

Documentos semiestruturados são documentos que não seguem um formato estrito, como os formulários estruturados, e não estão associados a campos de dados especificados. Eles não têm uma forma fixa, mas seguem um formato suficientemente comum. Eles contêm partes fixas e variáveis, como tabelas. Eles também podem conter parágrafos, mas os dados são encontrados principalmente em pares de chaves-valores. Os documentos semiestruturados incluem:
  • Faturas
  • Recebimentos
  • Ordens de compra
  • Relatórios do laboratórios de exames médicos
  • Extratos bancários
  • Contas de serviços
Figura 3. Fatura, um exemplo de um documento semiestruturado docs image

Documentos não estruturados

Os documentos não estruturados são arquivos que não seguem um modelo específico ou organizado. Eles não têm um formato fixo, e as informações que eles contêm são frequentemente apresentadas de maneira não estruturada, tornando difícil para os robôs processarem. Embora os seres humanos possam entender facilmente esses documentos, os dados podem ser difíceis para as máquinas interpretarem. Os documentos não estruturados podem assumir muitas formas, incluindo:
  • Contratos
  • Locações
  • Relatórios anuais
  • Contratos
  • Artigos de notícias
Figura 4. Contrato de licença, um exemplo de um documento não estruturado docs image

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.