Clipboard AI
Mais recente
falso
  • Visão geral
    • Introdução
  • Configuração e Instalação
  • Mapeamento de dados
    • Mapeador de dados
    • Extratores de dados
    • Transformações
  • Privacidade de dados
Imagem de fundo do banner
Guia do usuário do Clipboard AI (beta público)
Última atualização 18 de mar de 2024

Extratores de dados

Importante: o UiPath Clipboard AI está atualmente em versão beta pública.

Os extratores de dados podem ser usados para recuperar as informações relevantes de vários documentos e outras fontes.

Ao falar sobre tipos de documentos, há três categorias principais:

  • Documentos estruturados - têm um formato fixo e são fáceis de processar, orientando você a preencher os dados necessários em campos precisos. Esses documentos são projetados para abranger um certo tipo de dados. Exemplos de documentos estruturados: formulários de impostos, pesquisas, questionários etc.
  • Documentos semiestruturados - têm tanto um formato fixo quanto partes variáveis. Os documentos semi-estruturados não têm um formato fixo no sentido de que não estão associados a campos de dados especificados, como documentos estruturados, mas contêm um conjunto previsível de informações; por exemplo, uma fatura sempre contém um identificador exclusivo, uma data ou um número de fatura, mas o posicionamento pode variar dependendo do provedor. Esses documentos contêm principalmente pares de label:value e também podem conter parágrafos. Exemplo de documentos semi-estruturados: faturas, recibos, ordens de compra, contas de serviços públicos etc.
  • Documentos não estruturados - as informações não estão organizadas de acordo com um formato fixo. Esses documentos contêm principalmente texto simples; a maior parte dos dados está em forma não estruturada dentro do texto. Exemplos de documentos não estruturados: contratos, emails, registros de saúde etc.

Os extratores de dados podem diferir com base em como extraem dados de documentos. A esse respeito, há dois tipos de extratores:

  • Extratores de saída fixa - treinados para extrair um conjunto predefinido de informações de um documento; por exemplo, o extrator de Fatura sempre tenta extrair o nome da empresa, endereço, soma total etc.
  • Extratores de respostas a perguntas - treinados para responder a perguntas com base em um determinado contexto. Esses extratores dependem do entendimento de linguagem natural para analisar o texto e descobrir qual é o valor exato que precisa ser extraído do texto e fornecer uma resposta apropriada ou até mesmo escolher uma opção em uma lista de opções dadas.

Agora que explicamos as diferenças essenciais entre layouts de documentos e tipos de extratores de dados, podemos analisar o próprio conjunto de extratores de dados do Clipboard AI:

  • Extratores de Documentos específicos
  • Extrator de Texto simples
  • Extrator de Tabelas e pares de nomes-valores
  • Extrator Semiestruturado

Um extrator é escolhido automaticamente ao copiar os dados. Os resultados de cada extrator são muito diferentes; por isso, é altamente recomendável experimentar todos eles e ver qual extrator é mais adequado para seu documento.

Para usar um extrator diferente daquele selecionado automaticamente, selecione o botão Alterar tipo na parte inferior do Mapeador. Isso abre o painel Extratores de dados, no qual você pode selecionar outro extrator na lista. Depois que um novo extrator for selecionado, os campos de dados são atualizados no Mapeador e você pode comparar os resultados.

Extratores de Documentos específicos

Os extratores de Documentos específicos são um conjunto de saída fixa de extratores treinados em tipos de documentos específicos. Cada tipo de documento é extraído usando seu modelo correspondente de machine learning do Document Understanding, da seguinte forma:

  • Fatura
  • Passaporte
  • Recibo
  • Cartão de Identificação
  • Formulário W-2
  • Conta de serviço
  • Ordem de compra
  • Formulários Web/desktop

O tipo de documento identificado automaticamente é destacado e marcado com uma estrela. Para qualquer outro tipo de documento, exceto aqueles listados, use um dos outros extratores.

Extrator de Texto simples

O extrator de Texto simples é um extrator de respostas a perguntas que usa o GPT3 para recuperar dados de documentos de texto simples, páginas da web, emails etc. Ele pode ser usado para documentos semiestruturados para lidar com as partes variáveis ou para documentos não estruturados em que o layout é irrelevante.

Esse extrator é compatível com o entendimento semântico e, além de respostas a perguntas, tem outros recursos avançados, como resumo, tradução de máquina, classificação do tipo de documento e detecção de sentimentos.

Extrator de Tabelas e pares de nomes-valores

O extrator de Tabelas e pares de nomes-valores é um extrator de saída fixa que funciona melhor para documentos que contêm pares label:value (por exemplo, Nome: John, Sobrenome: Doe) e tabelas.

Extrator Semiestruturado

O extrator Semiestruturado é um extrator de respostas a perguntas e, como o nome sugere, pode extrair dados de documentos semiestruturados diferentes daqueles cobertos pelos extratores de Documentos específicos. Por exemplo, você pode usar esse extrator para extratos bancários, instrumentos de venda, formulários de impostos etc.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.