Document Understanding — Principais conceitos

document-understanding

latest

false

Guia do usuário do Document Understanding.

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Conceitos-chave

Conceitos-chave para o Document Understanding no Automation Cloud, incluindo aprendizado ativo, treinamento de modelos e os componentes principais da experiência moderna de projeto.

Familiarize-se com os conceitos centrais em torno do UiPath® Document Understanding^TM.

Aprendizado ativo

O aprendizado ativo é nossa abordagem moderna para a criação de modelos para o Document Understanding^TM.

O aprendizado ativo fornece uma experiência interativa na qual o algoritmo de aprendizado pode consultar o usuário para rotular dados com as saídas desejadas. Esse processo ajuda a reduzir o tempo e os dados necessários para treinar um modelo de machine learning em até 80%. A IA é usada para orientar o processo, que inclui anotação automática, que normalmente é a tarefa mais demorada. O modelo também fornece recomendações de especialistas para melhorar a precisão usando os conjuntos de dados mais informativos.

Figura 1. Como o Aprendizado Ativo funciona

Usando o aprendizado ativo, você também pode monitorar suas automações por meio de recursos analíticos.

Tipos de Documento

Um tipo de documento refere-se à classificação ou categorização de um documento com base em seu conteúdo, formato, finalidade ou outros fatores de distinção. Alguns exemplos podem incluir faturas, recibos, contratos, relatórios, prontuários médicos, documentos legais e outros.

Alguns tipos de documentos têm conteúdo altamente estruturado, enquanto outros consistem principalmente em texto livre. Com base nisso, os documentos são classificados em três formatos principais:

Estruturado: os documentos destinam-se a coletar informações em um formato específico. Por exemplo, pesquisas, declarações de imposto, passaportes ou licenças são todos documentos estruturados.
Semiestruturado: documentos que não seguem um formato estrito e não estão associados a campos de dados especificados. Os documentos semiestruturados incluem faturas, recibos, contas de serviços públicos, extratos bancários e outros.
Não estruturado: documentos que não seguem um modelo específico ou organizado. Por exemplo, contratos, locações ou artigos de notícias são todos documentos não estruturados.

Para saber mais sobre os tipos de documento, consulte a seção Tipos de documento.

IA generativa

Observação:

A disponibilidade de funcionalidades depende da plataforma de nuvem que você usa. Para detalhes, consulte a página Escolhendo o tipo de implantação.

A IA generativa é uma forma de tecnologia de IA que aproveita modelos de machine learning (ML) para criar e gerar novo conteúdo, dados ou informações.

A chave para a maioria das tarefas de IA generativa são grandes modelos de idioma (LLMs). Esses são modelos de ML que são treinados em uma grande quantidade de dados de texto, projetados para gerar texto semelhante a textos humanos. Os LLMs também podem entender e responder a solicitações formulando frases ou parágrafos de maneira humana.

No contexto do Document Understanding^TM, a IA generativa ajuda com:

Extração de informações: os modelos de IA generativa podem ser usados para extrair informações específicas de documentos não estruturados ou semiestruturados. Por exemplo, ele pode examinar uma fatura para recuperar detalhes como data, valor cobrado e nome da empresa.
Classificação de documento: os modelos de ML são usados para categorizar automaticamente documentos com base em seu conteúdo. Esses algoritmos "leem" o documento, entendem seu contexto e podem classificá-lo em categorias predefinidas.
Validação de dados: a IA generativa pode verificar a saída do modelo de ML sempre que a pontuação de confiança estiver muito baixa. Se ambos os modelos de ML (generativo e especializado) tiverem a mesma saída, um humano pode ignorar a validação desse documento. Isso pode melhorar o tempo gasto na validação de documentos, bem como melhorar o desempenho de seus modelos, verificando a saída com a ajuda de um segundo modelo generativo.

Modelos de ML

Os modelos de ML são como assistentes virtuais que foram treinados para aprender com dados e fazer previsões ou tomar decisões. Esses modelos são essencialmente algoritmos que aprendem a reconhecer padrões com base em dados históricos. Quanto mais dados aos quais eles estiverem expostos, mais eles podem aprimorar suas previsões ou decisões ao longo do tempo.

Você pode encontrar vários modelos de ML prontos para uso no Document Understanding^TM. Esses modelos ajudam você a classificar e extrair quaisquer pontos de dados que ocorrem comumente de documentos semiestruturados ou não estruturados, sem configuração necessária.

Verifique a página Tipos de documento pré-treinados para obter a lista completa de modelos pré-treinados e seus campos.

Os modelos de ML podem ser treinados em uma maioria de idiomas, desde que o OCR reconheça o documento e o texto com alta confiança.

Reconhecimento de caracteres óptico

O reconhecimento óptico de caracteres (OCR) é uma tecnologia especial usada para converter diferentes tipos de documentos, como documentos de papel digitalizados, arquivos PDF ou imagens obtidas por uma câmera digital, em dados editáveis e pesquisáveis.

A precisão de um mecanismo de OCR depende da qualidade do documento original. Um texto limpo e bem formatado em uma fonte legível normalmente produz a melhor saída.

Para obter mais informações sobre os idiomas compatíveis com as opções de mecanismos de OCR fornecidas pela UiPath®, consulte a página Idiomas compatíveis com OCR .

Nesta página

Aprendizado ativo
Tipos de Documento
IA generativa
Modelos de ML
Reconhecimento de caracteres óptico

Esta página foi útil?

AnteriorRecursos fundamentais

AvançarDisponibilidade de funcionalidades em projetos modernos do Document Understanding

Aprendizado ativo​

Tipos de Documento​

IA generativa​

Modelos de ML​