document-understanding

latest

false

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário de projetos modernos do Document Understanding

ENTREGA:

Última atualização 4 de abr de 2025

Funcionalidades generativas

A IA generativa é uma forma de tecnologia de IA que aproveita modelos de machine learning (ML) para criar e gerar novo conteúdo, dados ou informações.

A chave para a maioria das tarefas de IA generativa são grandes modelos de idioma (LLMs). Esses são modelos de ML que são treinados em uma grande quantidade de dados de texto, projetados para gerar texto semelhante a textos humanos. Os LLMs também podem entender e responder a solicitações formulando frases ou parágrafos de maneira humana.

Anotação generativa

Aplicados principalmente durante o processo de anotação automática de documentos na etapa Criar, esses modelos generativos aceleram o design da taxonomia e ajudam no treinamento de modelos de forma eficiente.

A pré-anotação no Document Understanding é feita usando uma combinação de modelos generativos e especializados, com base no esquema do tipo de documento. O esquema define claramente os campos que você deseja extrair de um tipo de documento específico.

Para obter uma compreensão mais profunda de como a Anotação Generativa funciona e como você pode usá-la de forma eficiente em seus projetos, consulte a página Anotar documentos.

Extração generativa

A extração generativa é uma funcionalidade crucial dentro do Document Understanding^TM que usa o poder de modelos de IA generativa. Esses modelos são configurados usando atividades e são empregados principalmente em tempo de execução para extração de dados.

A extração generativa é capaz de decifrar e extrair informações específicas de documentos não estruturados ou semiestruturados. Por exemplo, pode verificar uma fatura e recuperar detalhes com precisão, como a data, o valor faturado e o nome da empresa. Isso permite a coleta de informações rápida, eficiente e altamente precisa de vários tipos de documentos.

Atividades relacionadas

Dica: para mais informações sobre como usar atividades de extração generativa de forma mais eficiente, consulte a página Extrator generativo – Boas práticas.

Há várias atividades para ajudar você a se beneficiar de funcionalidades de extração generativa:

Pacote de atividades do Document Understanding:
- Extract Document Data, parâmetro Prompt após escolher o Extrator Generativo.
Pacote de atividades de ML do Document Understanding:
- Extração generativa
Pacote de atividades IntelligentOCR:
- Data Extraction Scope, parâmetro ApplyAutoValidation.

Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de extração generativa.

Modelos suportados

The generative extractors available under the Generative Predefined project can be used for the documents described in the following table:

Note: Long Document Complex Layout and Short Document Complex Layout extractors are not currently available in Automation Cloud^TM for Public Sector environments (FedRamp).

Table 1. Supported scenarios for generative extractors
Extrator	Recommended scenario	Provedor	Region availability
Extrator de Layout Simples para Documento Longo	Recommended for long form documents with mostly text and headings. For example, you can use the Long Document Simple Layout Extractor on documents such as lease agreements, master service agreements, or other similar documents.	Azure OpenAI	United Kingdom, Australia, India, Canada
Extrator de layouts complexos para documentos longos	Recommended for long-form documents with complex layouts, such as images, handwritten text, form elements, or distinctive layouts such as floating callout boxes. You can use this extractor on long-form documents like insurance policies, which usually have complex layouts.	Azure OpenAI	United States, European Union, Japan, Singapore
Extrator de layout complexo de documento curto	Recommended for shorter documents (of maximum 20 pages) featuring images, handwritten text, form elements, or complex layouts, such as floating callout boxes. You can use this extractor on documents like government IDs or healthcare intake forms that typically have shorter but more complex layouts.	Azure OpenAI	United States, European Union, Japan, Singapore

¹ Multi-modal support refers to the ability to extract different types of data inputs, such as text, images, handwritten text, etc.

Classificação generativa

A classificação generativa usa modelos de IA para classificar automaticamente documentos assim que são carregados.

Esse processo de classificação automática aproveita modelos de ML para "ler" o conteúdo de um documento, entender seu contexto e, consequentemente, classificá-lo em categorias predefinidas. Dessa forma, o sistema pode gerenciar e organizar vários tipos de documentos de forma eficiente.

Ao classificar com precisão documentos não estruturados ou semiestruturados, a Classificação Generativa melhora o fluxo de trabalho de processamento de documentos, economiza tempo e aprimora o gerenciamento geral de documentos.

Atividades relacionadas

Dica: para mais informações sobre como usar atividades de classificação generativa de forma mais eficiente, consulte a página Classificador generativo – Boas Práticas.

Há várias atividades para ajudar você a se beneficiar de funcionalidades de classificação generativa:

Pacote de atividades do Document Understanding:
- Classificar Documento
Pacote de atividades de ML do Document Understanding:
- Classificador Generativo

Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de classificação generativa.

Validação generativa

A validação generativa é uma funcionalidade distinta no Document Understanding que desempenha um papel importante durante o processo de validação. Essa funcionalidade é usada principalmente após a etapa de extração para validar a pontuação de confiança para a extração feita usando modelos especializados.

Quando a pontuação de confiança de um modelo de ML para uma extração de documento é baixa, a validação generativa é usada para verificar a saída. Esse processo de validação envolve os modelos de ML especializados e generativos trabalhando juntos para garantir precisão.

Se ambos os modelos produzirem a mesma saída, a validação humana pode ser ignorada, levando a uma melhoria significativa na eficiência de tempo da validação. Esse processo não apenas economiza um tempo valioso na etapa de validação de documento, mas também melhora o desempenho de seus modelos empregando um modelo generativo secundário para fazer a verificação cruzada da saída, garantindo um nível maior de precisão.

Atividades relacionadas

Há várias atividades para ajudar você a beneficiar-se de funcionalidades de validação generativa:

Pacote de atividades do Document Understanding:
- Extract Document Data, parâmetro de Validação Automática
Pacote de atividades IntelligentOCR:
- Data Extraction Scope, ApplyAutoValidation e parâmetros AutoValidationConfidenceThreshold

Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de validação generativa.

Nesta página

Anotação generativa
Extração generativa
Atividades relacionadas
Modelos suportados
Classificação generativa
Atividades relacionadas
Validação generativa
Atividades relacionadas

Esta página foi útil?

AnteriorChamadas de API

AvançarModelos prontos para uso

Suporte e serviços

Obtenha a ajuda que você precisa

UiPath Academy

Aprendendo RPA - Cursos de automação

Fórum do UiPath

Fórum da comunidade da Uipath

Confiança e segurança

Termos de Uso

Política de Privacidade

Política de cookies