- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Pacotes de ML
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- Recibos Japão – Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Endpoints públicos
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer

Guia do usuário de projetos modernos do Document Understanding
Funcionalidades generativas
A IA generativa é uma forma de tecnologia de IA que aproveita modelos de machine learning (ML) para criar e gerar novo conteúdo, dados ou informações.
A chave para a maioria das tarefas de IA generativa são grandes modelos de idioma (LLMs). Esses são modelos de ML que são treinados em uma grande quantidade de dados de texto, projetados para gerar texto semelhante a textos humanos. Os LLMs também podem entender e responder a solicitações formulando frases ou parágrafos de maneira humana.
Aplicados principalmente durante o processo de anotação automática de documentos na etapa Criar, esses modelos generativos aceleram o design da taxonomia e ajudam no treinamento de modelos de forma eficiente.
A pré-anotação no Document Understanding é feita usando uma combinação de modelos generativos e especializados, com base no esquema do tipo de documento. O esquema define claramente os campos que você deseja extrair de um tipo de documento específico.
Para obter uma compreensão mais profunda de como a Anotação Generativa funciona e como você pode usá-la de forma eficiente em seus projetos, consulte a página Anotar documentos.
A extração generativa é uma funcionalidade crucial dentro do Document UnderstandingTM que usa o poder de modelos de IA generativa. Esses modelos são configurados usando atividades e são empregados principalmente em tempo de execução para extração de dados.
A extração generativa é capaz de decifrar e extrair informações específicas de documentos não estruturados ou semiestruturados. Por exemplo, pode verificar uma fatura e recuperar detalhes com precisão, como a data, o valor faturado e o nome da empresa. Isso permite a coleta de informações rápida, eficiente e altamente precisa de vários tipos de documentos.
- Pacote de atividades do Document Understanding:
- Extract Document Data, parâmetro Prompt após escolher o Extrator Generativo.
- Pacote de atividades de ML do Document Understanding:
- Pacote de atividades IntelligentOCR:
- Data Extraction Scope, parâmetro ApplyAutoValidation.
Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de extração generativa.
A classificação generativa usa modelos de IA para classificar automaticamente documentos assim que são carregados.
Esse processo de classificação automática aproveita modelos de ML para "ler" o conteúdo de um documento, entender seu contexto e, consequentemente, classificá-lo em categorias predefinidas. Dessa forma, o sistema pode gerenciar e organizar vários tipos de documentos de forma eficiente.
Ao classificar com precisão documentos não estruturados ou semiestruturados, a Classificação Generativa melhora o fluxo de trabalho de processamento de documentos, economiza tempo e aprimora o gerenciamento geral de documentos.
- Pacote de atividades do Document Understanding:
- Pacote de atividades de ML do Document Understanding:
Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de classificação generativa.
A validação generativa é uma funcionalidade distinta no Document Understanding que desempenha um papel importante durante o processo de validação. Essa funcionalidade é usada principalmente após a etapa de extração para validar a pontuação de confiança para a extração feita usando modelos especializados.
Quando a pontuação de confiança de um modelo de ML para uma extração de documento é baixa, a validação generativa é usada para verificar a saída. Esse processo de validação envolve os modelos de ML especializados e generativos trabalhando juntos para garantir precisão.
Se ambos os modelos produzirem a mesma saída, a validação humana pode ser ignorada, levando a uma melhoria significativa na eficiência de tempo da validação. Esse processo não apenas economiza um tempo valioso na etapa de validação de documento, mas também melhora o desempenho de seus modelos empregando um modelo generativo secundário para fazer a verificação cruzada da saída, garantindo um nível maior de precisão.
- Pacote de atividades do Document Understanding:
- Extract Document Data, parâmetro de Validação Automática
- Pacote de atividades IntelligentOCR:
- Data Extraction Scope, ApplyAutoValidation e parâmetros AutoValidationConfidenceThreshold
Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de validação generativa.