- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 - tipo de documento
- 1040 Schedule C - tipo de documento
- 1040 Schedule D - tipo de documento
- 1040 Schedule E - tipo de documento
- 1040x - tipo de documento
- 3949a - tipo de documento
- 4506T - tipo de documento
- 709 - tipo de documento
- 941x - tipo de documento
- 9465 - tipo de documento
- ACORD125 — tipo de documento
- ACORD126 — tipo de documento
- ACORD131 — tipo de documento
- ACORD140 — tipo de documento
- ACORD25 - tipo de documento
- Extratos bancários - tipo de documento
- ConhecimentoDeEmbarque - tipo de documento
- Certificado de Constituição - tipo de documento
- Certificado de origem — tipo de documento
- Cheques - tipo de documento
- Certificado de Segurança de Produto Secundário - tipo de documento
- CMS1500 — tipo de documento
- Declaração de Conformidade da UE - tipo de documento
- Demonstrações financeiras - tipo de documento
- FM1003 — tipo de documento
- I9 - tipo de documento
- Cartões de identificação — tipo de documento
- Faturas - tipo de documento
- Faturas da Austrália - tipo de documento
- FaturasChina - Tipo de documento
- Faturas em hebraico - tipo de documento
- Faturas da Índia - Tipo de documento
- Faturas do Japão - tipo de documento
- Envio de faturas - tipo de documento
- Listas de embalagem - tipo de documento
- Contracheques — tipo de documento
- Passaportes - tipo de documento
- Pedidos de compra - tipo de documento
- Recibos - tipo de documento
- Recibos Japão - tipo de documento
- Avisos de remessas - tipo de documento
- UB04 - tipo de documento
- Contas de serviços - tipo de documento
- Títulos de veículos - tipo de documento
- W2 - Tipo de documento
- W9 - tipo de documento
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
- Solução de problemas

Guia do usuário de projetos modernos do Document Understanding
Funcionalidades generativas
A IA generativa é uma forma de tecnologia de IA que aproveita modelos de machine learning (ML) para criar e gerar novo conteúdo, dados ou informações.
A chave para a maioria das tarefas de IA generativa são grandes modelos de idioma (LLMs). Esses são modelos de ML que são treinados em uma grande quantidade de dados de texto, projetados para gerar texto semelhante a textos humanos. Os LLMs também podem entender e responder a solicitações formulando frases ou parágrafos de maneira humana.
Aplicados principalmente durante o processo de anotação automática de documentos na etapa Criar, esses modelos generativos aceleram o design da taxonomia e ajudam no treinamento de modelos de forma eficiente.
A pré-anotação no Document Understanding é feita usando uma combinação de modelos generativos e especializados, com base no esquema do tipo de documento. O esquema define claramente os campos que você deseja extrair de um tipo de documento específico.
Para obter uma compreensão mais profunda de como a Anotação Generativa funciona e como você pode usá-la de forma eficiente em seus projetos, consulte a página Anotar documentos.
A extração generativa é uma funcionalidade crucial dentro do Document UnderstandingTM que usa o poder de modelos de IA generativa. Esses modelos são configurados usando atividades e são empregados principalmente em tempo de execução para extração de dados.
A extração generativa é capaz de decifrar e extrair informações específicas de documentos não estruturados ou semiestruturados. Por exemplo, pode verificar uma fatura e recuperar detalhes com precisão, como a data, o valor faturado e o nome da empresa. Isso permite a coleta de informações rápida, eficiente e altamente precisa de vários tipos de documentos.
- Pacote de atividades do Document Understanding:
- Extract Document Data, parâmetro Prompt após escolher o Extrator Generativo.
- Pacote de atividades de ML do Document Understanding:
- Pacote de atividades IntelligentOCR:
- Data Extraction Scope, parâmetro ApplyAutoValidation.
Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de extração generativa.
Extrator | Cenário recomendado | Provedor | Disponibilidade de região | Suporte multimodal1 |
---|---|---|---|---|
Extrator de Layout Simples para Documento Longo | Recomendado para documentos de forma longa contendo principalmente texto e cabeçalhos. Por exemplo, você pode usar o Long Document Simple Layout Extractor em documentos como acordos de locação, acordos mestre de serviço ou outros documentos semelhantes. | Azure OpenAI | Reino Unido, Austrália, Índia, Canadá | |
Extrator de layouts complexos para documentos longos | Recomendado para documentos de formato longo com layouts complexos, como imagens, texto manuscrito, elementos de formulário ou layouts distintos, como caixas de texto explicativo flutuantes. Você pode usar esse extrator em documentos de forma longa, como apólices de seguro, que geralmente possuem layouts complexos. | Azure OpenAI | Estados Unidos, União Europeia, Japão, Singapura | |
Extrator de layout complexo de documento curto | Recomendado para documentos mais curtos (de no máximo 20 páginas) com imagens, texto manuscrito, elementos de formulário ou layouts complexos, como caixas de texto explicativo flutuantes. Você pode usar esse extrator em documentos, como IDs do governo ou formulários de entrada de saúde, que normalmente têm layouts mais curtos, mas mais complexos. | Azure OpenAI | Estados Unidos, União Europeia, Japão, Singapura |
1 O suporte multimodal refere-se à capacidade de extrair diferentes tipos de entradas de dados, como texto, imagens, texto manuscrito etc.
A classificação generativa usa modelos de IA para classificar automaticamente documentos assim que são carregados.
Esse processo de classificação automática aproveita modelos de ML para "ler" o conteúdo de um documento, entender seu contexto e, consequentemente, classificá-lo em categorias predefinidas. Dessa forma, o sistema pode gerenciar e organizar vários tipos de documentos de forma eficiente.
Ao classificar com precisão documentos não estruturados ou semiestruturados, a Classificação Generativa melhora o fluxo de trabalho de processamento de documentos, economiza tempo e aprimora o gerenciamento geral de documentos.
- Pacote de atividades do Document Understanding:
- Pacote de atividades de ML do Document Understanding:
Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de classificação generativa.
A validação generativa é uma funcionalidade distinta no Document Understanding que desempenha um papel importante durante o processo de validação. Essa funcionalidade é usada principalmente após a etapa de extração para validar a pontuação de confiança para a extração feita usando modelos especializados.
Quando a pontuação de confiança de um modelo de ML para uma extração de documento é baixa, a validação generativa é usada para verificar a saída. Esse processo de validação envolve os modelos de ML especializados e generativos trabalhando juntos para garantir precisão.
Se ambos os modelos produzirem a mesma saída, a validação humana pode ser ignorada, levando a uma melhoria significativa na eficiência de tempo da validação. Esse processo não apenas economiza um tempo valioso na etapa de validação de documento, mas também melhora o desempenho de seus modelos empregando um modelo generativo secundário para fazer a verificação cruzada da saída, garantindo um nível maior de precisão.
- Pacote de atividades do Document Understanding:
- Extract Document Data, parâmetro de Validação Automática
- Pacote de atividades IntelligentOCR:
- Data Extraction Scope, ApplyAutoValidation e parâmetros AutoValidationConfidenceThreshold
Você também pode usar APIs do Document Understanding para aproveitar funcionalidades de validação generativa.