- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 - tipo de documento
- 1040 Schedule C - tipo de documento
- 1040 Schedule D - tipo de documento
- 1040 Schedule E - tipo de documento
- 1040x - tipo de documento
- 3949a - tipo de documento
- 4506T - tipo de documento
- 709 - tipo de documento
- 941x - tipo de documento
- 9465 - tipo de documento
- ACORD125 — tipo de documento
- ACORD126 — tipo de documento
- ACORD131 — tipo de documento
- ACORD140 — tipo de documento
- ACORD25 - tipo de documento
- Extratos bancários - tipo de documento
- ConhecimentoDeEmbarque - tipo de documento
- Certificado de Constituição - tipo de documento
- Certificado de origem — tipo de documento
- Cheques - tipo de documento
- Certificado de Segurança de Produto Secundário - tipo de documento
- CMS1500 — tipo de documento
- Declaração de Conformidade da UE - tipo de documento
- Demonstrações financeiras - tipo de documento
- FM1003 — tipo de documento
- I9 - tipo de documento
- Cartões de identificação — tipo de documento
- Faturas - tipo de documento
- Faturas da Austrália - tipo de documento
- FaturasChina - Tipo de documento
- Faturas em hebraico - tipo de documento
- Faturas da Índia - Tipo de documento
- Faturas do Japão - tipo de documento
- Envio de faturas - tipo de documento
- Listas de embalagem - tipo de documento
- Contracheques — tipo de documento
- Passaportes - tipo de documento
- Pedidos de compra - tipo de documento
- Recibos - tipo de documento
- Recibos Japão - tipo de documento
- Avisos de remessas - tipo de documento
- UB04 - tipo de documento
- Contas de serviços - tipo de documento
- Títulos de veículos - tipo de documento
- W2 - Tipo de documento
- W9 - tipo de documento
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
- Solução de problemas

Guia do usuário de projetos modernos do Document Understanding
Medida
Você pode verificar o status geral do seu projeto e verificar as áreas com potencial de melhoria na seção Medir.
A medição principal na página é a Pontuação geral do projeto.
Esta medida inclui as pontuações do classificador e do extrator para todos os tipos de documentos. A pontuação de cada fator corresponde à classificação do modelo e pode ser visualizada em Medida de classificação e Medida de extração, respectivamente.
- Insatisfatório (0-49)
- Médio (50-69)
- Bom (70-89)
- Excelente (90-100)
Independentemente da pontuação do modelo, cabe a você decidir quando interromper o treinamento, dependendo das necessidades do projeto. Mesmo que um modelo seja classificado como Excelente, isso não significa que ele atenderá a todos os requisitos de negócios.
A pontuação de Classificação inclui o desempenho do modelo, além do tamanho e a qualidade do conjunto de dados.
- Fatores: fornece recomendações sobre como melhorar o desempenho de seu modelo. Você pode obter recomendações sobre o tamanho do conjunto de dados ou desempenho do modelo treinado para cada tipo de documento.
- Métricas: fornece métricas úteis, como o número de documentos de treinamento e teste, precisão, exatidão, recall e pontuação F1 para cada tipo de documento.
A pontuação de Extração inclui o desempenho geral do modelo, bem como o tamanho e a qualidade do conjunto de dados. Essa visualização é dividida em tipos de Você também pode acessar diretamente a visualização Anotar de cada tipo de documento selecionando Anotar.
- Fatores: fornece recomendações sobre como melhorar o desempenho de seu modelo. Você pode obter recomendações sobre o tamanho do conjunto de dados (número de documentos carregados, número de documentos anotados) ou o desempenho do modelo treinado (precisão dos campos) para o tipo de documento selecionado.
- Conjunto de dados: fornece informações sobre os documentos usados para treinar o modelo, o número total de páginas importadas e o número total de páginas rotuladas.
- Métricas: fornece informações e métricas úteis, como o nome do campo, o número do status de treinamento e a precisão para o tipo de documento selecionado. Você também pode acessar métricas avançadas para seus modelos de extração usando o botão Baixar métricas avançadas. Essa funcionalidade permite que você baixe um arquivo Excel com métricas detalhadas e resultados de modelo por lote.
A guia Conjunto de dados ajuda você a criar conjuntos de dados eficazes fornecendo feedback e recomendações das etapas necessárias para alcançar uma boa precisão para o modelo treinado.
Há três níveis de status do conjunto de dados expostos na barra de gerenciamento:
- Vermelho - São necessários mais dados de treinamento rotulados.
- Laranja - Mais dados de treinamento rotulados são recomendados.
- Verde claro - Os dados de treinamento rotulados estão dentro das recomendações.
- Verde escuro - Os dados de treinamento rotulados estão dentro das recomendações. No entanto, mais dados podem ser necessários para campos de baixo desempenho.
Se nenhum campo for criado na sessão, o nível de status do conjunto de dados estará cinza.
Você pode comparar o desempenho de duas versões de um modelo de classificação ou extração na seção Medir .
Para comparar o desempenho de duas versões de um modelo de classificação, primeiro navegue até a seção Medir . Em seguida, selecione Comparar modelo para o modelo de classificação no qual você está interessado.
Você pode escolher as versões que deseja comparar na lista suspensa na parte superior de cada coluna. Por padrão, a versão atual, que indica a versão mais recente disponível, é selecionada à esquerda, e a versão mais recente publicada à direita.
- Precisão: a razão entre instâncias positivas prevista corretamente e o total de instâncias com previsão positiva. Um modelo com alta precisão indica menos falsos positivos.
- Precisão: a proporção de previsões corretas (incluindo verdadeiros positivos e negativos verdadeiros) do total de instâncias.
- Recall: a proporção de casos positivos reais que foram identificados corretamente.
- Pontuação F1: a média matemática da precisão e do recall, com o objetivo de encontrar um equilíbrio entre essas duas métricas. Isso serve como uma escolha entre falsos positivos e falsos negativos.
A ordem dos tipos de documento exibidos é a usada na versão mais recente da comparação. Se um tipo de documento não estiver disponível em uma das versões comparadas, os valores de cada medida serão substituídos por N/A.
Para comparar o desempenho de duas versões de um modelo de extração, primeiro navegue até a seção Medir . Em seguida, selecione Comparar modelo para o modelo de extração no qual você está interessado.
Você pode escolher as versões que deseja comparar na lista suspensa na parte superior de cada coluna. Por padrão, a versão atual, que indica a versão mais recente disponível, é selecionada à esquerda, e a versão mais recente publicada à direita.
- Nome do campo: o nome do campo de anotação.
- Tipo de conteúdo: o tipo de conteúdo do campo:
- String
- Número
- Data
- Telefone
- Número de ID
- Classificação: pontuação do modelo destinada a ajudar você a visualizar o desempenho do campo extraído.
- Precisão: a porcentagem do número total de previsões que o modelo faz que estão corretas.
A ordem dos nomes dos campos exibidos é aquela usada na versão mais recente da comparação. Se um nome de campo não estiver disponível em uma das versões comparadas, os valores de cada medida serão substituídos por N/A.
Você também pode comparar a pontuação do campo para tabelas da seção Tabela .
Você pode baixar o arquivo de métricas avançadas para cada versão na página de comparação a partir do botão Baixar métricas avançadas .