- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 – tipo de documento
- 1040 Agendamento C – tipo de documento
- 1040 Agendamento D – tipo de documento
- 1040 Agendamento E – tipo de documento
- 1040x – tipo de documento
- 3949a – tipo de documento
- 4506T – tipo de documento
- 709 – tipo de documento
- 941x – tipo de documento
- 9465 – tipo de documento
- ACORD125 – tipo de documento
- ACORD126 – tipo de documento
- ACORD131 – tipo de documento
- ACORD140 – tipo de documento
- ACORD25 – tipo de documento
- Extratos bancários – tipo de documento
- Conhecimentos de embarque – tipo de documento
- Certificado de incorporação – tipo de documento
- Certificado de origem – tipo de documento
- Verificações – tipo de documento
- Certificado de produto infantil – tipo de documento
- CMS 1500 – tipo de documento
- Declaração de conformidade UE – tipo de documento
- Demonstrações financeiras – tipo de documento
- FM1003 – tipo de documento
- I9 – tipo de documento
- Cartões de identificação – tipo de documento
- Faturas – tipo de documento
- Faturas2 - tipo de documento
- Faturas Austrália – tipo de documento
- Faturas China – tipo de documento
- Faturas hebraicas – tipo de documento
- Faturas Índia – tipo de documento
- Faturas Japão – tipo de documento
- Faturas de Envio – tipo de documento
- Listas de embalagem – tipo de documento
- Holerites – tipo de documento
- Passaportes – tipo de documento
- Ordens de compra – tipo de documento
- Recibos – tipo de documento.
- Recibos2 - tipo de documento
- Recibos Japão – tipo de documento
- Avisos de Remessa – tipo de documento
- UB04 – tipo de documento
- Divulgações de fechamentos de hipotecas dos EUA - tipo de documento
- Contas de serviços públicos – tipo de documento
- Títulos de veículos – tipo de documento
- W2 – tipo de documento
- W9 – tipo de documento
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
- Solução de problemas

Guia do usuário de projetos modernos do Document Understanding
Você pode verificar o status geral do seu projeto e verificar as áreas com potencial de melhoria na seção Medir.
A medição principal na página é a Pontuação geral do projeto.
Esta medida inclui as pontuações do classificador e do extrator para todos os tipos de documentos. A pontuação de cada fator corresponde à classificação do modelo e pode ser visualizada em Medida de classificação e Medida de extração, respectivamente.
- Insatisfatório (0-49)
- Médio (50-69)
- Bom (70-89)
- Excelente (90-100)
Independentemente da pontuação do modelo, cabe a você decidir quando interromper o treinamento, dependendo das necessidades do projeto. Mesmo que um modelo seja classificado como Excelente, isso não significa que ele atenderá a todos os requisitos de negócios.
A pontuação de Classificação inclui o desempenho do modelo, além do tamanho e a qualidade do conjunto de dados.
- Fatores: fornece recomendações sobre como melhorar o desempenho de seu modelo. Você pode obter recomendações sobre o tamanho do conjunto de dados ou desempenho do modelo treinado para cada tipo de documento.
- Métricas: fornece métricas úteis, como o número de documentos de treinamento e teste, precisão, exatidão, recall e pontuação F1 para cada tipo de documento.
The Extraction score factors in the overall performance of the model as well as the size and quality of the dataset. This view is split into document types. You can also go straight to the Annotate view of each document type by selecting Annotate.
- Fatores: fornece recomendações sobre como melhorar o desempenho de seu modelo. Você pode obter recomendações sobre o tamanho do conjunto de dados (número de documentos carregados, número de documentos anotados) ou o desempenho do modelo treinado (precisão dos campos) para o tipo de documento selecionado.
- Conjunto de dados: fornece informações sobre os documentos usados para treinar o modelo, o número total de páginas importadas e o número total de páginas rotuladas.
- Métricas: fornece informações e métricas úteis, como o nome do campo, o número do status de treinamento e a precisão para o tipo de documento selecionado. Você também pode acessar métricas avançadas para seus modelos de extração usando o botão Baixar métricas avançadas. Essa funcionalidade permite que você baixe um arquivo Excel com métricas detalhadas e resultados de modelo por lote.
Diagnóstico do conjunto de dados
A guia Conjunto de dados ajuda você a criar conjuntos de dados eficazes fornecendo feedback e recomendações das etapas necessárias para alcançar uma boa precisão para o modelo treinado.
Há três níveis de status do conjunto de dados expostos na barra de gerenciamento:
- Vermelho - São necessários mais dados de treinamento rotulados.
- Laranja - Mais dados de treinamento rotulados são recomendados.
- Verde claro – Os dados de treinamento rotulados estão dentro das recomendações.
- Verde escuro – Os dados de treinamento rotulados estão dentro das recomendações. No entanto, mais dados podem ser necessários para campos com desempenho ruim.
Se nenhum campo for criado na sessão, o nível de status do conjunto de dados estará cinza.
Você pode comparar o desempenho de duas versões de um modelo de classificação ou extração da seção de Medição.
Comparação de modelos de classificação
Para comparar o desempenho de duas versões de um modelo de classificação, primeiro navegue até a seção de Medição. Em seguida, selecione Comparar modelo para o modelo de classificação no qual você está interessado.
Você pode escolher as versões que deseja comparar na lista suspensa na parte superior de cada coluna. Por padrão, a versão atual, indicando a versão mais recente disponível, é selecionada à esquerda e a versão publicada mais recente à direita.
- Precisão: a proporção de instâncias positivas previstas corretamente para o total de instâncias que eram previstas positivamente. Um modelo com alta precisão indica menos falsos positivos.
- Precisão: a proporção de previsões corretas (incluindo positivos verdadeiros e negativos verdadeiros) das instâncias totais.
- Revocação: a proporção de casos positivos reais que foram identificados corretamente.
- Pontuação F1: a média geométrica de precisão e revocação, com o objetivo de alcançar um equilíbrio entre essas duas métricas. Isso serve como uma troca entre falsos positivos e falsos negativos.
A ordem dos tipos de documento exibida é a usada na versão mais recente da comparação. Se um tipo de documento não estiver disponível em uma das versões comparadas, os valores para cada medida serão substituídos por N/A.
Comparação de modelos de extração
Para comparar o desempenho de duas versões de um modelo de extração, primeiro navegue até a seção Medidas. Em seguida, selecione Comparar modelo para o modelo de extração no qual está interessado.
Você pode escolher as versões que deseja comparar na lista suspensa na parte superior de cada coluna. Por padrão, a versão atual, indicando a versão mais recente disponível, é selecionada à esquerda e a versão publicada mais recente à direita.
- Nome do campo: o nome do campo de marcação.
- Tipo de conteúdo: o tipo de conteúdo do campo:
- String
- Número
- Data
- Telefone
- Número de ID
- Classificação: pontuação do modelo para ajudar a visualizar o desempenho do campo extraído.
- Precisão: a fração do número total de previsões que o modelo faz que estão corretas.
A ordem dos nomes de campos exibida é a usada na versão mais recente da comparação. Se um nome de campo não estiver disponível em uma das versões comparadas, os valores para cada medida serão substituídos por N/A.
Você também pode comparar a pontuação do campo para tabelas da seção Tabela.
Você pode baixar o arquivo de métricas avançadas para cada versão da página de comparação no botão Baixar métricas avançadas.