- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 – tipo de documento
- 1040 Agendamento C – tipo de documento
- 1040 Agendamento D – tipo de documento
- 1040 Agendamento E – tipo de documento
- 1040x – tipo de documento
- 3949a – tipo de documento
- 4506T – tipo de documento
- 709 – tipo de documento
- 941x – tipo de documento
- 9465 – tipo de documento
- ACORD125 – tipo de documento
- ACORD126 – tipo de documento
- ACORD131 – tipo de documento
- ACORD140 – tipo de documento
- ACORD25 – tipo de documento
- Extratos bancários – tipo de documento
- Conhecimentos de embarque – tipo de documento
- Certificado de incorporação – tipo de documento
- Certificado de origem – tipo de documento
- Verificações – tipo de documento
- Certificado de produto infantil – tipo de documento
- CMS 1500 – tipo de documento
- Declaração de conformidade UE – tipo de documento
- Demonstrações financeiras – tipo de documento
- FM1003 – tipo de documento
- I9 – tipo de documento
- Cartões de identificação – tipo de documento
- Faturas – tipo de documento
- Faturas2 - tipo de documento
- Faturas Austrália – tipo de documento
- Faturas China – tipo de documento
- Faturas hebraicas – tipo de documento
- Faturas Índia – tipo de documento
- Faturas Japão – tipo de documento
- Faturas de Envio – tipo de documento
- Listas de embalagem – tipo de documento
- Holerites – tipo de documento
- Passaportes – tipo de documento
- Ordens de compra – tipo de documento
- Recibos – tipo de documento.
- Recibos 2 - tipo de documento
- Recibos Japão – tipo de documento
- Avisos de Remessa – tipo de documento
- UB04 – tipo de documento
- Declarações de fechamento de hipoteca dos EUA - tipo de documento
- Contas de serviços públicos – tipo de documento
- Títulos de veículos – tipo de documento
- W2 – tipo de documento
- W9 – tipo de documento
- Idiomas suportados
- Painéis de insights
- Lógica de licenciamento e carregamento
- Como fazer
- Solução de problemas

Guia do usuário de projetos modernos do Document Understanding
Migração de projetos clássicos
link- Exporte o conjunto de dados do projeto baseado no AI Center.
- Importar o conjunto de dados para o projeto moderno.
Limitações atuais
link- Atualmente, a importação de conjuntos de dados maiores que 3000 páginas não é compatível. Apenas as 3000 páginas iniciais serão importadas com sucesso, com quaisquer páginas adicionais falhando ao fazê-lo. Por exemplo, se seu conjunto de dados consistir em 2999 páginas e você tentar importar um documento de quatro páginas, o processo não será bem-sucedido.
- Os nomes de lote e os resultados de lote correspondentes não estão disponíveis no momento. Se seus dados forem organizados em lotes, essas informações ainda não serão exibidas, mas serão salvas.
- As exportações do AI Center não são compatíveis. Apenas exportações do Document Manager são compatíveis.
Exportar um conjunto de dados de um projeto com base no AI Center
link- Abra o AI Center e acesse a página Rotulagem de dados.
-
Selecione a Sessão de rotulagem de dados que você deseja migrar.
-
Depois que o Document Manager for aberto, na lista suspensa Filtrar documentos, selecione Conjunto de treinamento e validação.
Figura 1. Conjunto de treinamento e validação
- Selecione Exportar.
- Deixe os resultados da pesquisa atual selecionados e preencha um nome para seu trabalho de exportação.
-
Selecione Baixar.
Figura 2. Baixar exportação
Importação de um conjunto de dados
link- Navegue até e abra o projeto para o qual você deseja importar dados.
-
Selecione Adicionar tipo de documento e crie um novo tipo de documento personalizado.
Figura 3. Adicionar tipo de documento
-
No novo tipo de documento personalizado, selecione Carregar e escolha o arquivo zip do projeto clássico que você exportou. Aguarde o upload para concluir.
Observação: as exportações do AI Center não são compatíveis. Apenas exportações do Document Manager são compatíveis.Figura 4. Carregar processamento
Treinamento do modelo
linkDepois que o conjunto de dados é importado, o treinamento do modelo começa. Depois que o treinamento é concluído, a pontuação do modelo é exibida. Para verificar pontuações detalhadas do modelo, selecione a pontuação e, em seguida, Pontuações detalhadas do modelo.
This action takes you to the Measure page where you can access detailed model metrics.
Quando o mesmo conjunto de dados é usado para treinar um ML duas vezes, você pode observar métricas de modelos ligeiramente diferentes. Isso pode ocorrer devido a alguns motivos:
- Inicialização: o machine learning usa métodos de otimização que precisam de palpites iniciais para disparar os algoritmos de otimização. Diferentes palpites iniciais durante cada treinamento podem levar a vários resultados devido à natureza imprevisível desses algoritmos.
- Estado aleatório: alguns algoritmos usam aleatoriedade em suas operações. Por exemplo, ao treinar uma rede neural, procedimentos, como descida do gradiente estocástico e descida do gradiente de mini-lote, introduzem aleatoriedade. Portanto, mesmo com parâmetros e conjuntos de dados iniciais do modelo idênticos, o desempenho dos modelos pode variar em diferentes execuções.
- Regularização: certos algoritmos incluem um termo de penalidade que incentiva o modelo a manter pesos menores. Devido à aleatoriedade envolvida, o modelo pode operar com um conjunto de pesos diferente a cada vez.
No entanto, é vital observar que essas diferenças menores não implicam necessariamente que um modelo é superior ou inferior a outro. Mesmo com métricas ligeiramente variadas, a capacidade dos modelos de compreender dados permanece essencialmente a mesma, desde que as diferenças não sejam significativamente grandes. Além disso, repetir esse processo várias vezes e obter uma média deve render métricas de desempenho semelhantes.
Alterar o modelo base no Gerenciador de tipos de Documentos
link- Selecione o menu de três pontos no seu tipo de documento personalizado e escolha Gerenciador de tipos de documento.
- Navegue até a guia Configurações.
- Selecione o modelo desejado na lista suspensa Modelo base.
- Depois de fazer sua seleção, escolha Salvar. Para sair, selecione Voltar.
Tipos de exportação
linkPara projetos clássicos, há vários métodos para exportar dados. Nem todos os tipos de dados exportados são compatíveis para importação para projetos modernos. Para comparar os resultados do modelo em ambos os tipos de projeto, filtre documentos por Conjunto de treinamento e validação e selecione Escolher resultados da pesquisa para exportar o conjunto de dados. Para obter mais informações sobre cada opção, consulte a tabela a seguir.
Tipo de exportação | Dados exportados | O que acontece com dados importados |
---|---|---|
Resultados da pesquisa atual | Exporta o conjunto de dados filtrado atual. Use-o junto com o filtro de Conjunto de treinamento e validação. | Documentos marcados como treinamento são usados para treinar o modelo. Documentos marcados como validação são usados para medir o desempenho do modelo.
Dica: para comparar os resultados do modelo entre dois tipos de projeto, sempre exporte e importe o conjunto de dados como Treinamento e validação.
|
Tudo rotulado | Exporta todos os documentos anotados do conjunto de dados:
|
|
Esquema | Exporta a lista de campos e suas respectivas configurações. | Um esquema é importado se não houver nenhum. Se um esquema já estiver definido, a importação falhará. |
Todos | Exporta todos os documentos anotados e não anotados. |
|
Importação de esquemas
link- Crie um tipo de documento personalizado na seção Criar.
- Importe o arquivo zip que contém o esquema.
- As importações de esquema são limitadas a tipos de documentos personalizados sem esquemas pré-existentes.
- Se você importar um esquema para um tipo de documento que já contém um esquema, a importação falhará.