- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Pacotes de ML
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- Receipts Japan - ML package
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Endpoints públicos
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Licenciamento
- Como fazer
Guia do usuário de projetos modernos do Document Understanding
Migração de projetos clássicos
- Exporte o conjunto de dados do projeto clássico ou do projeto com base no AI Center.
- Importar o conjunto de dados para o projeto moderno.
- Atualmente, a importação de conjuntos de dados maiores que 3000 páginas não é compatível. Apenas as 3000 páginas iniciais serão importadas com sucesso, com quaisquer páginas adicionais falhando ao fazê-lo. Por exemplo, se seu conjunto de dados consistir em 2999 páginas e você tentar importar um documento de quatro páginas, o processo não será bem-sucedido.
- Os nomes de lote e os resultados de lote correspondentes não estão disponíveis no momento. Se seus dados forem organizados em lotes, essas informações ainda não serão exibidas, mas serão salvas.
Depois que o conjunto de dados é importado, o treinamento do modelo começa. Depois que o treinamento é concluído, a pontuação do modelo é exibida. Para verificar pontuações detalhadas do modelo, selecione a pontuação e, em seguida, Pontuações detalhadas do modelo.
Essa ação leva você para a página Medir, onde você pode acessar métricas detalhadas do modelo.
Quando o mesmo conjunto de dados é usado para treinar um ML duas vezes, você pode observar métricas de modelos ligeiramente diferentes. Isso pode ocorrer devido a alguns motivos:
- Inicialização: o machine learning usa métodos de otimização que precisam de palpites iniciais para disparar os algoritmos de otimização. Diferentes palpites iniciais durante cada treinamento podem levar a vários resultados devido à natureza imprevisível desses algoritmos.
- Estado aleatório: alguns algoritmos usam aleatoriedade em suas operações. Por exemplo, ao treinar uma rede neural, procedimentos, como descida do gradiente estocástico e descida do gradiente de mini-lote, introduzem aleatoriedade. Portanto, mesmo com parâmetros e conjuntos de dados iniciais do modelo idênticos, o desempenho dos modelos pode variar em diferentes execuções.
- Regularização: certos algoritmos incluem um termo de penalidade que incentiva o modelo a manter pesos menores. Devido à aleatoriedade envolvida, o modelo pode operar com um conjunto de pesos diferente a cada vez.
No entanto, é vital observar que essas diferenças menores não implicam necessariamente que um modelo é superior ou inferior a outro. Mesmo com métricas ligeiramente variadas, a capacidade dos modelos de compreender dados permanece essencialmente a mesma, desde que as diferenças não sejam significativamente grandes. Além disso, repetir esse processo várias vezes e obter uma média deve render métricas de desempenho semelhantes.
Para projetos clássicos, há vários métodos para exportar dados. Nem todos os tipos de dados exportados são compatíveis para importação para projetos modernos. Para comparar os resultados do modelo em ambos os tipos de projeto, filtre documentos por Conjunto de treinamento e validação e selecione Escolher resultados da pesquisa para exportar o conjunto de dados. Para obter mais informações sobre cada opção, consulte a tabela a seguir.
Tipo de exportação | Dados exportados | O que acontece com dados importados |
---|---|---|
Resultados da pesquisa atual | Exporta o conjunto de dados filtrado atual. Use-o junto com o filtro de Conjunto de treinamento e validação. | Documentos marcados como treinamento são usados para treinar o modelo. Documentos marcados como validação são usados para medir o desempenho do modelo.
Dica: para comparar os resultados do modelo entre dois tipos de projeto, sempre exporte e importe o conjunto de dados como Treinamento e validação.
|
Tudo rotulado | Exporta todos os documentos anotados do conjunto de dados:
|
|
Esquema | Exporta a lista de campos e suas respectivas configurações. | Um esquema é importado se não houver nenhum. Se um esquema já estiver definido, a importação falhará. |
Todos | Exporta todos os documentos anotados e não anotados. |
|
- Crie um tipo de documento personalizado na seção Criar.
- Importe o arquivo zip que contém o esquema.
- As importações de esquema são limitadas a tipos de documentos personalizados sem esquemas pré-existentes.
- Se você importar um esquema para um tipo de documento que já contém um esquema, a importação falhará.
- Limitações atuais
- Exportação de um conjunto de dados a partir de um projeto clássico
- Exportar um conjunto de dados de um projeto com base no AI Center
- Importação de um conjunto de dados
- Treinamento do modelo
- Alterar o modelo base no Gerenciador de tipos de Documentos
- Tipos de exportação
- Importação de esquemas