Document Understanding
Mais recente
falso
- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 4506T - Pacote de ML
- 990 - Pacote de ML - Prévia
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de Incorporação - Pacote ML
- Certificado de Origem - Pacote ML
- Cheques - Pacote de ML
- Certificado de produto infantil - pacote ML
- CMS 1500 - Pacote ML
- Declaração de Conformidade da UE - Pacote ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- Invoices Australia - ML package
- Invoices China - ML package
- Invoices India - ML package
- Invoices Japan - ML package
- Envio de Faturas - Pacote ML
- Romaneio de carga - Pacote de ML
- Boletos - Pacote ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Pipelines de treinamento
- Treinar e avaliar simultaneamente um modelo
- Artefatos
- Ajuste fino
- O loop de ajuste fino automático (pré-visualização pública)
- Serviços de OCR
- Aprendizagem profunda
- Licenciamento
Treinar e avaliar simultaneamente um modelo
Guia do usuário do Document Understanding.
Última atualização 30 de abr de 2024
Treinar e avaliar simultaneamente um modelo
Configure o pipeline de treinamento da seguinte maneira:
- No campo Pipeline type, selecione Full Pipeline run.
- No campo Escolher pacote, selecione o pacote que deseja treinar e avaliar.
- No campo Escolha a versão principal do pacote, selecione uma versão principal para o seu pacote.
- No campo Escolha a versão secundária do pacote, selecione uma versão secundária para seu pacote. É altamente recomendável usar sempre a versão secundária 0 (zero).
- No campo Escolher conjunto de dados de entrada, selecione um conjunto de dados de treinamento representativo.
- No campo Escolher conjunto de dados de avaliação, selecione um conjunto de dados de avaliação representativo.
- Na seção Inserir parâmetros, insira as variáveis de ambiente definidas e usadas por seu pipeline, se houver. Para a maioria dos casos de uso, nenhum parâmetro precisa ser especificado; o modelo está usando técnicas avançadas para encontrar uma configuração de desempenho. No entanto, aqui estão algumas variáveis de ambiente que você pode usar:
auto_retraining
que permite completar o Loop de retreinamento automático; se a variável for definida como True, o conjunto de dados de entrada precisará ser a pasta de exportação associada à sessão de rotulagem na qual os dados são marcados. Se a variável permanecer definida como False, o conjunto de dados de entrada precisará corresponder ao formato de conjunto de dados.model.epochs
que personaliza o número de épocas para o pipeline de treinamento (o valor padrão é 100).- Selecione se deseja treinar o pipeline na GPU ou na CPU. O controle deslizante Habilitar GPU está desabilitado por padrão, nesse caso o pipeline é treinado na CPU. O uso de uma GPU para treinamento é pelo menos 10 vezes mais rápido do que usar uma CPU. Além disso, o treinamento na CPU é suportado apenas para conjuntos de dados de até 1000 imagens. Para conjuntos de dados maiores, você precisa treinar usando GPU.
-
Selecione uma das opções quando o pipeline deve ser executado: Executar agora, Agendado ou Recorrente. Caso esteja usando a variável
auto_retraining
, selecione Recorrente. - Após configurar todos os campos, clique em Criar. O pipeline é criado.