- Visão geral
- Introdução
- Atividades
- Painéis de insights
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Visão geral
- Document Understanding - Pacote de ML
- DocumentClassifier - Pacote de ML
- Pacotes de ML com recursos de OCR
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Outros pacotes de ML prontos para uso
- Endpoints públicos
- Limitações de tráfego
- Configuração de OCR
- Pipelines
- Serviços de OCR
- Idiomas suportados
- Aprendizagem profunda
- Licenciamento
Guia do usuário do Document Understanding.
Exportar documentos
A caixa de diálogo Exportar arquivos permite exportar facilmente dados para modelos de ML de treinamento.
Clique no botão Exportar na barra de gerenciamento.
A caixa de diálogo contém três guias:
A guia Exportar agora permite:
- Download para Excel - Baixe os dados localmente em um formato Excel.
- Download - Baixe os dados localmente.
- Exportar para o AI Center - Exporta os dados para o AI Center. As pastas exportadas podem ser encontradas no AI Center na pasta export (Datasets > dataset_name > export).
Se nenhum esquema for definido, todas as opções de exportação serão desabilitadas.
Se for definido um esquema, é obrigatório inserir um nome para sua exportação, caso contrário, os botões Download e Exportar ficam desabilitados. Um nome válido pode ter até 24 caracteres e não deve conter caracteres especiais.
Você pode exportar ou baixar um esquema mesmo que inclua campos de vários valores.
Você pode optar por exportar uma das seguintes opções:
- Resultados de pesquisa atuais - os documentos rotulados filtrados por uma palavra-chave predefinida/lote nomeado ou por uma consulta de texto. Se nenhum filtro for aplicado, todos os documentos rotulados na exibição atual serão exportados.
- Todos rotulados - todos os documentos com pelo menos um campo rotulado, de qualquer tipo; mais precisamente, os documentos do filtro rotulado.
- Esquema - um arquivo zip contendo os campos e suas configurações que podem ser importados para uma sessão diferente do Document Manager.
- Todos - exporta todos os documentos, independentemente da aplicação, ou não, de rótulos.
A caixa de seleção Exportação compatível com versões anteriores permite aplicar o comportamento de exportação herdado, que é exportar cada página como um documento separado. Tente isso se o modelo treinado usando a exportação padrão estiver abaixo das expectativas. Deixe esta opção desmarcada para exportar os documentos em seu formulário original de várias páginas.
Para exportar um conjunto de dados, todos os campos precisam ser rotulados em pelo menos 10 páginas diferentes. Caso contrário, a exportação falhará com as seguintes mensagens:
Para campos de Classificação, há um requisito adicional: cada opção precisa estar rotulada em pelo menos um documento. Caso contrário, a exportação falha com a seguinte mensagem:
Ao exportar apenas os dados do conjunto de avaliação, todas as validações são desativadas.
Uma pasta contendo o conjunto de dados exportado proveniente do Document Manager. Isso inclui:
schema.json
: um arquivo contendo os campos a serem extraídos e seus tipossplit.csv
: um arquivo contendo a divisão por cada documento que será usado para TREINAR ou VALIDAR durante o Pipeline de Treinamento- images: uma pasta contendo imagens de todas as páginas rotuladas
-
latest: uma pasta contendo arquivos
.json
com os dados rotulados de cada página
A funcionalidade Agendar exportação está documentada aqui.
A guia Logs exibe o registro mais recente da exportação.
No caso de uma exportação bem-sucedida, o log mostra o número de documentos processados e a duração da exportação.
No caso de uma exportação de esquema bem-sucedida, o log mostra a duração da exportação.
Durante a exportação de arquivo, você pode verificar seu status. Isso é particularmente útil para exportações maiores.
As mensagens de erro também são exibidas em Logs, por exemplo:
No caso de um retreinamento automático bem-sucedido, os logs de importação da pasta ajuste fino do conjunto de dados também são exibidos: