Document Understanding - Importação de documentos

document-understanding

2020.10

false

Guia do usuário do Document Understanding.

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Importar documentos

O AI Center não oferece suporte a nomes de arquivos que contenham caracteres especiais, portanto, recomendamos enfaticamente que, antes de importar documentos para o Data Manager, você verifique se seus nomes contêm apenas caracteres latinos, números, hífen (-) e sublinhado (_).

Há 4 tipos de importação suportados no Data Manager:

Importação de esquema
Importação de documentos brutos
Importação de conjunto de dados no Data Manager
Importação do conjunto de dados do Machine Learning Extractor Trainer (funcionalidade em VISUALIZAÇÃO)

Importação de esquema

Se quiser iniciar uma nova instância do Data Manager usando o mesmo esquema de uma instância existente, siga estas etapas:

Insira uma string aleatória no filtro da instância existente, de forma que nenhum documento permaneça na visualização
Clique no botão Exportar. Um arquivo zip será exportado.
Importe o arquivo zip diretamente para a nova instância do Data Manager (não descompacte). O esquema será importado.

Você também pode usar um dos esquemas predefinidos fornecidos na seção Configurando o Data Manager desta documentação.

Importação de documentos brutos

Os tipos de documentos que podem ser importados para rotulagem são: .pdf, .tiff, .png, .jpg. As etapas são:

Clique em Importar. A Janela Importar dados é exibida.
Forneça um nome de lote no campo Batch name. Isso permite que você filtre e localize facilmente esses documentos usando o menu suspenso Filtro posteriormente.
Se você quiser usar este lote de documentos para treinar um modelo de ML, deixe desmarcada a caixa de seleção Tornar este um conjunto de teste.
Se você quiser usar este lote de documentos para avaliar um modelo de ML (ou seja, medindo seu desempenho), selecione a caixa de seleção Tornar este um conjunto de teste. Isso garante que os dados sejam ignorados pelos pipelines de treinamento.
Carregue ou arraste e solte um arquivo ou conjunto de arquivos na seção Procurar ou soltar arquivos.
Qualquer tipo de arquivo é aceito. O aplicativo os inspeciona e indica quantos deles podem ser importados. Arquivos .zip também são aceitos. O aplicativo descompacta o arquivo e percorre as pastas recursivamente para encontrar todos os arquivos nela inseridos.

A importação de um arquivo zip de conjunto de dados exportado de outra instância do Data Manager importará os documentos com os rótulos. Isso funciona apenas se o esquema do conjunto de dados for o mesmo ou for um subconjunto do esquema pré-existente no Data Manager.

Importação de conjunto de dados no Data Manager

Para importar um conjunto de dados que foi rotulado anteriormente em outra instância do Data Manager, você precisa obter o arquivo zip que foi exportado originalmente e importá-lo diretamente para a nova instância do Data Manager. Se sua nova instância do Data Manager estiver completamente vazia (sem dados nem campos definidos), então os dados e o esquema serão importados. Se sua nova instância do Data Manager já tiver campos definidos, o conjunto de dados recém-importado precisará ter os mesmos campos ou um subconjunto desses campos. Caso contrário, a importação será rejeitada.

Importação de conjunto de dados da Estação de Validação (funcionalidade em Visualização)

Como seu fluxo de trabalho de RPA processa documentos usando um modelo de ML existente, alguns documentos podem exigir validação manual usando a atividade Estação de Validação (disponível em robôs attended ou no navegador usando o Orchestrator Action Center).

Os dados validados gerados na Estação de Validação podem ser exportados usando a atividade Machine Learning Extractor Trainer e podem ser usados para treinar modelos de ML usando a funcionalidade descrita aqui.

As etapas envolvidas são:

Configure o ML Extractor Trainer para gerar dados em uma pasta com caminho <Trainer/Output/Folder> (use qualquer caminho de pasta vazio).
Execute o fluxo de trabalho de RPA, incluindo Estação de Validação e ML Extractor Trainer.
O ML Extractor Trainer criará 3 subpastas denominadas: documentos, metadados e previsões dentro da pasta de saída.
Compacte o <Trainer/Output/Folder> para obter um arquivo zip como TrainerOutputFolder.zip
Importe o arquivo zip para o Data Manager. O Data Manager detectará que a importação contém dados produzidos pelo ML Extractor Trainer e importará os dados de acordo.
Exporte os dados como de costume e faça o upload para o AI Center.
Inicie o pipeline de treinamento ou o pipeline completo e certifique-se de selecionar o Pacote de ML e a versão que deseja ajustar.

Nesta página

Importação de esquema
Importação de documentos brutos
Importação de conjunto de dados no Data Manager
Importação de conjunto de dados da Estação de Validação (funcionalidade em Visualização)

Esta página foi útil?

AnteriorCriar e configurar campos

AvançarRotular documentos