- Introdução
- Componentes do framework
- Document Understanding no AI Center
- Pipelines
- Pacotes de ML
- Gerenciador de Dados
- Serviços de OCR
- Licenciamento
- Referências
Importar documentos
O AI Center não oferece suporte a nomes de arquivos que contenham caracteres especiais, portanto, recomendamos enfaticamente que, antes de importar documentos para o Data Manager, você verifique se seus nomes contêm apenas caracteres latinos, números, hífen (-) e sublinhado (_).
Há 4 tipos de importação suportados no Data Manager:
- Importação de esquema
- Importação de documentos brutos
- Importação de conjunto de dados no Data Manager
- Importação do conjunto de dados do Machine Learning Extractor Trainer (funcionalidade em VISUALIZAÇÃO)
Se quiser iniciar uma nova instância do Data Manager usando o mesmo esquema de uma instância existente, siga estas etapas:
- Insira uma string aleatória no filtro da instância existente, de forma que nenhum documento permaneça na visualização
- Clique no botão Exportar. Um arquivo zip será exportado.
- Importe o arquivo zip diretamente para a nova instância do Data Manager (não descompacte). O esquema será importado.
Você também pode usar um dos esquemas predefinidos fornecidos na seção Configurando o Data Manager desta documentação.
.pdf
, .tiff
, .png
, .jpg
. As etapas são:
- Clique em Importar. A Janela Importar dados é exibida.
- Forneça um nome de lote no campo Batch name. Isso permite que você filtre e localize facilmente esses documentos usando o menu suspenso Filtro posteriormente.
- Se você quiser usar este lote de documentos para treinar um modelo de ML, deixe desmarcada a caixa de seleção Tornar este um conjunto de teste.
- Se você quiser usar este lote de documentos para avaliar um modelo de ML (ou seja, medindo seu desempenho), selecione a caixa de seleção Tornar este um conjunto de teste. Isso garante que os dados sejam ignorados pelos pipelines de treinamento.
- Carregue ou arraste e solte um arquivo ou conjunto de arquivos na seção Procurar ou soltar arquivos.
Qualquer tipo de arquivo é aceito. O aplicativo os inspeciona e indica quantos deles podem ser importados. Arquivos
.zip
também são aceitos. O aplicativo descompacta o arquivo e percorre as pastas recursivamente para encontrar todos os arquivos nela inseridos.A importação de um arquivo zip de conjunto de dados exportado de outra instância do Data Manager importará os documentos com os rótulos. Isso funciona apenas se o esquema do conjunto de dados for o mesmo ou for um subconjunto do esquema pré-existente no Data Manager.
Para importar um conjunto de dados que foi rotulado anteriormente em outra instância do Data Manager, você precisa obter o arquivo zip que foi exportado originalmente e importá-lo diretamente para a nova instância do Data Manager. Se sua nova instância do Data Manager estiver completamente vazia (sem dados nem campos definidos), então os dados e o esquema serão importados. Se sua nova instância do Data Manager já tiver campos definidos, o conjunto de dados recém-importado precisará ter os mesmos campos ou um subconjunto desses campos. Caso contrário, a importação será rejeitada.
Como seu fluxo de trabalho de RPA processa documentos usando um modelo de ML existente, alguns documentos podem exigir validação manual usando a atividade Estação de Validação (disponível em robôs attended ou no navegador usando o Orchestrator Action Center).
Os dados validados gerados na Estação de Validação podem ser exportados usando a atividade Machine Learning Extractor Trainer e podem ser usados para treinar modelos de ML usando a funcionalidade descrita aqui.
As etapas envolvidas são:
- Configure o ML Extractor Trainer para gerar dados em uma pasta com caminho <Trainer/Output/Folder> (use qualquer caminho de pasta vazio).
- Execute o fluxo de trabalho de RPA, incluindo Estação de Validação e ML Extractor Trainer.
- O ML Extractor Trainer criará 3 subpastas denominadas: documentos, metadados e previsões dentro da pasta de saída.
- Compacte o <Trainer/Output/Folder> para obter um arquivo zip como TrainerOutputFolder.zip
- Importe o arquivo zip para o Data Manager. O Data Manager detectará que a importação contém dados produzidos pelo ML Extractor Trainer e importará os dados de acordo.
- Exporte os dados como de costume e faça o upload para o AI Center.
- Inicie o pipeline de treinamento ou o pipeline completo e certifique-se de selecionar o Pacote de ML e a versão que deseja ajustar.