Document Understanding
2020.10
falso
Imagem de fundo do banner
Obsoleto
Guia do usuário do Document Understanding.
Última atualização 28 de fev de 2024

Importar documentos

O AI Center não oferece suporte a nomes de arquivos que contenham caracteres especiais, portanto, recomendamos enfaticamente que, antes de importar documentos para o Data Manager, você verifique se seus nomes contêm apenas caracteres latinos, números, hífen (-) e sublinhado (_).

Há 4 tipos de importação suportados no Data Manager:

  • Importação de esquema
  • Importação de documentos brutos
  • Importação de conjunto de dados no Data Manager
  • Importação do conjunto de dados do Machine Learning Extractor Trainer (funcionalidade em VISUALIZAÇÃO)

Importação de esquema

Se quiser iniciar uma nova instância do Data Manager usando o mesmo esquema de uma instância existente, siga estas etapas:

  1. Insira uma string aleatória no filtro da instância existente, de forma que nenhum documento permaneça na visualização
  2. Clique no botão Exportar. Um arquivo zip será exportado.
  3. Importe o arquivo zip diretamente para a nova instância do Data Manager (não descompacte). O esquema será importado.

Você também pode usar um dos esquemas predefinidos fornecidos na seção Configurando o Data Manager desta documentação.

Importação de documentos brutos

Os tipos de documentos que podem ser importados para rotulagem são: .pdf, .tiff, .png, .jpg. As etapas são:
  1. Clique em Importar. A Janela Importar dados é exibida.
  2. Forneça um nome de lote no campo Batch name. Isso permite que você filtre e localize facilmente esses documentos usando o menu suspenso Filtro posteriormente.
  3. Se você quiser usar este lote de documentos para treinar um modelo de ML, deixe desmarcada a caixa de seleção Tornar este um conjunto de teste.
  4. Se você quiser usar este lote de documentos para avaliar um modelo de ML (ou seja, medindo seu desempenho), selecione a caixa de seleção Tornar este um conjunto de teste. Isso garante que os dados sejam ignorados pelos pipelines de treinamento.
  5. Carregue ou arraste e solte um arquivo ou conjunto de arquivos na seção Procurar ou soltar arquivos.
    Qualquer tipo de arquivo é aceito. O aplicativo os inspeciona e indica quantos deles podem ser importados. Arquivos .zip também são aceitos. O aplicativo descompacta o arquivo e percorre as pastas recursivamente para encontrar todos os arquivos nela inseridos.

    A importação de um arquivo zip de conjunto de dados exportado de outra instância do Data Manager importará os documentos com os rótulos. Isso funciona apenas se o esquema do conjunto de dados for o mesmo ou for um subconjunto do esquema pré-existente no Data Manager.



Importação de conjunto de dados no Data Manager

Para importar um conjunto de dados que foi rotulado anteriormente em outra instância do Data Manager, você precisa obter o arquivo zip que foi exportado originalmente e importá-lo diretamente para a nova instância do Data Manager. Se sua nova instância do Data Manager estiver completamente vazia (sem dados nem campos definidos), então os dados e o esquema serão importados. Se sua nova instância do Data Manager já tiver campos definidos, o conjunto de dados recém-importado precisará ter os mesmos campos ou um subconjunto desses campos. Caso contrário, a importação será rejeitada.

Importação de conjunto de dados da Estação de Validação (funcionalidade em Visualização)

Como seu fluxo de trabalho de RPA processa documentos usando um modelo de ML existente, alguns documentos podem exigir validação humana usando a atividade [Validation Station] (https://docs.uipath.com/activities/docs/present-validation-station) (disponível em bots Attended ou no navegador usando o Orchestrator Actions Center).

Os dados validados gerados no Validation Station podem ser exportados usando a atividade [Machine Learning Extractor Trainer activity] (https://docs.uipath.com/activities/docs/machine-learning-extractor-trainer) e podem ser usados para treinar modelos de ML usando o recurso descrito aqui.

As etapas envolvidas são:

  1. Configure o ML Extractor Trainer para gerar dados em uma pasta com caminho <Trainer/Output/Folder> (use qualquer caminho de pasta vazio).
  2. Execute o fluxo de trabalho de RPA, incluindo Estação de Validação e ML Extractor Trainer.
  3. O ML Extractor Trainer criará 3 subpastas denominadas: documentos, metadados e previsões dentro da pasta de saída.
  4. Compacte o <Trainer/Output/Folder> para obter um arquivo zip como TrainerOutputFolder.zip
  5. Importe o arquivo zip para o Data Manager. O Data Manager detectará que a importação contém dados produzidos pelo ML Extractor Trainer e importará os dados de acordo.
  6. Exporte os dados como de costume e faça o upload para o AI Center.
  7. Inicie o pipeline de treinamento ou o pipeline completo e certifique-se de selecionar o Pacote de ML e a versão que deseja ajustar.

Was this page helpful?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Logotipo branco da Uipath
Confiança e segurança
© 2005-2024 UiPath. All rights reserved.