document-understanding
2023.10
true
Guia do usuário do Document Understanding.
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 17 de out de 2024

Importar documentos

A caixa de diálogo Importar dados permite importar facilmente novos documentos para serem rotulados ou revisados.

Clique no botão Importar na barra de gerenciamento.

A caixa de diálogo contém os seguintes controles:

  • Campo de texto Batch name - é obrigatório inserir um nome para sua exportação, caso contrário, a seção Procurar ou arrastar arquivos será desabilitada; um nome válido pode ter até 24 caracteres e não deve conter caracteres especiais.
  • Caixa de seleção Faça deste um conjunto de avaliação - se selecionada, o conjunto de dados é usado para fins de avaliação.
  • Seção Procurar ou arrastar arquivos - clique em Procurar arquivos para fazer upload para navegar pelo seu diretório ou simplesmente arraste e solte os arquivos dentro do quadro.
  • Seção Status - clique em (carregar log de importação anterior) para visualizar o status da última importação; ao fazer upload de dados, na seção Status, você acessa uma visão geral de seus arquivos e é solicitado a prosseguir com a importação clicando em SIM ou abortar a importação clicando em CANCELAR.



Tipos de importação

Existem 4 tipos de importação suportados no Document Manager:

  • Importação de esquema
  • Importação de documentos brutos (máximo de 2000 páginas e 4000 MiB por importação)
  • Importação de conjunto de dados do Document Manager (4000 MiB por importação)
  • Importação de conjunto de dados da Estação de Validação (máximo de 2000 páginas e 4000 MiB por importação)

Importação de esquema

Se deseja iniciar uma nova sessão no Document Manager usando o mesmo esquema de uma sessão existente, siga estas etapas:

  1. Clique no botão Exportar na barra de gerenciamento.
  2. Na caixa de diálogo Exportar arquivos, marque a opção Esquema.
  3. Clique no botão Exportar dentro da caixa de diálogo. Um arquivo .zip é exportado.
  4. Clique no botão Importar na barra de gerenciamento.
  5. Carregue ou arraste e solte o arquivo .zip diretamente na nova sessão do Document Manager (não descompacte). Nesta etapa, você também pode fazer upload de um esquema predefinido.
  6. Clique em SIM na seção Status para prosseguir com a importação. O esquema é importado.

A importação de esquema agora pode ser aplicada para campos de vários valores.

Importante: esteja ciente de que os campos de vários valores são compatíveis apenas com os modelos que possuem a versão 2022.10 ou superior.

Importação de documentos brutos

Os tipos de documentos que podem ser importados para rotulagem são: .pdf, .tiff, .png, .jpg.
Arquivos .zip não são suportados para importação de documentos brutos.

As configurações de OCR precisam ser definidas antes da importação.

Siga os passos abaixo:

  1. Clique no botão docs image Importar. A caixa de diálogo Importar dados é exibida.
  2. Forneça um nome de lote no campo Batch name. Isso permite que você filtre e localize facilmente esses documentos usando o menu suspenso Pesquisar posteriormente.
    • Se você quiser usar este lote de documentos para treinar um modelo de ML, deixe desmarcada a caixa de seleção Tornar este um conjunto de avaliação.
    • Se você quiser usar este lote de documentos para avaliar um modelo de ML (ou seja, medir seu desempenho), marque a caixa de seleção Tornar este um conjunto de avaliação. Isso garante que os dados sejam ignorados pelos pipelines de treinamento.
  3. Carregue ou arraste e solte um arquivo ou conjunto de arquivos na seção Procurar ou soltar arquivos.
  4. Clique em SIM. O arquivo ou conjunto de arquivos são importados.

Importação do conjunto de dados do Document Manager

Para importar um conjunto de dados que foi rotulado anteriormente em outra sessão do Document Manager, você precisa obter o arquivo .zip que foi exportado originalmente e importá-lo diretamente para a nova instância do Document Manager.

Se sua nova instância do Document Manager estiver completamente vazia (sem dados e sem campos definidos), os documentos com rótulos e o esquema serão importados.

Se sua nova instância do Document Manager já tiver campos definidos, o conjunto de dados recém-importado precisará ter os mesmos campos ou um subconjunto desses campos. Caso contrário, a importação será rejeitada.

Caso você exporte um banco de dados de um ambiente do Automation Cloud™ e, depois, importe-o para uma implantação no local, será necessário seguir estas etapas:
  1. Descompacte o arquivo do conjunto de dados.
  2. Edite o arquivo scheman.json do arquivo.
  3. Remova todas as propriedades display_name do arquivo json e salve-o.
  4. Compacte o conjunto de dados de volta e importe-o para a sessão no local.

Dividir grandes conjuntos de dados

Para importar conjuntos de dados do Document Manager maiores que 1 GB ou que tenham mais de 1500 arquivos, recomendamos que você use este script, que divide os arquivos .zip em vários arquivos .zip menores que 1 GB e com menos de 1500 arquivos.

Importação do conjunto de dados do Validation Station

Como seu fluxo de trabalho de RPA processa documentos usando um modelo de ML existente, alguns documentos podem exigir validação manual usando a atividade Estação de Validação (disponível em robôs attended ou no navegador usando o Orchestrator Action Center).

Os dados validados gerados na Estação de Validação podem ser exportados usando a atividade Machine Learning Extractor Trainer e podem ser usados para treinar modelos de ML com a funcionalidade descrita abaixo.

Observação: para a importação do conjunto de dados da Estação de Validação, é obrigatório ter um esquema definido.

Siga os passos abaixo:

  1. Configure o Machine Learning Extractor Trainer para gerar dados em uma pasta com caminho <Trainer/Output/Folder> (use qualquer caminho de pasta vazio).
  2. Execute um fluxo de trabalho de RPA, incluindo o Validation Station e o Machine Learning Extractor Trainer.
  3. O Machine Learning Extractor Trainer cria três subpastas: documents, metadata e predictions dentro da pasta output.
  4. Compacte o arquivo <Trainer/Output/Folder> para obter um arquivo .zip, por exemplo TrainerOutputFolder.zip.
  5. Importe o arquivo .zip para o Document Manager, que detecta que a importação contém dados produzidos pelo Machine Learning Extractor Trainer e importa os dados de acordo.

Se houver campos ausentes exigidos pelo conjunto de dados, uma mensagem de erro será exibida na caixa de diálogo de importação.



Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.