document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white
Document Understanding Modern Projects User Guide
Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Last updated 11 de nov de 2024

Migração de projetos clássicos

Use the instructions from this page to migrate a a project based on AI Center. There are two main steps in migrating a project:
  1. Export the dataset from the project based on AI Center.
  2. Importar o conjunto de dados para o projeto moderno.

Limitações atuais

  • Atualmente, a importação de conjuntos de dados maiores que 3000 páginas não é compatível. Apenas as 3000 páginas iniciais serão importadas com sucesso, com quaisquer páginas adicionais falhando ao fazê-lo. Por exemplo, se seu conjunto de dados consistir em 2999 páginas e você tentar importar um documento de quatro páginas, o processo não será bem-sucedido.
  • Os nomes de lote e os resultados de lote correspondentes não estão disponíveis no momento. Se seus dados forem organizados em lotes, essas informações ainda não serão exibidas, mas serão salvas.

Exportar um conjunto de dados de um projeto com base no AI Center

  1. Abra o AI Center e acesse a página Rotulagem de dados.
  2. Selecione a Sessão de rotulagem de dados que você deseja migrar.


  3. Depois que o Document Manager for aberto, na lista suspensa Filtrar documentos, selecione Conjunto de treinamento e validação.
    Figure 1. Training and validation set

  4. Selecione Exportar.
  5. Deixe os resultados da pesquisa atual selecionados e preencha um nome para seu trabalho de exportação.
  6. Selecione Baixar.
    Figure 2. Download export

Importação de um conjunto de dados

  1. Navegue até e abra o projeto para o qual você deseja importar dados.
  2. Selecione Adicionar tipo de documento e crie um novo tipo de documento personalizado.
    Figure 3. Add document type

  3. No novo tipo de documento personalizado, selecione Carregar e escolha o arquivo zip do projeto clássico que você exportou. Aguarde o upload para concluir.
    Figure 4. Upload processing

Depois que o upload for concluído, os documentos estarão disponíveis para treinamento.

Treinamento do modelo

Depois que o conjunto de dados é importado, o treinamento do modelo começa. Depois que o treinamento é concluído, a pontuação do modelo é exibida. Para verificar pontuações detalhadas do modelo, selecione a pontuação e, em seguida, Pontuações detalhadas do modelo.



Essa ação leva você para a página Medir, onde você pode acessar métricas detalhadas do modelo.

Quando o mesmo conjunto de dados é usado para treinar um ML duas vezes, você pode observar métricas de modelos ligeiramente diferentes. Isso pode ocorrer devido a alguns motivos:

  • Inicialização: o machine learning usa métodos de otimização que precisam de palpites iniciais para disparar os algoritmos de otimização. Diferentes palpites iniciais durante cada treinamento podem levar a vários resultados devido à natureza imprevisível desses algoritmos.
  • Estado aleatório: alguns algoritmos usam aleatoriedade em suas operações. Por exemplo, ao treinar uma rede neural, procedimentos, como descida do gradiente estocástico e descida do gradiente de mini-lote, introduzem aleatoriedade. Portanto, mesmo com parâmetros e conjuntos de dados iniciais do modelo idênticos, o desempenho dos modelos pode variar em diferentes execuções.
  • Regularização: certos algoritmos incluem um termo de penalidade que incentiva o modelo a manter pesos menores. Devido à aleatoriedade envolvida, o modelo pode operar com um conjunto de pesos diferente a cada vez.

No entanto, é vital observar que essas diferenças menores não implicam necessariamente que um modelo é superior ou inferior a outro. Mesmo com métricas ligeiramente variadas, a capacidade dos modelos de compreender dados permanece essencialmente a mesma, desde que as diferenças não sejam significativamente grandes. Além disso, repetir esse processo várias vezes e obter uma média deve render métricas de desempenho semelhantes.

Alterar o modelo base no Gerenciador de tipos de Documentos

Se houver uma diferença significativa entre os resultados do modelo do seu projeto clássico e o moderno, isso pode ser causado por um modelo base diferente. Para alterar o modelo base, siga as etapas abaixo.
  1. Selecione o menu de três pontos no seu tipo de documento personalizado e escolha Gerenciador de tipos de documento.


  2. Navegue até a guia Configurações.
  3. Selecione o modelo desejado na lista suspensa Modelo base.


  4. Depois de fazer sua seleção, escolha Salvar. Para sair, selecione Voltar.

Tipos de exportação

Para projetos clássicos, há vários métodos para exportar dados. Nem todos os tipos de dados exportados são compatíveis para importação para projetos modernos. Para comparar os resultados do modelo em ambos os tipos de projeto, filtre documentos por Conjunto de treinamento e validação e selecione Escolher resultados da pesquisa para exportar o conjunto de dados. Para obter mais informações sobre cada opção, consulte a tabela a seguir.

Tabela 1. Tipos de exportação
Tipo de exportaçãoDados exportadosO que acontece com dados importados
Resultados da pesquisa atualExporta o conjunto de dados filtrado atual. Use-o junto com o filtro de Conjunto de treinamento e validação. Documentos marcados como treinamento são usados para treinar o modelo. Documentos marcados como validação são usados para medir o desempenho do modelo.
Dica: para comparar os resultados do modelo entre dois tipos de projeto, sempre exporte e importe o conjunto de dados como Treinamento e validação.
Tudo rotuladoExporta todos os documentos anotados do conjunto de dados:
  • Conjunto de treinamento
  • Conjunto de validação
  • Conjunto de avaliação
  • Documentos marcados como treinamento são usados para treinar o modelo.
  • Documentos marcados como validação são usados para medir o desempenho do modelo.
  • Documentos marcados como avaliação são ignorados.
EsquemaExporta a lista de campos e suas respectivas configurações.Um esquema é importado se não houver nenhum. Se um esquema já estiver definido, a importação falhará.
TodosExporta todos os documentos anotados e não anotados.
  • Documentos marcados como treinamento são usados para treinar o modelo.
  • Documentos marcados como validação são usados para medir o desempenho do modelo.
  • Documentos marcados como avaliação são ignorados.
  • Documentos não anotados são pré-anotados e tratados como não confirmados.

Importação de esquemas

Você pode importar esquemas junto com conjuntos de dados para projetos modernos. Siga estas etapas para importar um esquema:
  1. Crie um tipo de documento personalizado na seção Criar.
  2. Importe o arquivo zip que contém o esquema.
Observação:
  • As importações de esquema são limitadas a tipos de documentos personalizados sem esquemas pré-existentes.
  • Se você importar um esquema para um tipo de documento que já contém um esquema, a importação falhará.

Esta página foi útil?

Obtenha a ajuda que você precisa
Aprendendo RPA - Cursos de automação
Fórum da comunidade da Uipath
Uipath Logo White
Confiança e segurança
© 2005-2024 UiPath. Todos os direitos reservados.