document-understanding

2024.10

true

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Guia do usuário de projetos modernos do Document Understanding

ENTREGA:

Última atualização 15 de set de 2025

Migração de projetos clássicos

Use as instruções desta página para migrar um projeto baseado no AI Center. Há duas etapas principais na migração de um projeto:

Exporte o conjunto de dados do projeto baseado no AI Center.
Importar o conjunto de dados para o projeto moderno.

Limitações atuais

Atualmente, a importação de conjuntos de dados maiores que 3000 páginas não é compatível. Apenas as 3000 páginas iniciais serão importadas com sucesso, com quaisquer páginas adicionais falhando ao fazê-lo. Por exemplo, se seu conjunto de dados consistir em 2999 páginas e você tentar importar um documento de quatro páginas, o processo não será bem-sucedido.
Os nomes de lote e os resultados de lote correspondentes não estão disponíveis no momento. Se seus dados forem organizados em lotes, essas informações ainda não serão exibidas, mas serão salvas.
As exportações do AI Center não são compatíveis. Apenas exportações do Document Manager são compatíveis.

Exportar um conjunto de dados de um projeto com base no AI Center

Abra o AI Center e acesse a página Rotulagem de dados.
Selecione a Sessão de rotulagem de dados que você deseja migrar.
Depois que o Document Manager for aberto, na lista suspensa Filtrar documentos, selecione Conjunto de treinamento e validação.

Figura 1. Conjunto de treinamento e validação
Selecione Exportar.
Deixe os resultados da pesquisa atual selecionados e preencha um nome para seu trabalho de exportação.
Selecione Baixar.

Figura 2. Baixar exportação

Importação de um conjunto de dados

Navegue até e abra o projeto para o qual você deseja importar dados.
Selecione Adicionar tipo de documento e crie um novo tipo de documento personalizado.

Figura 3. Adicionar tipo de documento
No novo tipo de documento personalizado, selecione Carregar e escolha o arquivo zip do projeto clássico que você exportou. Aguarde o upload para concluir.

Observação: as exportações do AI Center não são compatíveis. Apenas exportações do Document Manager são compatíveis.

Figura 4. Carregar processamento

Depois que o upload for concluído, os documentos estarão disponíveis para treinamento.

Treinamento do modelo

Depois que o conjunto de dados é importado, o treinamento do modelo começa. Depois que o treinamento é concluído, a pontuação do modelo é exibida. Para verificar pontuações detalhadas do modelo, selecione a pontuação e, em seguida, Pontuações detalhadas do modelo.

Essa ação leva você para a página Medir, onde você pode acessar métricas detalhadas do modelo.

Quando o mesmo conjunto de dados é usado para treinar um ML duas vezes, você pode observar métricas de modelos ligeiramente diferentes. Isso pode ocorrer devido a alguns motivos:

Inicialização: o machine learning usa métodos de otimização que precisam de palpites iniciais para disparar os algoritmos de otimização. Diferentes palpites iniciais durante cada treinamento podem levar a vários resultados devido à natureza imprevisível desses algoritmos.
Estado aleatório: alguns algoritmos usam aleatoriedade em suas operações. Por exemplo, ao treinar uma rede neural, procedimentos, como descida do gradiente estocástico e descida do gradiente de mini-lote, introduzem aleatoriedade. Portanto, mesmo com parâmetros e conjuntos de dados iniciais do modelo idênticos, o desempenho dos modelos pode variar em diferentes execuções.
Regularização: certos algoritmos incluem um termo de penalidade que incentiva o modelo a manter pesos menores. Devido à aleatoriedade envolvida, o modelo pode operar com um conjunto de pesos diferente a cada vez.

No entanto, é vital observar que essas diferenças menores não implicam necessariamente que um modelo é superior ou inferior a outro. Mesmo com métricas ligeiramente variadas, a capacidade dos modelos de compreender dados permanece essencialmente a mesma, desde que as diferenças não sejam significativamente grandes. Além disso, repetir esse processo várias vezes e obter uma média deve render métricas de desempenho semelhantes.

Alterar o modelo base no Gerenciador de tipos de Documentos

Se houver uma diferença significativa entre os resultados do modelo de seu projeto clássico e o moderno, isso poderia ser causado por um modelo base diferente. de Para alterar o modelo base, prossiga com as seguintes etapas:

Selecione o menu de três pontos no seu tipo de documento personalizado e escolha Gerenciador de tipos de documento.
Navegue até a guia Configurações.
Selecione o modelo desejado na lista suspensa Modelo base.
Depois de fazer sua seleção, escolha Salvar. Para sair, selecione Voltar.

Tipos de exportação

Para projetos clássicos, há vários métodos para exportar dados. Nem todos os tipos de dados exportados são compatíveis para importação para projetos modernos. Para comparar os resultados do modelo em ambos os tipos de projeto, filtre documentos por Conjunto de treinamento e validação e selecione Escolher resultados da pesquisa para exportar o conjunto de dados. Para obter mais informações sobre cada opção, consulte a tabela a seguir.

Tabela 1. Tipos de exportação
Tipo de exportação	Dados exportados	O que acontece com dados importados
Resultados da pesquisa atual	Exporta o conjunto de dados filtrado atual. Use-o junto com o filtro de Conjunto de treinamento e validação.	Documentos marcados como treinamento são usados para treinar o modelo. Documentos marcados como validação são usados para medir o desempenho do modelo. Dica: para comparar os resultados do modelo entre dois tipos de projeto, sempre exporte e importe o conjunto de dados como Treinamento e validação.
Tudo rotulado	Exporta todos os documentos anotados do conjunto de dados: Conjunto de treinamento Conjunto de validação Conjunto de avaliação	Documentos marcados como treinamento são usados para treinar o modelo. Documentos marcados como validação são usados para medir o desempenho do modelo. Documentos marcados como avaliação são ignorados.
Esquema	Exporta a lista de campos e suas respectivas configurações.	Um esquema é importado se não houver nenhum. Se um esquema já estiver definido, a importação falhará.
Todos	Exporta todos os documentos anotados e não anotados.	Documentos marcados como treinamento são usados para treinar o modelo. Documentos marcados como validação são usados para medir o desempenho do modelo. Documentos marcados como avaliação são ignorados. Documentos não anotados são pré-anotados e tratados como não confirmados.

Importação de esquemas

Você pode importar esquemas junto com conjuntos de dados para projetos modernos. Siga estas etapas para importar um esquema:

Crie um tipo de documento personalizado na seção Criar.
Importe o arquivo zip que contém o esquema.

Observação:

As importações de esquema são limitadas a tipos de documentos personalizados sem esquemas pré-existentes.
Se você importar um esquema para um tipo de documento que já contém um esquema, a importação falhará.

Nesta página

Limitações atuais
Exportar um conjunto de dados de um projeto com base no AI Center
Importação de um conjunto de dados
Treinamento do modelo
Alterar o modelo base no Gerenciador de tipos de Documentos
Tipos de exportação
Importação de esquemas

Esta página foi útil?

AnteriorControle de acesso baseado em função

AvançarEscolha do tipo de automação

Suporte e serviços

Obtenha a ajuda que você precisa

UiPath Academy

Aprendendo RPA - Cursos de automação

Fórum do UiPath

Fórum da comunidade da Uipath

Confiança e segurança

Termos de Uso

Política de Privacidade

Política de cookies