- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Pontos de extremidade públicos para o Automation Cloud e Test Cloud
- Pontos de extremidade públicos para a Automation Cloud e Test Cloud Public Sector
- 1040 – tipo de documento
- 1040 Agendamento C – tipo de documento
- 1040 Agendamento D – tipo de documento
- 1040 Agendamento E – tipo de documento
- 1040x – tipo de documento
- 3949a – tipo de documento
- 4506T – tipo de documento
- 709 – tipo de documento
- 941x – tipo de documento
- 9465 – tipo de documento
- ACORD125 – tipo de documento
- ACORD126 – tipo de documento
- ACORD131 – tipo de documento
- ACORD140 – tipo de documento
- ACORD25 – tipo de documento
- Extratos bancários – tipo de documento
- Conhecimentos de embarque – tipo de documento
- Certificado de incorporação – tipo de documento
- Certificado de origem – tipo de documento
- Verificações – tipo de documento
- Certificado de produto infantil – tipo de documento
- CMS 1500 – tipo de documento
- Declaração de conformidade UE – tipo de documento
- Demonstrações financeiras – tipo de documento
- FM1003 – tipo de documento
- I9 – tipo de documento
- Cartões de identificação – tipo de documento
- Faturas – tipo de documento
- Faturas2 - tipo de documento
- Faturas Austrália – tipo de documento
- Faturas China – tipo de documento
- Faturas hebraicas – tipo de documento
- Faturas Índia – tipo de documento
- Faturas Japão – tipo de documento
- Faturas de Envio – tipo de documento
- Listas de embalagem – tipo de documento
- Holerites – tipo de documento
- Passaportes – tipo de documento
- Ordens de compra – tipo de documento
- Recibos – tipo de documento.
- Recibos2 - tipo de documento
- Recibos Japão – tipo de documento
- Avisos de Remessa – tipo de documento
- UB04 – tipo de documento
- Divulgações de fechamentos de hipotecas dos EUA - tipo de documento
- Contas de serviços públicos – tipo de documento
- Títulos de veículos – tipo de documento
- W2 – tipo de documento
- W9 – tipo de documento
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Geração de logs
- Licenciamento
- Como fazer
- Solução de problemas
Guia do usuário do Document Understanding.
Use as instruções desta página para migrar um projeto clássico ou um projeto com base no AI Center. Há duas etapas principais na migração de um projeto:
- Exportar o conjunto de dados do projeto clássico ou do projeto baseado no AI Center.
- Importar o conjunto de dados para o projeto moderno.
Limitações atuais
- Atualmente, a importação de conjuntos de dados maiores que 5000 páginas não é compatível. Apenas as 5000 páginas iniciais serão importadas com sucesso, enquanto quaisquer páginas adicionais não serão importadas. Por exemplo, se seu conjunto de dados consistir em 4999 páginas e você tentar importar um documento de 4 páginas, o processo não será bem-sucedido.
- Os nomes de lote e os resultados de lote correspondentes não estão disponíveis no momento. Se seus dados forem organizados em lotes, essas informações ainda não serão exibidas, mas serão salvas.
- As exportações do AI Center não são compatíveis. Apenas exportações do Document Manager são compatíveis.
Exportação de um conjunto de dados a partir de um projeto clássico
- Navegue até o projeto clássico que você deseja migrar e abra-o.
- Acesse o tipo de documento que você deseja exportar e selecione Abrir tipo de documento.
Figura 1. Abrir tipo de documento

- Na lista suspensa Filtrar documentos, selecione Conjunto de treinamento e validação.
Figura 2. Conjunto de treinamento e validação

- Selecione Exportar.
- Deixe os resultados da pesquisa atual selecionados e preencha um nome para seu trabalho de exportação.
- Select Download.
Figura 3. Baixar exportação

Exportar um conjunto de dados de um projeto com base no AI Center
-
Abra o AI Center e acesse a página Rotulagem de dados.
-
Selecione a Sessão de rotulagem de dados que você deseja migrar.

-
Depois que o Document Manager for aberto, na lista suspensa Filtrar documentos, selecione Conjunto de treinamento e validação.
Figura 4. Conjunto de treinamento e validação

- Selecione Exportar.
- Deixe os resultados da pesquisa atual selecionados e preencha um nome para seu trabalho de exportação.
- Select Download.
Figura 5. Baixar exportação

Importação de um conjunto de dados
- Navegue até e abra o projeto para o qual você deseja importar dados.
- Selecione Adicionar tipo de documento e crie um novo tipo de documento personalizado.
Figura 6. Adicionar tipo de documento

- No novo tipo de documento personalizado, selecione Carregar e escolha o arquivo zip do projeto clássico que você exportou. Aguarde o upload finalizar.
Observação:
As exportações do AI Center não são compatíveis. Apenas exportações do Document Manager são compatíveis.
Figura 7. Carregar processamento

Depois que o upload for concluído, os documentos estarão disponíveis para treinamento.
Treinamento do modelo
Depois que o conjunto de dados é importado, o treinamento do modelo começa. Depois que o treinamento é concluído, a pontuação do modelo é exibida. Para verificar pontuações detalhadas do modelo, selecione a pontuação e, em seguida, Pontuações detalhadas do modelo.

Essa ação leva você para a página Medir, onde você pode acessar métricas detalhadas do modelo.
Quando o mesmo conjunto de dados é usado para treinar um ML duas vezes, você pode observar métricas de modelos ligeiramente diferentes. Isso pode ocorrer devido a alguns motivos:
- Inicialização: o machine learning usa métodos de otimização que precisam de palpites iniciais para disparar os algoritmos de otimização. Diferentes palpites iniciais durante cada treinamento podem levar a vários resultados devido à natureza imprevisível desses algoritmos.
- Estado aleatório: alguns algoritmos usam aleatoriedade em suas operações. Por exemplo, ao treinar uma rede neural, procedimentos, como descida do gradiente estocástico e descida do gradiente de mini-lote, introduzem aleatoriedade. Portanto, mesmo com parâmetros e conjuntos de dados iniciais do modelo idênticos, o desempenho dos modelos pode variar em diferentes execuções.
- Regularização: certos algoritmos incluem um termo de penalidade que incentiva o modelo a manter pesos menores. Devido à aleatoriedade envolvida, o modelo pode operar com um conjunto de pesos diferente a cada vez.
No entanto, é vital observar que essas diferenças menores não implicam necessariamente que um modelo é superior ou inferior a outro. Mesmo com métricas ligeiramente variadas, a capacidade dos modelos de compreender dados permanece essencialmente a mesma, desde que as diferenças não sejam significativamente grandes. Além disso, repetir esse processo várias vezes e obter uma média deve render métricas de desempenho semelhantes.
Alterar o modelo base no Gerenciador de tipos de Documentos
Se houver uma diferença significativa entre os resultados do modelo de seu projeto clássico e o moderno, isso poderia ser causado por um modelo base diferente. de Para alterar o modelo base, prossiga com as seguintes etapas:
-
Selecione o menu de três pontos no seu tipo de documento personalizado e escolha Gerenciador de tipos de documento.

-
Navegue até a guia Configurações.
-
Selecione o modelo desejado na lista suspensa Modelo base.

-
Depois de fazer sua seleção, escolha Salvar. Para sair, selecione Voltar.
Tipos de exportação
Para projetos clássicos, há vários métodos para exportar dados. Nem todos os tipos de dados exportados são compatíveis para importação para projetos modernos. Para comparar os resultados do modelo em ambos os tipos de projeto, filtre documentos por Conjunto de treinamento e validação e selecione Escolher resultados da pesquisa para exportar o conjunto de dados. Para obter mais informações sobre cada opção, consulte a tabela a seguir.
| Tipo de exportação | Dados exportados | O que acontece com dados importados |
|---|---|---|
| Resultados da pesquisa atual | Exporta o conjunto de dados filtrado atual. Use-o junto com o filtro de Conjunto de treinamento e validação. | Documentos marcados como treinamento são usados para treinar o modelo. Documentos marcados como validação são usados para medir o desempenho do modelo. Dica: para comparar os resultados do modelo entre dois tipos de projeto, sempre exporte e importe o conjunto de dados como Treinamento e validação . |
| Tudo rotulado | Exporta todos os documentos anotados do conjunto de dados:
|
|
| Esquema | Exporta a lista de campos e suas respectivas configurações. | Um esquema é importado se não houver nenhum. Se um esquema já estiver definido, a importação falhará. |
| Todos | Exporta todos os documentos anotados e não anotados. |
|
Importação de esquemas
Você pode importar esquemas junto com conjuntos de dados para projetos modernos. Siga estas etapas para importar um esquema:
- Crie um tipo de documento personalizado na seção Criar.
- Importe o arquivo zip que contém o esquema.
Observação:
- As importações de esquema são limitadas a tipos de documentos personalizados sem esquemas pré-existentes.
- Se você importar um esquema para um tipo de documento que já contém um esquema, a importação falhará.
Migrar o fluxo de trabalho de automação
A migração de um projeto de DU clássico para um moderno em sua automação de RPA requer uma única alteração: substituir a atividade ML Extractor dentro da atividade Data Extraction Scope por um Document Understanding Project Extractor. Nenhuma outra atividade precisa mudar — as atividades de digitalização, validação e treinamento permanecem as mesmas.
Se seu fluxo de trabalho usar classificação de documentos, substitua também o classificador existente por um Classificador de projetos do Document Understanding. Consulte Migrar classificação abaixo.
Substituir a atividade do extrator de ML
- Em seu projeto do Studio, abra a atividade Data Extraction Scope .
- Remover a atividade ML Extractor existente .
- Adicione um Extrator de projetos do Document Understanding dentro do Escopo de extração de dados.
- Selecione Obter ou atualizar recursos do extrator para abrir o assistente de configuração.
- Em Credenciais de tempo de design, insira seu ID do aplicativo, Segredo do aplicativo e URL do tenant.
- Selecione Obter projetos para carregar a lista de projetos modernos disponíveis.
- Para Projeto, selecione seu projeto moderno desejado na lista suspensa.
- Para Versão, selecione uma versão implantada do projeto. Ou então, selecione uma Tag vinculada a uma versão específica. Versão e Tag são mutuamente exclusivos.
- Selecione Obter recursos.
- Certifique-se de que Atualizar Argumentos de Atividade esteja marcado.
Se você se conectar a um projeto em um tenant diferente, configure as propriedades Autenticação da atividade — Ativo de credenciais de runtime e URL de tenant de runtime — para corresponder às credenciais usadas no assistente.
Para obter detalhes completos de configuração, consulte Extrator de projetos do Document Understanding.
Migrar classificação
Se sua automação usar classificação de documentos, substitua o classificador existente por um Classificador de projetos do Document Understanding dentro do Classificar escopo do documento. As etapas de configuração espelham as do extrator: abra o Assistente para configurar classificadores, insira suas credenciais de tempo de design, selecione seu projeto e versão ou tag e selecione Obter recursos.
Para obter detalhes completos de configuração, consulte Classificador de projetos do Document Understanding.
- Limitações atuais
- Exportação de um conjunto de dados a partir de um projeto clássico
- Exportar um conjunto de dados de um projeto com base no AI Center
- Importação de um conjunto de dados
- Treinamento do modelo
- Alterar o modelo base no Gerenciador de tipos de Documentos
- Tipos de exportação
- Importação de esquemas
- Migrar o fluxo de trabalho de automação
- Substituir a atividade do extrator de ML
- Migrar classificação