document-understanding

2022.4

true

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Notas de versão do Document Understanding

2022.4.0

Data de lançamento do Document Manager On-Premises: 23 de maio de 2022

Mantenha-se atualizado com as últimas notícias sobre o Document Manager, passando pela próxima lista de alterações que ocorreram desde o último lançamento LTS até agora.

Novidades

Data Manager teve seu nome alterado para Document Manager.

Uma nova opção está disponível, permitindo excluir permanentemente arquivos individuais. A opção pode ser encontrada no menu suspenso que também contém a opção de download.

Agora, você tem a opção de renomear campos criados anteriormente.

A pesquisa de conteúdo agora é possível, permitindo que você pesquise palavras em seu documento atual.

Os dados coletados da importação de um conjunto de dados agora são integrados aos arquivos JSON do campo de subset, o que significa que se, você modificar manualmente o arquivo ou excluí-lo completamente do conjunto de dados, isso não terá impacto no treinamento do modelo.

Os documentos excluídos agora são removidos da desduplicação, o que significa que, agora, você pode importar o mesmo documento duas vezes. Os documentos excluídos também são removidos da pesquisa ou filtragem, portanto, a pesquisa engloba apenas documentos não excluídos, a menos que você esteja usando a palavra-chave deleted.

A visualização de documentos recebeu novas dicas de início.

Melhorias

Uma implantação local que está usando a instalação do servidor SQL com a opção de pesquisa de texto completo desabilitada requer, no momento da instalação, uma reinicialização do serviço de pesquisa de texto completo para habilitá-lo. Isso pode ser feito executando o comando EXEC sp_fulltext_service 'restart_all_fdhosts' por um DBA com as permissões apropriadas no servidor.

Ao usar a funcionalidade de Previsão junto com o Document Manager, os dados marcados que não foram editados manualmente pelo usuário são substituídos pelos valores recebidos do modelo.

Dicas de ferramentas mais descritivas sobre os tipos de documento de Treinamento, Validação e Avaliação foram adicionadas.

A caixa de diálogo de edição de campo para campos de coluna e campos regulares foi reestruturada. As opções de pós-processamento, Várias páginas, Pontuação e Cor foram movidas para a guia Avançado. As demais opções podem ser encontradas na guia Geral.

Melhoria de velocidade na importação de documentos duplicados.

Os campos de classificação agora aparecem na ordem em que são criados.

Correções de bugs

Corrigido um problema conhecido que fazia com que a pesquisa ou o download de um documento com caracteres que exigem codificação de URL (&, ,, +, #, ') em seu nome de arquivo apresentasse uma falha de consulta inválida.
Corrigido um bug que fazia com que a funcionalidade Prever falhasse em documentos com texto muito denso.
Removido o limite de importação de 2.000 documentos por sessão. Agora, você pode ter mais de 2.000 documentos em uma sessão, considerando o limite de 2.000 páginas por importação.
Corrigido um bug que não permitia que você selecionasse mais de 3 caixas ao pressionar ctrl ou shift.
Corrigido um bug que fazia com que uma importação travasse no processamento até atingir o tempo limite após o pod ser reiniciado, mas o trabalho não era retomado.
Corrigido um bug que impedia a função Prever de extrair dados de todo o documento. Observe que o limite de 10 páginas ao usar a função com pontos de extremidades públicos ainda está em vigor.
Corrigido um bug para o Microsoft Read OCR em que os endpoints correspondentes aos subdomínios *.cognitiveservices.azure.com geravam um erro OCR endpoint is not valid.
Corrigido um bug que fazia com que a importação do conjunto de dados do Document Manager misturasse páginas em documentos com mais de 10 páginas.
Corrigido um bug que causava o download ou a exportação de um conjunto de dados vazio, ou apenas um pequeno subconjunto do conjunto de dados completo quando a opção Todos rotulados era selecionada.

Problemas conhecidos

O tamanho máximo de importação diminuiu de 2GB ou 2.000 páginas para 1GB ou 2.000 páginas.
Pesquisar ou baixar um documento contendo caracteres que exigem codificação de URL (&, ,, +, #, ') no nome de arquivo gera o erro invalid query.

Para obter mais detalhes sobre todas as alterações ocorridas no Document Manager, consulte as notas de versão anteriores.

3 de junho de 2022

Problemas conhecidos

Alguns arquivos PDF que contêm fontes Type3 podem resultar em alto uso de memória para o serviço do digitalizador. Quando isso ocorre, as operações de importação do Document Manager são prejudicadas. A mitigação para o problema é excluir manualmente os pods do Kubernetes que apresentam alto uso de memória (constantemente acima de 70%).

Nesta página

Novidades
Melhorias
Correções de bugs
Problemas conhecidos
3 de junho de 2022
Problemas conhecidos

Esta página foi útil?

Anterior2022.4.1