2022.4.0
Data de lançamento do Document Manager On-Premises: 23 de maio de 2022
Mantenha-se atualizado com as últimas notícias sobre o Document Manager, passando pela próxima lista de alterações que ocorreram desde o último lançamento LTS até agora.
Data Manager teve seu nome alterado para Document Manager.
Uma nova opção está disponível, permitindo excluir permanentemente arquivos individuais. A opção pode ser encontrada no menu suspenso que também contém a opção de download.
Agora, você tem a opção de renomear campos criados anteriormente.
A pesquisa de conteúdo agora é possível, permitindo que você pesquise palavras em seu documento atual.
Os dados coletados da importação de um conjunto de dados agora são integrados aos arquivos JSON do campo de subset, o que significa que se, você modificar manualmente o arquivo ou excluí-lo completamente do conjunto de dados, isso não terá impacto no treinamento do modelo.
deleted
.
A visualização de documentos recebeu novas dicas de início.
EXEC sp_fulltext_service 'restart_all_fdhosts'
por um DBA com as permissões apropriadas no servidor.
Ao usar a funcionalidade de Previsão junto com o Document Manager, os dados marcados que não foram editados manualmente pelo usuário são substituídos pelos valores recebidos do modelo.
Dicas de ferramentas mais descritivas sobre os tipos de documento de Treinamento, Validação e Avaliação foram adicionadas.
A caixa de diálogo de edição de campo para campos de coluna e campos regulares foi reestruturada. As opções de pós-processamento, Várias páginas, Pontuação e Cor foram movidas para a guia Avançado. As demais opções podem ser encontradas na guia Geral.
Melhoria de velocidade na importação de documentos duplicados.
Os campos de classificação agora aparecem na ordem em que são criados.
- Corrigido um problema conhecido que fazia com que a pesquisa ou o download de um documento com caracteres que exigem codificação de URL (
&
,,
,+
,#
,'
) em seu nome de arquivo apresentasse uma falha de consulta inválida. - Corrigido um bug que fazia com que a funcionalidade Prever falhasse em documentos com texto muito denso.
- Removido o limite de importação de 2.000 documentos por sessão. Agora, você pode ter mais de 2.000 documentos em uma sessão, considerando o limite de 2.000 páginas por importação.
- Corrigido um bug que não permitia que você selecionasse mais de 3 caixas ao pressionar
ctrl
oushift
. - Corrigido um bug que fazia com que uma importação travasse no processamento até atingir o tempo limite após o pod ser reiniciado, mas o trabalho não era retomado.
- Corrigido um bug que impedia a função Prever de extrair dados de todo o documento. Observe que o limite de 10 páginas ao usar a função com pontos de extremidades públicos ainda está em vigor.
- Corrigido um bug para o Microsoft Read OCR em que os endpoints correspondentes aos subdomínios
*.cognitiveservices.azure.com
geravam um erroOCR endpoint is not valid
. - Corrigido um bug que fazia com que a importação do conjunto de dados do Document Manager misturasse páginas em documentos com mais de 10 páginas.
- Corrigido um bug que causava o download ou a exportação de um conjunto de dados vazio, ou apenas um pequeno subconjunto do conjunto de dados completo quando a opção Todos rotulados era selecionada.
- O tamanho máximo de importação diminuiu de 2GB ou 2.000 páginas para 1GB ou 2.000 páginas.
- Pesquisar ou baixar um documento contendo caracteres que exigem codificação de URL (
&
,,
,+
,#
,'
) no nome de arquivo gera o erroinvalid query
.
Para obter mais detalhes sobre todas as alterações ocorridas no Document Manager, consulte as notas de versão anteriores.
- Alguns arquivos PDF que contêm fontes Type3 podem resultar em alto uso de memória para o serviço do digitalizador. Quando isso ocorre, as operações de importação do Document Manager são prejudicadas. A mitigação para o problema é excluir manualmente os pods do Kubernetes que apresentam alto uso de memória (constantemente acima de 70%).