- Notas de Versão
Março de 2022
DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados lançados no AI Center Cloud, pacote versão 22.1.6
Correções de bugs
- Corrigido um bug que estava causando a falha de um pipeline de treinamento ou de um pipeline completo no AI Center devido a um problema de pacote de ML no pré-processamento de dados para uma linha vazia.
UiPathDocumentOCR - Lançado no AI Center Cloud, versão de pacote 22.2.31
Capacidade superior
HandwritingRecognitionOCR integrado ao UiPathDocumentOCR. Em muitos casos, há uma mistura de campos. Ao integrar a capacidade de leitura de manuscrito, podemos aplicar o reconhecimento correto a cada campo: reconhecimento de impressão para texto impresso e reconhecimento de manuscrito para texto manuscrito.
Embora o HandwritingRecognitionOCR possa detectar qualquer manuscrito, tenha em mente que ele é treinado e otimizado apenas para inglês.
Melhorias
Aumento do limite de contagem de palavras de 1600 para 10000 por página.
μ
, ≤
, ≥
, <
, >
.
DocumentUnderstanding + DocumentClassifier + Pacotes de ML de Extração de Dados lançados no AI Center Cloud, versão de pacote 22.1.41
Novidades
O pacote de ML para Contas de serviços públicos agora está disponível para público geral.
Melhorias
Melhor desempenho geral e escalabilidade.
Melhorias significativas nas pontuações ao treinar na nova versão do Pacote de ML DocumentUnderstanding em comparação às versões anteriores.
As datas nos campos da coluna agora são analisadas corretamente.
A análise de data agora reconhece os nomes dos meses turcos.
Alterações
Alterado o comportamento para pipelines de treinamento e pipelines completos ao treinar na GPU versus na CPU. Os modelos 21.10.x treinados em CPUs eram menores, então treinavam mais rápido do que as versões anteriores, embora tivessem uma precisão um pouco menor do que antes.
Esse comportamento foi revertido com esta versão, portanto, o modelo que está sendo treinado na GPU e na CPU é exatamente o mesmo, e a velocidade de treinamento foi revertida para o que era antes de 2021.10, o que significa que o treinamento na CPU é novamente 10-20X mais lento do que na GPU.
Melhorias
Dicas de ferramentas mais descritivas sobre os tipos de documento de Treinamento, Validação e Avaliação foram adicionadas.
Correções de bugs
- Corrigido um problema conhecido que fazia com que a pesquisa ou o download de um documento com caracteres que exigem codificação de URL (
&
,,
,+
,#
,'
) em seu nome de arquivo apresentasse uma falha de consulta inválida. - Corrigido um bug que fazia com que a funcionalidade Prever falhasse em documentos com texto muito denso.
Melhorias
Ctrl
+ Shift
+ F
.
Ao usar a funcionalidade de Previsão, os dados rotulados manualmente são excluídos e o documento é substituído pelos novos valores do modelo.
split.csv
não é mais usado ao importar um conjunto de dados para outra sessão do Document Manager ou ao executar um pipeline de treinamento. Os dados do arquivo agora estão integrados aos arquivos JSON da pasta mais recente no conjunto de dados, especificamente no campo subconjunto. Portanto, se você modificar manualmente o arquivo ou excluí-lo completamente do conjunto de dados, isso não afetará o treinamento do modelo. No entanto, tenha em mente que o arquivo ainda é mantido para exportação em nível de documento no caso de Pacotes de ML versão 21.10 ou anterior.
Adicionado a opção de excluir arquivos individuais permanentemente. Ela pode ser encontrada na lista suspensa ao lado do nome do documento, junto à opção de download.