
Notas de versão do Document Understanding
Data de lançamento: 11 de novembro de 2024
Document Understanding™ Versão 2024.10 LTS
UiPath Extended Languages OCR
Estamos animados em anunciar que nosso mais recente mecanismo de OCR, o UiPath Extended Languages OCR, agora está em disponibilidade geral. O novo OCR é capaz de digitalizar documentos em mais de 200 idiomas, trazendo uma melhoria significativa sobre seu antecessor, especialmente no que diz respeito ao chinês, japonês e coreano. Além disso, pode processar documentos em tailandês, vietnamita, todos os principais idiomas da Índia e idiomas que usam o alfabeto cirílico e grego.
Pacotes de ML de extração de dados
Fizemos melhorias significativas em nosso processo de digitalização de documentos. Agora, ao usar o UiPath Extended Languages OCR, a saída será caixas de palavras regulares em vez de caracteres individuais.
UiPath Document Understanding OCR
- Essa versão traz precisão e melhorias de desempenho para reconhecimento de caligrafia.
- O reconhecimento e a detecção para o Magnetic Ink Character Recognition (MIRC) foram melhorados, trazendo precisão aprimorada, especialmente para verificações.
- Anteriormente, os números não eram reconhecidos em algumas instâncias quando um espaço era usado como separador. Os números agora são reconhecidos quando o espaço é usado como separador.
- A pontuação de confiança para o UiPath Document Understanding OCR foi melhorada, especialmente quando usada em imagens de baixa qualidade. Em fluxos de trabalho onde a pontuação de confiança é usada para decidir se os documentos precisam de validação humana no Action Center, essa melhoria pode resultar em um número maior de documentos passando por validação.
UiPath Document Understanding OCR
Corrigimos um problema no qual as caixas de anotação eram retornadas horizontalmente, mesmo que alguns documentos estivessem ligeiramente inclinados, causando o desalinhamento na anotação.
Pacotes de ML de extração de dados
Corrigimos um problema relacionado ao texto em japonês ao usar o Extended Languages OCR.Esse problema estava resultando em vários espaços extras que apareciam em certas situações devido a caixas de caracteres individuais.