
Notas de versão do Document Understanding
2024.10.0
Data de lançamento: 11 de novembro de 2024
Document Understanding™ Versão 2024.10 LTS
Estamos animados em anunciar que nosso mais recente mecanismo de OCR, o UiPath Extended Languages OCR, agora está em disponibilidade geral. O novo OCR é capaz de digitalizar documentos em mais de 200 idiomas, trazendo uma melhoria significativa sobre seu antecessor, especialmente no que diz respeito ao chinês, japonês e coreano. Além disso, pode processar documentos em tailandês, vietnamita, todos os principais idiomas da Índia e idiomas que usam o alfabeto cirílico e grego.
Fizemos melhorias significativas em nosso processo de digitalização de documentos. Agora, ao usar o UiPath Extended Languages OCR, a saída será caixas de palavras regulares em vez de caracteres individuais.
- Essa versão traz precisão e melhorias de desempenho para reconhecimento de caligrafia.
- O reconhecimento e a detecção para o Magnetic Ink Character Recognition (MIRC) foram melhorados, trazendo precisão aprimorada, especialmente para verificações.
- Anteriormente, os números não eram reconhecidos em algumas instâncias quando um espaço era usado como separador. Os números agora são reconhecidos quando o espaço é usado como separador.
- A pontuação de confiança para o UiPath Document Understanding OCR foi melhorada, especialmente quando usada em imagens de baixa qualidade. Em fluxos de trabalho onde a pontuação de confiança é usada para decidir se os documentos precisam de validação humana no Action Center, essa melhoria pode resultar em um número maior de documentos passando por validação.
Corrigimos um problema no qual as caixas de anotação eram retornadas horizontalmente, mesmo que alguns documentos estivessem ligeiramente inclinados, causando o desalinhamento na anotação.