
Notas de la versión de Document Understanding
2024.10.0
Fecha de lanzamiento: 11 de noviembre de 2024
Lanzamiento LTS de Document Understanding™ 2024.10
Nos complace anunciar que nuestro último motor OCR, UiPath Extended Languages OCR, ahora está en disponibilidad general. El nuevo OCR puede digitalizar documentos en más de 200 idiomas, lo que es una importante mejora sobre su predecesor, especialmente en lo referente al chino, el japonés y el coreano. Además, puede procesar documentos en tailandés, vietnamita, todos los principales idiomas de la India e idiomas que utilizan el alfabeto cirílico y griego.
Hemos realizado mejoras significativas en nuestro proceso de digitalización de documentos. Ahora, al utilizar UiPath Extended Languages OCR, la salida serán cuadros de palabras regulares en lugar de caracteres individuales.
- Esta versión ofrece mejoras de precisión y rendimiento para el reconocimiento de escritura manual.
- Se mejora el reconocimiento y la detección para el reconocimiento de caracteres de tinta magnética (MIRC), lo que ofrece una mayor precisión especialmente para las comprobaciones.
- Anteriormente, los números no se reconocían en algunos casos cuando se utilizaba un espacio como separador. Ahora los números se reconocen cuando se utiliza el espacio como separador.
- La puntuación de confianza para el UiPath Document Understanding OCR se mejora, particularmente cuando se utiliza en imágenes de menor calidad. En los flujos de trabajo donde se utiliza la puntuación de confianza para decidir si los documentos necesitan validación humana en Action Center, esto puede dar como resultado un aumento del número de documentos que se someten a validación.
Hemos corregido un problema por el que los cuadros de anotación se devolvían horizontalmente, aunque algunos documentos estaban ligeramente sesgados, causando desalineación en la anotación.