
Notas de la versión de Document Understanding
2024.10.0
linkFecha de lanzamiento: 11 de noviembre de 2024
Lanzamiento LTS de Document Understanding™ 2024.10
Novedades
linkUiPath Extended Languages OCR
Nos complace anunciar que nuestro último motor OCR, UiPath Extended Languages OCR, ahora está en disponibilidad general. El nuevo OCR puede digitalizar documentos en más de 200 idiomas, lo que es una importante mejora sobre su predecesor, especialmente en lo referente al chino, el japonés y el coreano. Además, puede procesar documentos en tailandés, vietnamita, todos los principales idiomas de la India e idiomas que utilizan el alfabeto cirílico y griego.
Mejoras
linkPaquetes ML de extracción de datos
Hemos realizado mejoras significativas en nuestro proceso de digitalización de documentos. Ahora, al utilizar UiPath Extended Languages OCR, la salida serán cuadros de palabras regulares en lugar de caracteres individuales.
UiPath Document Understanding OCR
- Esta versión ofrece mejoras de precisión y rendimiento para el reconocimiento de escritura manual.
- Se mejora el reconocimiento y la detección para el reconocimiento de caracteres de tinta magnética (MIRC), lo que ofrece una mayor precisión especialmente para las comprobaciones.
- Anteriormente, los números no se reconocían en algunos casos cuando se utilizaba un espacio como separador. Ahora los números se reconocen cuando se utiliza el espacio como separador.
- La puntuación de confianza para el UiPath Document Understanding OCR se mejora, particularmente cuando se utiliza en imágenes de menor calidad. En los flujos de trabajo donde se utiliza la puntuación de confianza para decidir si los documentos necesitan validación humana en Action Center, esto puede dar como resultado un aumento del número de documentos que se someten a validación.
Corrección de errores
linkUiPath Document Understanding OCR
Hemos corregido un problema por el que los cuadros de anotación se devolvían horizontalmente, aunque algunos documentos estaban ligeramente sesgados, causando desalineación en la anotación.
Paquetes ML de extracción de datos
Hemos corregido un problema relacionado con el texto japonés al utilizar Extended Languages OCR. Este problema daba como resultado la aparición de varios espacios adicionales en ciertas situaciones debido a cuadros de caracteres individuales.