document-understanding
latest
false
  • Notas de la versión de Document Understanding
  • Paquetes ML y Notas de la versión de puntos finales públicos
    • Paquetes ML generales y actualizaciones de puntos finales públicos
    • Paquetes ML e historial de versiones de puntos finales públicos
UiPath logo, featuring letters U and I in white

Notas de la versión de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última actualización 12 de dic. de 2024

Paquetes ML e historial de versiones de puntos finales públicos

v24.11.3

UiPath Document Understanding OCR

Fecha de lanzamiento: 27 de noviembre de 2024

Lanzamiento en UiPath Document Understanding OCR y puntos finales | v24.11.3

Mejoras

En esta versión, hemos mejorado la precisión y el rendimiento de varios tipos de texto. Esto incluye texto impreso en imágenes muy grandes o de baja resolución, así como texto escrito a mano.

Se ha mejorado significativamente el reconocimiento de las casillas de verificación, especialmente las representadas por cuadrados o rectángulos completamente ennegrecidos. Además, también hemos afinado la detección de firmas.

v24.9.1

UiPath Document Understanding OCR

Fecha de lanzamiento: 3 de octubre de 2024

Lanzamiento en UiPath Document Understanding OCR y puntos finales | v24.9.1

Mejoras

Esta versión ofrece mejoras de precisión y rendimiento para el reconocimiento de escritura manual.

v24.7

UiPath Document OCR

Fecha de lanzamiento: 23 de julio de 2024

Lanzamiento en UiPath Document Understanding OCR y puntos finales (incluido UiPath Document Understanding OCR_CPU) | v24.7

Mejoras

  • La precisión del idioma azerbaiyano se mejora añadiendo reconocimiento para los caracteres əƏ.
  • Se mejora el reconocimiento y la detección para el reconocimiento de caracteres de tinta magnética (MIRC), lo que ofrece una mayor precisión especialmente para las comprobaciones.
  • Anteriormente, los números no se reconocían en algunos casos cuando se utilizaba un espacio como separador. Esto ahora se mejora y los números ahora se reconocen cuando se utiliza el espacio como separador.

Corrección de errores

La puntuación de confianza para el UiPath Document Understanding OCR se mejora, particularmente cuando se utiliza en imágenes de menor calidad. En los flujos de trabajo donde se utiliza la puntuación de confianza para decidir si los documentos necesitan validación humana en Action Center, esta mejora puede dar como resultado un aumento del número de documentos que se someten a validación.

v24.4.4

Extracción de información

Fecha de lanzamiento: 3 de octubre de 2024

Lanzamiento en paquetes ML de extracción de datos | v24.4.4

Corrección de errores

  • Hemos corregido un problema que provocaba que los procesos de entrenamiento de AI Center informaran de puntuaciones altas inexactas para tipos de campo ID Number y Phone Number.Esto garantiza que las puntuaciones informadas coincidan con las puntuaciones reales.
  • Hemos corregido un problema relacionado con el análisis de valores en campos japoneses cuando el Extended Languages OCR estaba en uso.

v24.4.3

DocumentUnderstanding y Extracción de datos

Fecha de lanzamiento: 14 de agosto de 2024

Lanzamiento en puntos finales + DocumentUnderstanding + paquetes ML de extracción de datos | v24.4.3

Mejoras

Improved field text formatting for Chinese, Japanese, and Korean languages when using the UiPath® Extended Languages OCR in the digitization step.

v24.4.2

InvoicesIndia y puntos finales

Fecha de lanzamiento: 23 de julio de 2024

Lanzamiento en puntos finales y paquete ML de InvoicesIndia | v24.4.2

Corrección de errores

Hemos corregido un problema relacionado con el análisis de números en las facturas indias.

v24.4.1

DocumentUnderstanding, FacturasJapan y puntos finales

Fecha de publicación: 20 de junio de 2024

Lanzamiento en puntos finales + DocumentUnderstanding + Paquete ML InvoicesJapan | v24.4.1

Corrección de errores

Hemos corregido un problema relacionado con las fechas en los campos de columna específicamente para el idioma japonés.

v24.4.0

Clasificador de documentos y extracción de datos

Fecha de publicación: 24 de mayo de 2024

Lanzamiento en:
  • DocumentUnderstanding + paquetes ML de extracción de datos | v24.4.0
  • Paquetes ML del clasificador de documentos | v24.4.0

Novedades

Los siguientes nuevos paquetes de ML ya están en vista previa pública:

Mejoras

Esta versión también ofrece mejoras para varios otros paquetes ML:
  • Se ha mejorado la precisión del paquete ML de Facturas de Japón. También hay 11 nuevos campos para el modelo de Facturas de Japón. Para obtener la lista completa de campos extraídos, consulta el archivo de detalles de modelos listos para usar.
  • Se ha mejorado el rendimiento del modelo de Nóminas.
  • Nuevos ID están disponibles para el paquete ML de Tarjetas de Identificación:
    • Tarjetas de ID de Aadhaar
    • Tarjetas de identidad de Arabia Saudita
    • Tarjetas PAN
  • Hay nuevos campos disponibles para el paquete ML UB04. Para obtener la lista completa de campos extraídos, consulta el archivo de detalles de modelos listos para usar.
  • Hay nuevos campos disponibles para el paquete ML Comprobaciones. Para obtener la lista completa de campos extraídos, consulta el archivo de detalles de modelos listos para usar.

Fe de erratas: añadida el 20 de junio de 2024: información añadida sobre una solución de errores relacionada con el análisis de fechas japonesas.

Fe de erratas: añadida el 28 de mayo de 2024: se ha añadido más información sobre varias mejoras.

v24.3.2

Puntos finales de DocumentUnderstandingOCR

Fecha de publicación: 13 de marzo de 2024

Lanzamiento en Puntos finales de DocumentUnderstandingOCR | v24.3.2

Ahora está disponible una nueva versión para el OCR de Document Understanding para uso general.

Esta versión ofrece las siguientes mejoras:
  • Se ha mejorado la precisión para el turco (TUR).Se ha mejorado el rendimiento para los caracteres con signos diacríticos (como Ç, ç, Ğ, ğ, I, ı, İ, i, Ö, Ü, ü).
  • Se ha mejorado la precisión para los números del alfabeto árabe (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩).

v24.2.1

Puntos finales de DocumentUnderstandingOCR

Fecha de lanzamiento: 9 de febrero de 2024

Lanzamiento en Puntos finales de DocumentUnderstandingOCR | v24.2.1

Nos complace anunciar que la compatibilidad con el idioma árabe (ARA) para UiPath Document Understanding OCR ahora está en vista previa pública.

v24.2.0

Extracción de información

Fecha de lanzamiento: 1 de abril de 2024

Publicado en Paquetes ML de extracción de datos | v24.2.0

Esta versión ofrece soporte para los nuevos modelos disponibles en la vista previa pública:
  • 1040 Anexo C
  • 1040 Anexo D
  • 1040 Anexo E
  • UB04

Document Classifier

Fecha de lanzamiento: 4 de marzo de 2024

Lanzamiento en los paquetes ML de DocumentClassifier | v24.2.0

Esta versión ofrece soporte para los nuevos modelos disponibles en la vista previa pública:
  • 1040 Anexo C
  • 1040 Anexo D
  • 1040 Anexo E
  • UB04

v23.10.5

UiPath Document Understanding OCR

Fecha de lanzamiento: 15 de octubre de 2024

Lanzamiento en UiPath Document Understanding OCR y puntos finales | v23.10.5

Mejoras

Esta versión ofrece mejoras de precisión y rendimiento para el reconocimiento de escritura manual.

Corrección de errores

Hemos corregido un problema por el que los cuadros de anotación se devolvían horizontalmente, aunque algunos documentos estaban ligeramente sesgados, causando desalineación en la anotación.

v23.10.4

Extracción de información

Fecha de publicación: 28 de marzo de 2024

Publicado en paquetes ML de extracción de datos | v23.10.4

Ya está disponible para uso general una nueva versión para todos los paquetes ML listos para usar.

Esta versión ofrece las siguientes mejoras:
  • Se ha mejorado la precisión para el turco (TUR).Se ha mejorado el rendimiento para los caracteres con signos diacríticos (como Ç, ç, Ğ, ğ, I, ı, İ, i, Ö, Ü, ü).
  • Se ha mejorado la precisión para los números del alfabeto árabe (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩).
  • Se mejora la precisión de los conjuntos de datos menores de 400 páginas.

v23.10.3

DocumentUnderstanding, Extracción de datos y puntos finales

Fecha de lanzamiento: 12 de febrero de 2024

Lanzamiento en Puntos finales + DocumentUnderstanding + Paquetes ML de extracción de datos | versión 23.10.3

Ya está disponible para uso general una nueva versión para todos los paquetes ML preentrenados listos para usar que forman parte del AI Center.

Esta nueva versión incluye una corrección de errores relacionados con la extracción de valores de texto bidireccionales (de izquierda a derecha y de derecha a izquierda).

Nota: actualmente, nuestra plataforma no tiene localización para idiomas de derecha a izquierda (como el hebreo o el árabe). Como resultado, cuando se combina con signos de puntuación o caracteres especiales, el texto en esos idiomas que aparece en la interfaz de anotación (Document Manager) o la interfaz de validación (Estación de validación en Action Center) no se muestra correctamente. Sin embargo, si los valores de las cadenas se introducen en una aplicación que tenga habilitado el modo de lectura de derecha a izquierda, el texto debería mostrarse correctamente. Un ejemplo típico es el Bloc de notas, donde está habilitado el orden de lectura de derecha a izquierda.

v23.10.2

DocumentUnderstanding y Extracción de datos

Fecha de lanzamiento: 23 de enero de 2024

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v23.10.2

Ya está disponible para uso general una nueva versión para todos los paquetes ML listos para usar.

Esta versión incluye una corrección de errores que, en ocasiones, provocaba que el entrenamiento fallara.

v23.10.0

DocumentUnderstanding, Extracción de datos y puntos finales

Fecha de lanzamiento: 26 de octubre de 2023

Lanzamiento en Puntos finales + DocumentUnderstanding + Paquetes ML de extracción de datos | versión 23.10.0

Ya está disponible para uso general una nueva versión para todos los paquetes ML listos para usar.

Trabajamos constantemente para mejorar tu experiencia con Document Understanding. Para esta versión, nos aseguramos de aportar mejoras menores de seguridad y estabilidad a nuestro producto.

UiPath Document Understanding OCR

Fecha de lanzamiento: 2 de octubre de 2023

Lanzamiento en UiPath Document Understanding OCR | v23.10

Nos complace anunciar que el hebreo (HEB) es ahora compatible con UiPath Document Understanding OCR.

v23.7.0

DocumentUnderstanding y Extracción de datos

Fecha de publicación: 3 de agosto de 2023

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v23.7.0

  • En los documentos en los que una tabla se ejecuta en muchas páginas, una fila de la tabla (un elemento de línea) se divide en 2 páginas, en algunos casos incluso más. Las versiones anteriores del modelo consideraban que cada salto de página también era un salto de fila, y dividía elementos en varias partes. La versión del modelo actual corrige esta incidencia. Para beneficiarte de esta característica en un flujo de trabajo, debes utilizar la vista previa de la versión 1.23.0 del paquete DocumentUnderstanding.ML.Activities y la versión 23.7.0 del modelo en ese flujo de trabajo en particular.
  • Los modelos ahora tienen un tiempo de predicción más rápido por página y utilizan la RAM de forma más eficiente, lo que permite procesar documentos más grandes.

v23.6.0

DocumentUnderstanding y puntos finales

Fecha de lanzamiento: 13 de junio de 2023

Lanzamiento en DocumentUnderstanding + puntos finales | v23.6.0

Hemos mejorado la precisión del paquete ML UiPathDocumentOCR.

v23.4.1

DocumentUnderstanding, Extracción de datos y puntos finales

Fecha de lanzamiento: 23 de mayo de 2023

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v23.4.1

Hemos solucionado un problema que afectaba al entrenamiento del modelo.

v23.4.5

Document Understanding

Fecha de lanzamiento: 21 de abril de 2023

Publicado en DocumentUnderstanding | v23.4.5

Hemos mejorado el modelo de texto escrito general y mejorado la funcionalidad de reconocimiento de casillas de verificación.

v23.4.2

Document Understanding

Fecha de lanzamiento: 24 de marzo de 2023

Lanzamiento en DocumentUnderstanding | v23.4.2

El punto final público de UiPath Document OCR se ha actualizado y ahora ofrece compatibilidad con los idiomas de escritura manual para alemán y francés, y compatibilidad con los idiomas de impresión para danés, finlandés, noruego y sueco. A continuación encontrarás la lista completa de los nuevos idiomas compatibles: danés, sueco, noruego, finlandés, polaco, húngaro, checo, eslovaco, estonio, letón, lituano, esloveno, croata, serbio y turco.

v23.4.0

DocumentUnderstanding, Extracción de datos y puntos finales

Fecha de publicación: 10 de mayo de 2023

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v23.4.0

El UiPath Document OCR ahora está disponible como paquete preentrenado listo para usar, y está disponible tanto para el uso de GPU como de CPU. Esto permite a los clientes que prefieren evitar el uso de puntos finales públicos implementar UiPath Document OCR en sus propios tenants, en un entorno aislado.

Ahora hay disponible una lista de siete paquetes ML preentrenados nuevos disponibles para su uso general. Aquí está la lista de los siete nuevos modelos:

  • Certificado de incorporación/Buen estado
  • Certificado de origen
  • Certificado de producto secundario
  • CMS1500
  • Declaración de conformidad UE
  • Envío de facturas
  • Nóminas

Clasificador de documentos y puntos finales

Fecha de lanzamiento: 26 de abril de 2023

Lanzamiento en Puntos finales + paquetes ML del clasificador de documentos | v23.4.0

Hemos añadido nuevos tipos de documentos al paquete ML Clasificador de documentos, hemos realizado mejoras generales y hemos corregido algunos pequeños errores.

v23.2.0

DocumentUnderstanding, Extracción de datos y puntos finales

Fecha de lanzamiento: 23 de febrero de 2023

Lanzamiento en Puntos finales + DocumentUnderstanding + paquetes ML de extracción de datos | v23.2.0

Novedades y mejoras

Una nueva versión de los paquetes ML preentrenados listos para usar (23.1.0) y sus puntos finales públicos se ha lanzado, ahora utilizando la arquitectura basada en LayoutLM Transformers de última generación, que es más potente y aumenta la precisión en general, especialmente en los campos de columna (tablas).

Esta mejora ha hecho que los paquetes ML preentrenados listos para usar sean más potentes, lo que significa que puedes experimentar una latencia más larga para el entrenamiento y para las predicciones.

For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.

We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.

Se anuncia la próxima eliminación de la función de modificaciones manuales utilizada en la evaluación del modelo. Más información aquí.

Problemas conocidos

The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.

Fe de erratas 8 de mayo de 2023

Problema conocido

Se recibe un Fatal Python error: Segmentation fault cuando se ejecuta un Proceso completo o de entrenamiento. Recomendamos usar los paquetes ML con la versión v23.4 hasta que se corrija este error.

Fe de erratas 20 de abril de 2023

La puntuación general de todos los procesos es ahora Precisión. Anteriormente era una Evaluación F1. Los artefactos de evaluación de AI Center siguen conteniendo tanto precisión como puntuación F1, para que se puedan comparar con las versiones anteriores.

v23.1.0

Clasificador de documentos y puntos finales

Fecha de lanzamiento: 11 de enero de 2023

Lanzado en Endpoints y DocumentClassifier | v23.1.0

Hemos logrado mejorar las puntuaciones F1 y estas ahora también se muestran para los procesos de entrenamiento.

La carpeta Artifacts contiene una lista actualizada de artefactos.

Ahora, el modelo de DocumentClassifier predice 25 clases, en lugar de 26, debido a la eliminación de la clase Notas de entrega.

v22.12.2

Extremos

Fecha de lanzamiento: 16 de diciembre de 2022

Lanzamiento en puntos finales | v22.12.2

El punto final público de UiPath Document OCR se ha actualizado y ahora ofrece compatibilidad con los idiomas de escritura manual para alemán y francés, y compatibilidad con los idiomas de impresión para danés, finlandés, noruego y sueco.

v22.11.0

Document Understanding, Extracción de datos y puntos finales

Fecha de lanzamiento: 13 de diciembre de 2022

Lanzamiento en puntos finales + DocumentUnderstanding + paquetes ML de extracción de datos | v22.11.0

Esta versión ofrece mejoras significativas en los puntos finales públicos de los paquetes ML preentrenados listos para usar, lo que significa que ahora utilizamos la última arquitectura de aprendizaje profundo basada en LayoutLM.

Esta mejora proporciona una mayor precisión en todos los tipos de documentos, especialmente para el modelo Facturas, y también mejora la precisión en los campos de columna y tablas.

Hemos añadido nuevos campos extraídos al modelo Facturas que ahora tienen Fecha de envío, Dirección de correo electrónico del proveedor, Nombre del banco, Número de cuenta bancaria, IBAN, Código SWIFT, Dirección del banco, Número de enrutador bancario y Tipo impositivo. Puedes consultar la lista de campos extraídos accediendo a esta página y pinchando en el enlace disponible para cada modelo.

Ahora, los procesos de entrenamiento también devuelven las puntuaciones del modelo, no solo los procesos completos o de evaluación.

Las puntuaciones F1 están ahora disponibles para cada campo de columna. Hasta ahora, las puntuaciones F1 solo estaban disponibles para todos los campos de columna juntos.

v22.10.2

Extremos

Fecha de lanzamiento: 3 de febrero de 2023

Lanzamiento en puntos finales | v22.10.2

Hemos actualizado los puntos finales públicos de los paquetes ML preentrenados listos para usar y ahora utilizamos la arquitectura basada en LayoutLM Transformers de última generación.

v22.10.0

DocumentUnderstanding, Extracción de datos y puntos finales

Fecha de lanzamiento: 7 de octubre de 2022

Lanzamiento en puntos finales + DocumentUnderstanding + paquetes ML de extracción de datos | v22.10.0

Novedades y mejoras

Los siguientes modelos preentrenados aparecen ahora como oficiales, sin la etiqueta -Preview: FacturasAustralia, FacturasIndia, ÓrdenesDeCompra.

El modelo de DeliveryNotes se ha cambiado el nombre a BillsOfLading.

Ya están disponibles diez nuevos modelos preentrenados: Acord25, 1040, Cheques, Extractos bancarios, Estados financieros, Listas de embalaje, Acord131, Acord126, Acord140, Títulos de vehículos.

Corrección de errores

Se han corregido varios errores en los paquetes mencionados.

UiPath Document OCR

Fecha de lanzamiento: 4 de octubre de 2022

Lanzamiento en UiPathDocumentOCR | v22.10.0 Nube

Ahora se dispone de una nueva función para la detección de códigos de barras y códigos QR.

Se ha mejorado la precisión en cadenas largas como direcciones de correo electrónico y URL, en fuentes de anchura fija y en la detección de escritura manual y firmas.

También se ha mejorado la detección de la rotación de páginas.

v22.6.1-preview

DocumentUnderstanding, Extracción de datos y puntos finales

Fecha de lanzamiento: 10 de octubre de 2022

Lanzamiento en puntos finales + DocumentUnderstanding + paquetes ML de extracción de datos | v22.6.1-vista previa

Esta versión ofrece varias correcciones de errores a los paquetes y puntos finales de DocumentUnderstanding y Extracción de datos.

v22.6.0-preview

DocumentUnderstanding y Extracción de datos

Release date: 6 September 2022

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | vista previa v22.6.0-v22.6.0.

Hay 18 nuevos paquetes ML de vista previa disponibles con una arquitectura de modelo más avanzada para nuestros paquetes ML DU en AI Center. Puedes identificarlos fácilmente por el texto Vista previa añadido al final del nombre del paquete, por ejemplo: FacturasVistaPrevia, OrdenDeCompraVistaPrevia, Acord125VistaPrevia, etc.

Hemos actualizado la lista de puntos finales públicos con todos los nuevos paquetes ML de vista previa y se pueden consultar Puntos finales públicos.

Cabe destacar que estos modelos de vista previa no consumen unidades de DU/IA de tus derechos de licencia.

Se ha solucionado un error en el uso de habilidades privadas y ahora la habilidad privada solo se puede utilizar con una clave API que pertenezca a la misma organización que utiliza la instancia de AI Center.

v22.5.2

DocumentUnderstanding y Extracción de datos

Fecha de lanzamiento: 22 de julio de 2022

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v22.5.2

Corrección de errores

Esta revisión estabiliza la división de elementos combinando los métodos eol classifier y line_detection en un único método.

Problema conocido

Hay un problema conocido para el paquete de Facturas que ocasionalmente conduce a un error al intentar ejecutar un bucle de ajuste automático en AI Center.

v22.5.1

DocumentUnderstanding, DocumentClassifier y Extracción de datos

Fecha de lanzamiento: 18 de julio de 2022

Lanzamiento en DocumentUnderstanding + DocumentClassifier + paquetes ML de extracción de datos | v22.5.1

Corrección de errores

  • Se ha corregido un error que provocaba que los campos extraídos se mostraran en la página equivocada en la estación de validación.
  • Se ha corregido un error que provocaba que la última línea de texto de algunas páginas no se digitalizara en el administrador de documentos.
  • Se ha corregido un error que impedía mostrar algunos elementos de puntuación F1 del archivo evaluation_F1_invoices.txt en los procesos completos/de evaluación en AI Center.
  • Se ha corregido un error que provocaba que se calculara una puntuación global F1 errónea en evaluation_F1_invoices.txt file en los procesos de evaluación/completos en AI Center cuando un modelo solo tenía campos de columnas.

v22.5.0

Nube de AI Center, extracción de datos

Fecha de lanzamiento: 16 de junio de 2022

Lanzamiento en AI Center Cloud, paquetes ML de extracción de datos | v22.5.0

Mejoras

Se ha mejorado el rendimiento de todos los paquetes ML de extracción de datos.

v22.4.3

DocumentUnderstanding y Extracción de datos

Fecha de lanzamiento: 21 de julio de 2022

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v22.4.3

Esta revisión estabiliza la división de elementos combinando los métodos eol classifier y line_detection en un único método.

v22.4.2

DocumentUnderstanding, DocumentClassifier y Extracción de datos

Fecha de lanzamiento: 14 de julio de 2022

Lanzamiento en DocumentUnderstanding + DocumentClassifier + paquetes ML de extracción de datos | v22.4.2

Corrección de errores

  • Se ha corregido un error que provocaba que los campos extraídos se mostraran en la página equivocada en la estación de validación.
  • Se ha corregido un error que provocaba que la última línea de texto de algunas páginas no se digitalizara en el administrador de documentos.
  • Se ha corregido un error que impedía mostrar algunos elementos de puntuación F1 del archivo evaluation_F1_invoices.txt en los procesos completos/de evaluación en AI Center.
  • Se ha corregido un error que provocaba que se calculara una puntuación global F1 errónea en evaluation_F1_invoices.txt file en los procesos de evaluación/completos en AI Center cuando un modelo solo tenía campos de columnas.

v22.4.1

Nube de AI Center, extracción de datos

Fecha de lanzamiento: 3 de junio de 2022

Fecha de lanzamiento en AI Center Cloud, paquetes ML de extracción de datos | v22.4.1

Corrección de errores

Se ha corregido un error que se producía al ejecutar un proceso de evaluación en un modelo entrenado con el especial line_detection mode, lo que provocaba que las predicciones fueran diferentes que cuando se invocaba desde la habilidad ML.

v22.4.0

DocumentUnderstanding, DocumentClassifier y Extracción de datos

Fecha de publicación: 10 de mayo de 2022

Lanzamiento en Document Understanding + Clasificador de documentos + Paquetes ML de extracción de datos

| v22.4.0

Novedades

Las Capacidades de escritura manual están ahora disponibles para los paquetes UiPathDocumentOCR y UiPathDocumentOCR_CPU, que integran el HandwritingRecognitionOCR. Las mismas capacidades pueden encontrarse en el paquete UiPath.OCR.LocalServer de Studio.

Nueva arquitectura en paquetes ML de extracción, con importantes beneficios, especialmente para los modelos entrenados utilizando el paquete ML de DocumentUnderstanding.

Los paquetes ML Facturas de servicios, W9 y Pasaportes ya están disponibles como GA. Hay cinco nuevos paquetes ML preentrenados y listos para usar en -Vista previa para hacer más sencilla tu labor.

Hay cinco nuevos paquetes ML preentrenados y listos para usar en -Vista previa para hacer más sencilla tu labor.

La Búsqueda de documentos es una nueva característica disponible en el Document Manager, que facilita el etiquetado de documentos con un elevado número de páginas.

Mejoras

Se han introducido mejoras en los paquetes ML para la extracción de documentos en AI Center. La hoja de cálculo Excel de la evaluación ha recibido nuevas hojas, lo que permite organizar e interpretar mejor los datos evaluados.

Los paquetes ML en la instalación sin conexión de Automation Suite han recibido un nuevo paquete sin conexión.

Se han mejorado la precisión y el rendimiento del UiPathDocumentOCR.

Corrección de errores

Ya están disponibles, para su uso general, múltiples correcciones en el análisis de los campos de fecha, incluidas las fechas en los campos de columna, las fechas en los documentos turcos y las fechas muy lejanas

v22.2.3

UiPathDocumentUnderstandingOCR

Fecha de lanzamiento: 7 de marzo de 2022

Lanzamiento en UiPathDocumentOCR | v22.2.3

Capacidad superior

HandwritingRecognitionOCR integrada en UiPathDocumentOCR. En muchos casos, hay una mezcla de campos. Al integrar la capacidad de lectura de la escritura, podemos aplicar el reconocimiento correcto a cada campo: el reconocimiento de la impresión al texto impreso y el reconocimiento de la escritura al texto manuscrito.

Aunque HandwritingRecognitionOCR puede detectar cualquier tipo de escritura, está entrenado y optimizado solo para el inglés.

v22.1.6

DocumentUnderstanding, DocumentClassifier y Extracción de datos

Fecha de lanzamiento: 14 de marzo de 2022

Lanzamiento en Document Understanding + Clasificador de documentos + Paquetes ML de extracción de datos

| v22.1.6

Corrección de errores

Se ha corregido un error que provocaba el fallo de un proceso de entrenamiento o de un proceso completo en AI Center debido a un problema del paquete ML en el preprocesamiento de datos para una línea vacía.

v22.1.4

DocumentUnderstanding, DocumentClassifier y Extracción de datos

Fecha de lanzamiento: 2 de marzo de 2022

Lanzamiento en DocumentUnderstanding + DocumentClassifier + paquetes ML de extracción de datos | v22.1.4

Novedades

El paquete ML Facturas de servicios públicos ya está disponible de forma general.

Mejoras

Mejora general del rendimiento y la escalabilidad.

Mejoras significativas en las puntuaciones al entrenar con la nueva versión del paquete ML DocumentUnderstanding en comparación con las versiones anteriores.

Las fechas en los campos de columna ahora se analizan correctamente.

El análisis sintáctico de fechas reconoce ahora los nombres de los meses en turco.

seleccionados

Se ha cambiado el comportamiento de los procesos de entrenamiento y de los procesos completos cuando se entrena en la GPU frente a la CPU. Los modelos 21.10.x entrenados en las CPU eran más pequeños, por lo que se entrenaban más rápido que las versiones anteriores, aunque tenían una precisión ligeramente inferior a la anterior.

Este comportamiento se ha invertido con esta versión, por lo que el modelo que se entrena en la GPU y en la CPU es exactamente el mismo, y la velocidad de entrenamiento ha vuelto a ser la misma que antes de 2021.10, lo que significa que el entrenamiento en la CPU vuelve a ser de 10 a 20 veces más lento que en la GPU.

v21.10.11

Extracción de información

Fecha de lanzamiento: 23 de noviembre de 2021

Lanzamiento en paquetes ML de extracción de datos | v21.10.11

Se ha solucionado un error que provocaba el fallo de los procesos de entrenamiento y evaluación debido a la lógica de posprocesamiento de fechas.

v21.10.9

Extracción de información

Fecha de lanzamiento: 24 de noviembre de 2021

Lanzamiento en paquetes ML de extracción de datos | v21.10.9

Se ha corregido un fallo que mostraba un error de predicción en tiempo de ejecución.

Extracción de datos y puntos finales

Fecha de lanzamiento: 22 de octubre de 2021

Lanzamiento en paquetes ML y puntos finales de extracción de datos | v21.10.9

Novedades

El paquete ML PurchaseOrders ya está disponible de forma general y listo para usarse en escenarios de producción.

Los paquetes ML InvoicesChina, DeliveryNotes, RemittanceAdvices, W2 y W9 ya están disponibles en Vista previa pública. Te recomendamos que consultes estos paquetes y empieces a usarlos para el tipo de documentos que necesitas procesar.

Mejoras

Se ha implementado la evaluación a nivel de documento. Esto es representativo del rendimiento en tiempo de ejecución en tu flujo de trabajo RPA.

La evaluación también puede realizarse en conjuntos de datos con menos campos que el paquete ML que se está evaluando. Esto facilita la evaluación en paquetes ML preentrenados listos para usar.

Para evaluar el impacto que tiene el OCR en la precisión de la extracción, ahora se puede volver a ejecutar cuando ejecutas un proceso de evaluación. Esto requiere que se configure el OCR al crear un paquete ML y que la variable de entorno eval.redo_ocr se establezca como verdadera en el proceso de evaluación de AI Center.

El entrenamiento en la CPU utiliza ahora un modelo más pequeño para obtener entre 5 y 7 veces más velocidad. Sin embargo, debe esperarse una precisión inferior del 0 al 5 % en la CPU.

Se han añadido las columnas de confianza mínima y tasa de procesamiento directo a los archivos Evaluation.xlsx producidos por Procesos de evaluación.

El paquete ML Facturas de servicios públicos se ha mejorado sustancialmente.

Mejora del análisis de las direcciones que se saltan 1 o 2 líneas de texto.

Mejora en la extracción de valores negativos, valores muy grandes (11 dígitos o más) o fechas lejanas.

Se ha añadido soporte para los recuadros girados en los recibos.

Mejora de los espacios concatenados.

Corrección de errores

  • Se ha corregido un error que no devolvía los caracteres especiales en los campos de tipo Cadena.
  • Se ha corregido un error en el paquete ML Pasaportes por el que la fecha escrita como número ordinal (1.º, 2.º, 3.º, 4.º, etc.) no se analizaba correctamente.

Problemas conocidos

El reentrenamiento de los paquetes ML InvoicesJapan y InvoicesChina usando los datos de la estación de validación no es compatible actualmente. Como solución, utiliza Google Cloud Vision OCR.

Próximas obsolescencias

Todos los puntos finales públicos, excepto UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor y IntelligentFormExtractor, van a quedar obsoletos para las regiones no pertenecientes a Europa Occidental a partir del 1 de diciembre de 2021.

v21.10.5

Puntos finales de UiPathDocumentOCR

Fecha de lanzamiento: 13 de diciembre de 2021

Lanzamiento en puntos finales de UiPathDocumentOCR | v21.10.5

Mejoras

UiPathDocumentOCR ya está disponible también en la región de Singapur.

v21.10.1

Extracción de datos y puntos finales para UiPathDocumentOCR

Fecha de lanzamiento: 24 de septiembre de 2021

Lanzamiento en Extracción de datos y puntos finales para UiPathDocumentOCR | v21.10.1

Mejoras

Se ha añadido compatibilidad con texto rotado, incluso si la rotación se realiza en ángulos diferentes para cada palabra.

Se ha añadido soporte para texto vertical. Esta mejora está disponible de momento solo para UiPath.IntelligentOCR.Activities, incluyendo la Estación de validación, Data Manager y el Extractor con aprendizaje automático que aún no admiten texto vertical.

Mejora de la precisión en imágenes o fotos con ruido: por ejemplo, recibos, documentos de identidad o pasaportes.

v21.10

Puntos finales de FormExtractor, IntelligentFormExtractor y IntelligentKeywordClassifier

Fecha de lanzamiento: 13 de diciembre de 2021

Lanzamiento de FormExtractor + IntelligentFormExtractor + IntelligentKeywordClasificador en puntos finales | v21.10

Mejoras

El extractor de formularios, el extractor inteligente de formularios y el clasificador inteligente de palabra clave ahora también están disponibles en la región de Singapur.

v21.7

Extracción de datos y puntos finales para el reconocimiento de escritura manual

Fecha de lanzamiento: 11 de agosto de 2021

Lanzamiento en Extracción de datos y puntos finales para el reconocimiento de escritura manual | v21.7

Mejoras

Posibilidad de tratar varios fragmentos en una única llamada al modelo.

Reentrenamiento del modelo y algunos otros cambios para mejorar la precisión del modelo.

Corrección de errores

Se ha solucionado un error que provocaba que el pod se reiniciara cuando no quedaba memoria.

v21.6.3

UiPathDocumentOCR en puntos finales

Fecha de publicación: 9 de junio de 2021

Lanzamiento en puntos finales para UiPathDocumentOCR | v21.6.3

Mejoras

Mejora de la detección de un solo dígito.

Mayor precisión en los caracteres 1, I y L.

Mejora de la detección del texto cuando está junto.

v21.5.5

Extracción de datos y puntos finales

Fecha de lanzamiento: 18 de junio de 2021

Lanzamiento en puntos finales y paquetes ML de extracción de datos | v21.5.5

Se ha corregido un error que provocaba diferencias de predicción entre Data Manager y la actividad Digitalizar documento.

v21.5.3

Extracción de datos y puntos finales

Fecha de lanzamiento: 8 de junio de 2021

Lanzamiento en puntos finales y paquetes ML de extracción de datos | v21.5.3

Novedades

Para las imágenes difíciles de leer, como en el caso de Documentos de identificación y Pasaportes, se han lanzado dos nuevos paquetes preentrenados listos para usar correspondientes.

Mejoras

Incorporamos campos de clasificación reentrenables en nuestros paquetes preentrenados listos para usar.

v21.4.7

Extracción de datos y puntos finales

Fecha de lanzamiento: 20 de abril de 2021

Lanzamiento en puntos finales y paquetes ML de extracción de datos | v21.4.7

Mejora del análisis sintáctico de fechas para los paquetes ML de extracción de datos.

v21.4.5

Extracción de datos y puntos finales

Fecha de publicación: 15 de abril de 2021

Lanzamiento en puntos finales y paquetes ML de extracción de datos | v21.4.5

Novedades

Se han implementado todos los puntos finales públicos en la región de Estados Unidos.

Se han implementado los puntos finales públicos para el extractor de formularios, el extractor inteligente de formularios y el clasificador inteligente de palabra clave en las regiones de Canadá y Japón.

v21.4

Extracción de datos y puntos finales para el Reconocimiento de escritura a mano y Clasificador de documentos

Fecha de publicación: 9 de marzo de 2021

Lanzamiento en paquetes ML de extracción de datos y puntos finales para HandwritingRecognition, DocumentClassifier, + Docker independiente para UiPathDocumentOCR | v21.4

Novedades

El Reconocimiento de escritura a mano con reconocimiento mejorado utilizando correcciones de ortografía y capacidad de leer texto impreso por máquina alcanza la disponibilidad general.

El Clasificador de documentos también alcanza la disponibilidad general.

Mejoras en UiPathDocumentOCR para:

  • Detección de botones de radio/casillas de verificación
  • Precisión en los formularios burbuja
  • Precisión general

v21.1.8

Extracción de datos y puntos finales

Fecha de lanzamiento: 17 de febrero de 2021

Lanzamiento en puntos finales y paquetes ML de extracción de datos | v21.1.8

Mejoras

Precisión mejorada.

InvoicesIndia y InvoicesAustralia ya están disponibles de forma general.

Puntos finales públicos implementados en la región de Australia.

El argumento de la edición ya no es necesario en las URL de los puntos finales. Por ejemplo, https://du.uipath.com/ie/invoices funcionará tanto para el tráfico empresarial como para el comunitario.

v20.11.3

Extracción de información

Fecha de publicación: 18 de diciembre de 2020

Lanzamiento en paquetes ML de extracción de datos | v20.11.3

Mejoras

Mejoras en el entrenamiento de la CPU para que sea más rápida y requiera menos memoria.

Mejoras en el análisis de la fecha para los documentos fuera de Estados Unidos.

Reconocimiento de casillas de verificación para UiPathDocumentOCR, incluidas casillas de verificación impresas o escritas a mano.

v20.10.4

Extracción de datos y puntos finales

Fecha de lanzamiento: 10 de noviembre de 2020

Lanzamiento en puntos finales y paquetes ML de extracción de datos | v20.10.4

Nuevas características y mejoras

Un nuevo modelo para las facturas japonesas.

Las líneas de evaluación ahora también devuelven métricas para los campos de clasificación.

Compatibilidad con la versión 3 de Microsoft Read OCR.

Mejoras en el formato de fechas para detectar los formatos de día/mes/año frente a los de mes/día/año.

Mejoras en la detección de puntos decimales y separadores de miles para el correcto análisis de los números.

El entrenamiento en la CPU es compatible con todas las versiones de AI Fabric.

Se ha mejorado el análisis sintáctico de los campos con tipo de contenido id-no.

Soporte para la formación de campos de clasificación (sin campos regulares o de columna).

Se ha aumentado el número máximo de campos permitidos de 32 a 40.

Informa de los niveles de confianza de los campos de la columna.

Problemas conocidos

Al crear un paquete UiPath.DocumentUnderstanding.ML.Activities en AI Center, el nombre del paquete no debe contener ninguna palabra clave reservada de Python, como class, break, from, finally, global o None. Ten en cuenta que esta lista no es exhaustiva, ya que el nombre del paquete se usa para class <pkg-name> y import <pkg-name>.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.