Document Understanding
Más reciente
False
  • Notas de la versión de Document Understanding
  • Notas de lanzamiento de los paquetes ML
    • Actualizaciones generales de paquetes ML
    • Historial de versiones de paquetes ML
Notas de la versión de Document Understanding
Last updated 28 de jun. de 2024

Historial de versiones de paquetes ML

v24.4.1

DocumentUnderstanding, InvoicesJapan, and endpoints

Fecha de publicación: 20 de junio de 2024

Released in Endpoints + DocumentUnderstanding + InvoicesJapan ML package | v24.4.1

Corrección de errores

We fixed an issue related to dates in column fields specifically for the Japanese language.

v24.4.0

DocumentClassifier and Data Extraction

Fecha de publicación: 24 de mayo de 2024

Lanzamiento en:
  • DocumentUnderstanding + paquetes ML de extracción de datos | v24.4.0
  • Paquetes ML del clasificador de documentos | v24.4.0

Novedades

Los siguientes nuevos paquetes de ML ya están en vista previa pública:

Mejoras

Esta versión también ofrece mejoras para varios otros paquetes ML:
  • Se ha mejorado la precisión del paquete ML de Facturas de Japón. También hay 11 nuevos campos para el modelo de Facturas de Japón. Para obtener la lista completa de campos extraídos, consulta el archivo de detalles de modelos listos para usar.
  • Se ha mejorado el rendimiento del modelo de Nóminas.
  • Nuevos ID están disponibles para el paquete ML de Tarjetas de Identificación:
    • Tarjetas de ID de Aadhaar
    • Tarjetas de identidad de Arabia Saudita
    • Tarjetas PAN
  • Hay nuevos campos disponibles para el paquete ML UB04. Para obtener la lista completa de campos extraídos, consulta el archivo de detalles de modelos listos para usar.
  • Hay nuevos campos disponibles para el paquete ML Comprobaciones. Para obtener la lista completa de campos extraídos, consulta el archivo de detalles de modelos listos para usar.

Erratum - added 20 June 2024: Added information regarding a bug fix related to the parsing of Japanese dates.

Fe de erratas: añadida el 28 de mayo de 2024: se ha añadido más información sobre varias mejoras.

v24.3.2

DocumentUnderstandingOCR endpoints

Fecha de publicación: 13 de marzo de 2024

Lanzamiento en Puntos finales de DocumentUnderstandingOCR | v24.3.2

Ahora está disponible una nueva versión para el OCR de Document Understanding para uso general.

Esta versión ofrece las siguientes mejoras:
  • Se ha mejorado la precisión para el turco (TUR).Se ha mejorado el rendimiento para los caracteres con signos diacríticos (como Ç, ç, Ğ, ğ, I, ı, İ, i, Ö, Ü, ü).
  • Se ha mejorado la precisión para los números del alfabeto árabe (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩).

v24.2.1

DocumentUnderstandingOCR endpoints

Release date: 9 February 2024

Lanzamiento en Puntos finales de DocumentUnderstandingOCR | v24.2.1

Nos complace anunciar que la compatibilidad con el idioma árabe (ARA) para UiPath Document Understanding OCR ahora está en vista previa pública.

v24.2.0

Extracción de información

Release date: 1 April 2024

Publicado en Paquetes ML de extracción de datos | v24.2.0

Esta versión ofrece soporte para los nuevos modelos disponibles en la vista previa pública:
  • 1040 Anexo C
  • 1040 Anexo D
  • 1040 Anexo E
  • UB04

Document Classifier

Release date: 4 March 2024

Lanzamiento en los paquetes ML de DocumentClassifier | v24.2.0

Esta versión ofrece soporte para los nuevos modelos disponibles en la vista previa pública:
  • 1040 Anexo C
  • 1040 Anexo D
  • 1040 Anexo E
  • UB04

v23.10.4

Extracción de información

Fecha de publicación: 28 de marzo de 2024

Publicado en paquetes ML de extracción de datos | v23.10.4

Ya está disponible para uso general una nueva versión para todos los paquetes ML listos para usar.

Esta versión ofrece las siguientes mejoras:
  • Se ha mejorado la precisión para el turco (TUR).Se ha mejorado el rendimiento para los caracteres con signos diacríticos (como Ç, ç, Ğ, ğ, I, ı, İ, i, Ö, Ü, ü).
  • Se ha mejorado la precisión para los números del alfabeto árabe (٠, ١, ٢, ٣, ٤, ٥, ٦, ٧, ٨, ٩).
  • The accuracy for datasets smaller than 400 pages is improved.

v23.10.3

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 12 February 2024

Lanzamiento en Puntos finales + DocumentUnderstanding + Paquetes ML de extracción de datos | versión 23.10.3

Ya está disponible para uso general una nueva versión para todos los paquetes ML preentrenados listos para usar que forman parte del AI Center.

Esta nueva versión incluye una corrección de errores relacionados con la extracción de valores de texto bidireccionales (de izquierda a derecha y de derecha a izquierda).

Nota: actualmente, nuestra plataforma no tiene localización para idiomas de derecha a izquierda (como el hebreo o el árabe). Como resultado, cuando se combina con signos de puntuación o caracteres especiales, el texto en esos idiomas que aparece en la interfaz de anotación (Document Manager) o la interfaz de validación (Estación de validación en Action Center) no se muestra correctamente. Sin embargo, si los valores de las cadenas se introducen en una aplicación que tenga habilitado el modo de lectura de derecha a izquierda, el texto debería mostrarse correctamente. Un ejemplo típico es el Bloc de notas, donde está habilitado el orden de lectura de derecha a izquierda.

v23.10.2

DocumentUnderstanding and Data Extraction

Release date: 23 January 2024

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v23.10.2

Ya está disponible para uso general una nueva versión para todos los paquetes ML listos para usar.

Esta versión incluye una corrección de errores que, en ocasiones, provocaba que el entrenamiento fallara.

v23.10.0

DocumentUnderstanding, Data Extraction, and endpoints

Fecha de lanzamiento: 26 de octubre de 2023

Lanzamiento en Puntos finales + DocumentUnderstanding + Paquetes ML de extracción de datos | versión 23.10.0

Ya está disponible para uso general una nueva versión para todos los paquetes ML listos para usar.

Trabajamos constantemente para mejorar tu experiencia con Document Understanding. Para esta versión, nos aseguramos de aportar mejoras menores de seguridad y estabilidad a nuestro producto.

UiPath Document Understanding OCR

Fecha de lanzamiento: 2 de octubre de 2023

Released in UiPath Document Understanding OCR | v23.10

Nos complace anunciar que el hebreo (HEB) es ahora compatible con UiPath Document Understanding OCR.

v23.7.0

DocumentUnderstanding and Data Extraction

Fecha de publicación: 3 de agosto de 2023

Released in DocumentUnderstanding + Data Extraction ML packages | v23.7.0

  • En los documentos en los que una tabla se ejecuta en muchas páginas, una fila de la tabla (un elemento de línea) se divide en 2 páginas, en algunos casos incluso más. Las versiones anteriores del modelo consideraban que cada salto de página también era un salto de fila, y dividía elementos en varias partes. La versión del modelo actual corrige esta incidencia. Para beneficiarte de esta característica en un flujo de trabajo, debes utilizar la vista previa de la versión 1.23.0 del paquete DocumentUnderstanding.ML.Activities y la versión 23.7.0 del modelo en ese flujo de trabajo en particular.
  • Los modelos ahora tienen un tiempo de predicción más rápido por página y utilizan la RAM de forma más eficiente, lo que permite procesar documentos más grandes.

v23.6.0

DocumentUnderstanding and endpoints

Fecha de lanzamiento: 13 de junio de 2023

Released in DocumentUnderstanding + endpoints | v23.6.0

We've improved the accuracy of the UiPathDocumentOCR ML package.

v23.4.1

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 23 May 2023

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v23.4.1

Hemos solucionado un problema que afectaba al entrenamiento del modelo.

v23.4.5

Document Understanding

Release date: 21 April 2023

Publicado en DocumentUnderstanding | v23.4.5

Hemos mejorado el modelo de texto escrito general y mejorado la funcionalidad de reconocimiento de casillas de verificación.

v23.4.2

Document Understanding

Release date: 24 March 2023

Released in DocumentUnderstanding | v23.4.2

El punto final público de UiPath Document OCR se ha actualizado y ahora ofrece compatibilidad con los idiomas de escritura manual para alemán y francés, y compatibilidad con los idiomas de impresión para danés, finlandés, noruego y sueco. A continuación encontrarás la lista completa de los nuevos idiomas compatibles: danés, sueco, noruego, finlandés, polaco, húngaro, checo, eslovaco, estonio, letón, lituano, esloveno, croata, serbio y turco.

v23.4.0

DocumentUnderstanding, Data Extraction, and endpoints

Fecha de publicación: 10 de mayo de 2023

Lanzamiento en DocumentUnderstanding + paquetes ML de extracción de datos | v23.4.0

The UiPath Document OCR is now available as an out-of-the-box pre-trained package, and it is available for both GPU and CPU usage. This enables customers who prefer to avoid using public endpoints to deploy UiPath Document OCR in their own tenants, in an isolated environment.

Ahora hay disponible una lista de siete paquetes ML preentrenados nuevos disponibles para su uso general. Aquí está la lista de los siete nuevos modelos:

  • Certificado de incorporación/Buen estado
  • Certificado de origen
  • Certificado de producto secundario
  • CMS1500
  • Declaración de conformidad UE
  • Envío de facturas
  • Nóminas

DocumentClassifier and endpoints

Fecha de lanzamiento: 26 de abril de 2023

Lanzamiento en Puntos finales + paquetes ML del clasificador de documentos | v23.4.0

We've added new document types to the DocumentClassifier ML Package, made general improvements, and fixed some small bugs.

v23.2.0

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 23 February 2023

Lanzamiento en Puntos finales + DocumentUnderstanding + paquetes ML de extracción de datos | v23.2.0

Novedades y mejoras

A new version of the out-of-the-box pre-trained ML packages (23.1.0) and their public endpoints has been released, now using cutting edge LayoutLM Transformers based architecture, which is more powerful and increases accuracy overall, especially on column fields (tables).

This improvement has made the out-of-the-box pre-trained ML packages more powerful, meaning that you may experience longer latency for training and for predictions.

For all situations where latency is critical (e.g.: attended scenarios) we recommend deploying the models as ML Skills using a GPU.

We have improved how the scores are calculated after Training/Evaluation/Full pipelines to provide a separate score for each column field. Before this improvement, F1 scores were calculated as a whole, for all column fields taken together.

Se anuncia una próxima eliminación de la característica Ediciones manuales utilizada en la evaluación del modelo. Consulta más información aquí.

Problemas conocidos

The project import from AI Center is currently disabled. We are actively working on this and expect to have it reenabled by the end of March.

Fe de erratas 8 de mayo de 2023

Problema conocido

Se recibe un Fatal Python error: Segmentation fault cuando se ejecuta un Proceso completo o de entrenamiento. Recomendamos usar los paquetes ML con la versión v23.4 hasta que se corrija este error.

Fe de erratas 20 de abril de 2023

La puntuación general de todos los procesos es ahora Precisión. Anteriormente era una Evaluación F1. Los artefactos de evaluación de AI Center siguen conteniendo tanto precisión como puntuación F1, para que se puedan comparar con las versiones anteriores.

v23.1.0

DocumentClassifier and endpoints

Release date: 11 January 2023

Lanzado en Endpoints y DocumentClassifier | v23.1.0

Hemos logrado mejorar las puntuaciones F1 y estas ahora también se muestran para los procesos de entrenamiento.

La carpeta Artifacts contiene una lista actualizada de artefactos.

Ahora, el modelo de DocumentClassifier predice 25 clases, en lugar de 26, debido a la eliminación de la clase Notas de entrega.

v22.12.2

Extremos

Release date: 16 December 2022

Released in endpoints | v22.12.2

El punto final público de UiPath Document OCR se ha actualizado y ahora ofrece compatibilidad con los idiomas de escritura manual para alemán y francés, y compatibilidad con los idiomas de impresión para danés, finlandés, noruego y sueco.

v22.11.0

Document Understanding, Data Extraction, and endpoints

Fecha de lanzamiento: 13 de diciembre de 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.11.0

Esta versión ofrece mejoras significativas en los puntos finales públicos de los paquetes ML preentrenados listos para usar, lo que significa que ahora utilizamos la última arquitectura de aprendizaje profundo basada en LayoutLM.

Esta mejora proporciona una mayor precisión en todos los tipos de documentos, especialmente para el modelo Facturas, y también mejora la precisión en los campos de columna y tablas.

Hemos añadido nuevos campos extraídos al modelo Facturas que ahora tienen Fecha de envío, Dirección de correo electrónico del proveedor, Nombre del banco, Número de cuenta bancaria, IBAN, Código SWIFT, Dirección del banco, Número de enrutador bancario y Tipo impositivo. Puedes consultar la lista de campos extraídos accediendo a esta página y pinchando en el enlace disponible para cada modelo.

Ahora, los procesos de entrenamiento también devuelven las puntuaciones del modelo, no solo los procesos completos o de evaluación.

Las puntuaciones F1 están ahora disponibles para cada campo de columna. Hasta ahora, las puntuaciones F1 solo estaban disponibles para todos los campos de columna juntos.

v22.10.2

Extremos

Release date: 3 February 2023

Released in endpoints | v22.10.2

We've updated the public endpoints of the out-of-the-box pre-trained ML packages, and are now using cutting edge LayoutLM Transformers based architecture.

v22.10.0

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 7 October 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.10.0

Novedades y mejoras

Los siguientes modelos preentrenados aparecen ahora como oficiales, sin la etiqueta -Preview: FacturasAustralia, FacturasIndia, ÓrdenesDeCompra.

The DeliveryNotes model has been renamed as BillsOfLading.

Ya están disponibles diez nuevos modelos preentrenados: Acord25, 1040, Cheques, Extractos bancarios, Estados financieros, Listas de embalaje, Acord131, Acord126, Acord140, Títulos de vehículos.

Corrección de errores

Se han corregido varios errores en los paquetes mencionados.

UiPath Document OCR

Release date: 4 October 2022

Released in UiPathDocumentOCR | v22.10.0 Cloud

Ahora se dispone de una nueva función para la detección de códigos de barras y códigos QR.

Se ha mejorado la precisión en cadenas largas como direcciones de correo electrónico y URL, en fuentes de anchura fija y en la detección de escritura manual y firmas.

También se ha mejorado la detección de la rotación de páginas.

v22.6.1-preview

DocumentUnderstanding, Data Extraction, and endpoints

Release date: 10 October 2022

Released in endpoints + DocumentUnderstanding + Data Extraction ML packages | v22.6.1-preview

This release brings several bug fixes to the DocumentUnderstanding and Data Extraction packages and endpoints.

v22.6.0-preview

DocumentUnderstanding and Data Extraction

Release date: 6 September 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.6.0-preview

Hay 18 nuevos paquetes ML de vista previa disponibles con una arquitectura de modelo más avanzada para nuestros paquetes ML DU en AI Center. Puedes identificarlos fácilmente por el texto Vista previa añadido al final del nombre del paquete, por ejemplo: FacturasVistaPrevia, OrdenDeCompraVistaPrevia, Acord125VistaPrevia, etc.

Hemos actualizado la lista de puntos finales públicos con todos los nuevos paquetes ML de vista previa y se pueden consultar Puntos finales públicos.

Cabe destacar que estos modelos de vista previa no consumen unidades de DU/IA de tus derechos de licencia.

Se ha solucionado un error en el uso de habilidades privadas y ahora la habilidad privada solo se puede utilizar con una clave API que pertenezca a la misma organización que utiliza la instancia de AI Center.

v22.5.2

DocumentUnderstanding and Data Extraction

Release date: 22 July 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.5.2

Corrección de errores

Esta revisión estabiliza la división de elementos combinando los métodos eol classifier y line_detection en un único método.

Problema conocido

There is a known issue for the Invoices package that ocassionally leads to an error when trying to run an auto-fine-tunning loop in AI Center.

v22.5.1

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 18 July 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.5.1

Corrección de errores

  • Se ha corregido un error que provocaba que los campos extraídos se mostraran en la página equivocada en la estación de validación.
  • Se ha corregido un error que provocaba que la última línea de texto de algunas páginas no se digitalizara en el administrador de documentos.
  • Se ha corregido un error que impedía mostrar algunos elementos de puntuación F1 del archivo evaluation_F1_invoices.txt en los procesos completos/de evaluación en AI Center.
  • Se ha corregido un error que provocaba que se calculara una puntuación global F1 errónea en evaluation_F1_invoices.txt file en los procesos de evaluación/completos en AI Center cuando un modelo solo tenía campos de columnas.

v22.5.0

AI Center cloud, Data Extraction

Release date: 16 June 2022

Released in AI Center Cloud, Data Extraction ML packages | v22.5.0

Mejoras

Se ha mejorado el rendimiento de todos los paquetes ML de extracción de datos.

v22.4.3

DocumentUnderstanding and Data Extraction

Release date: 21 July 2022

Released in DocumentUnderstanding + Data Extraction ML packages | v22.4.3

Esta revisión estabiliza la división de elementos combinando los métodos eol classifier y line_detection en un único método.

v22.4.2

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 14 July 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.4.2

Corrección de errores

  • Se ha corregido un error que provocaba que los campos extraídos se mostraran en la página equivocada en la estación de validación.
  • Se ha corregido un error que provocaba que la última línea de texto de algunas páginas no se digitalizara en el administrador de documentos.
  • Se ha corregido un error que impedía mostrar algunos elementos de puntuación F1 del archivo evaluation_F1_invoices.txt en los procesos completos/de evaluación en AI Center.
  • Se ha corregido un error que provocaba que se calculara una puntuación global F1 errónea en evaluation_F1_invoices.txt file en los procesos de evaluación/completos en AI Center cuando un modelo solo tenía campos de columnas.

v22.4.1

AI Center cloud, Data Extraction

Release date: 3 June 2022

Release date in AI Center Cloud, Data Extraction ML packages | v22.4.1

Corrección de errores

Se ha corregido un error que se producía al ejecutar un proceso de evaluación en un modelo entrenado con el especial line_detection mode, lo que provocaba que las predicciones fueran diferentes que cuando se invocaba desde la habilidad ML.

v22.4.0

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Fecha de publicación: 10 de mayo de 2022

Lanzamiento en Document Understanding + Clasificador de documentos + Paquetes ML de extracción de datos

| v22.4.0

Novedades

Las Capacidades de escritura manual están ahora disponibles para los paquetes UiPathDocumentOCR y UiPathDocumentOCR_CPU, que integran el HandwritingRecognitionOCR. Las mismas capacidades pueden encontrarse en el paquete UiPath.OCR.LocalServer de Studio.

New architecture on extraction ML packages, with major benefits, especially to models trained using the DocumentUnderstanding ML package.

Los paquetes ML Facturas de servicios, W9 y Pasaportes ya están disponibles como GA. Hay cinco nuevos paquetes ML preentrenados y listos para usar en -Vista previa para hacer más sencilla tu labor.

Hay cinco nuevos paquetes ML preentrenados y listos para usar en -Vista previa para hacer más sencilla tu labor.

La Búsqueda de documentos es una nueva característica disponible en el Document Manager, que facilita el etiquetado de documentos con un elevado número de páginas.

Mejoras

Se han introducido mejoras en los paquetes ML para la extracción de documentos en AI Center. La hoja de cálculo Excel de la evaluación ha recibido nuevas hojas, lo que permite organizar e interpretar mejor los datos evaluados.

Los paquetes ML en la instalación sin conexión de Automation Suite han recibido un nuevo paquete sin conexión.

Se han mejorado la precisión y el rendimiento del UiPathDocumentOCR.

Corrección de errores

Ya están disponibles, para su uso general, múltiples correcciones en el análisis de los campos de fecha, incluidas las fechas en los campos de columna, las fechas en los documentos turcos y las fechas muy lejanas

v22.2.3

UiPathDocumentUnderstandingOCR

Release date: 7 March 2022

Released in UiPathDocumentOCR | v22.2.3

Capacidad superior

HandwritingRecognitionOCR integrada en UiPathDocumentOCR. En muchos casos, hay una mezcla de campos. Al integrar la capacidad de lectura de la escritura, podemos aplicar el reconocimiento correcto a cada campo: el reconocimiento de la impresión al texto impreso y el reconocimiento de la escritura al texto manuscrito.

Aunque HandwritingRecognitionOCR puede detectar cualquier tipo de escritura, está entrenado y optimizado solo para el inglés.

v22.1.6

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 14 March 2022

Lanzamiento en Document Understanding + Clasificador de documentos + Paquetes ML de extracción de datos

| v22.1.6

Corrección de errores

Se ha corregido un error que provocaba el fallo de un proceso de entrenamiento o de un proceso completo en AI Center debido a un problema del paquete ML en el preprocesamiento de datos para una línea vacía.

v22.1.4

DocumentUnderstanding, DocumentClassifier, and Data Extraction

Release date: 2 March 2022

Released in DocumentUnderstanding + DocumentClassifier + Data Extraction ML packages | v22.1.4

Novedades

El paquete ML Facturas de servicios públicos ya está disponible de forma general.

Mejoras

Mejora general del rendimiento y la escalabilidad.

Mejoras significativas en las puntuaciones al entrenar con la nueva versión del paquete ML DocumentUnderstanding en comparación con las versiones anteriores.

Las fechas en los campos de columna ahora se analizan correctamente.

El análisis sintáctico de fechas reconoce ahora los nombres de los meses en turco.

seleccionados

Se ha cambiado el comportamiento de los procesos de entrenamiento y de los procesos completos cuando se entrena en la GPU frente a la CPU. Los modelos 21.10.x entrenados en las CPU eran más pequeños, por lo que se entrenaban más rápido que las versiones anteriores, aunque tenían una precisión ligeramente inferior a la anterior.

Este comportamiento se ha invertido con esta versión, por lo que el modelo que se entrena en la GPU y en la CPU es exactamente el mismo, y la velocidad de entrenamiento ha vuelto a ser la misma que antes de 2021.10, lo que significa que el entrenamiento en la CPU vuelve a ser de 10 a 20 veces más lento que en la GPU.

v21.10.11

Extracción de información

Release date: 23 November 2021

Released in Data Extraction ML packages | v21.10.11

Se ha solucionado un error que provocaba el fallo de los procesos de entrenamiento y evaluación debido a la lógica de posprocesamiento de fechas.

v21.10.9

Extracción de información

Release date: 24 November 2021

Released in Data Extraction ML packages | v21.10.9

Se ha corregido un fallo que mostraba un error de predicción en tiempo de ejecución.

Data Extraction and endpoints

Release date: 22 October 2021

Released in Data Extraction ML packages and endpoints | v21.10.9

Novedades

El paquete ML PurchaseOrders ya está disponible de forma general y listo para usarse en escenarios de producción.

Los paquetes ML InvoicesChina, DeliveryNotes, RemittanceAdvices, W2 y W9 ya están disponibles en Vista previa pública. Te recomendamos que consultes estos paquetes y empieces a usarlos para el tipo de documentos que necesitas procesar.

Mejoras

Se ha implementado la evaluación a nivel de documento. Esto es representativo del rendimiento en tiempo de ejecución en tu flujo de trabajo RPA.

La evaluación también puede realizarse en conjuntos de datos con menos campos que el paquete ML que se está evaluando. Esto facilita la evaluación en paquetes ML preentrenados listos para usar.

Para evaluar el impacto que tiene el OCR en la precisión de la extracción, ahora se puede volver a ejecutar cuando ejecutas un proceso de evaluación. Esto requiere que se configure el OCR al crear un paquete ML y que la variable de entorno eval.redo_ocr se establezca como verdadera en el proceso de evaluación de AI Center.

El entrenamiento en la CPU utiliza ahora un modelo más pequeño para obtener entre 5 y 7 veces más velocidad. Sin embargo, debe esperarse una precisión inferior del 0 al 5 % en la CPU.

Se han añadido las columnas de confianza mínima y tasa de procesamiento directo a los archivos Evaluation.xlsx producidos por Procesos de evaluación.

El paquete ML Facturas de servicios públicos se ha mejorado sustancialmente.

Mejora del análisis de las direcciones que se saltan 1 o 2 líneas de texto.

Mejora en la extracción de valores negativos, valores muy grandes (11 dígitos o más) o fechas lejanas.

Se ha añadido soporte para los recuadros girados en los recibos.

Mejora de los espacios concatenados.

Corrección de errores

  • Se ha corregido un error que no devolvía los caracteres especiales en los campos de tipo Cadena.
  • Se ha corregido un error en el paquete ML Pasaportes por el que la fecha escrita como número ordinal (1.º, 2.º, 3.º, 4.º, etc.) no se analizaba correctamente.

Problemas conocidos

El reentrenamiento de los paquetes ML InvoicesJapan y InvoicesChina usando los datos de la estación de validación no es compatible actualmente. Como solución, utiliza Google Cloud Vision OCR.

Próximas obsolescencias

Todos los puntos finales públicos, excepto UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor y IntelligentFormExtractor, van a quedar obsoletos para las regiones no pertenecientes a Europa Occidental a partir del 1 de diciembre de 2021.

v21.10.5

UiPathDocumentOCR endpoints

Release date: 13 December 2021

Released in UiPathDocumentOCR endpoints | v21.10.5

Mejoras

UiPathDocumentOCR ya está disponible también en la región de Singapur.

v21.10.1

Data Extraction and endpoints for UiPathDocumentOCR

Release date: 24 September 2021

Released in Data Extraction and endpoints for UiPathDocumentOCR | v21.10.1

Mejoras

Se ha añadido compatibilidad con texto rotado, incluso si la rotación se realiza en ángulos diferentes para cada palabra.

Se ha añadido soporte para texto vertical. Esta mejora está disponible de momento solo para UiPath.IntelligentOCR.Activities, incluyendo la Estación de validación, Data Manager y el Extractor con aprendizaje automático que aún no admiten texto vertical.

Mejora de la precisión en imágenes o fotos con ruido: por ejemplo, recibos, documentos de identidad o pasaportes.

v21.10

FormExtractor, IntelligentFormExtractor, and IntelligentKeywordClassifier endpoints

Release date: 13 December 2021

Released FormExtractor + IntelligentFormExtractor + IntelligentKeywordClassifier in Endpoints | v21.10

Mejoras

El extractor de formularios, el extractor inteligente de formularios y el clasificador inteligente de palabra clave ahora también están disponibles en la región de Singapur.

v21.7

Data Extraction and endpoints for Handwriting Recognition

Release date: 11 August 2021

Released in Data Extraction and endpoints for Handwriting Recognition | v21.7

Mejoras

Posibilidad de tratar varios fragmentos en una única llamada al modelo.

Reentrenamiento del modelo y algunos otros cambios para mejorar la precisión del modelo.

Corrección de errores

Se ha solucionado un error que provocaba que el pod se reiniciara cuando no quedaba memoria.

v21.6.3

UiPathDocumentOCR in endpoints

Fecha de publicación: 9 de junio de 2021

Released in endpoints for UiPathDocumentOCR | v21.6.3

Mejoras

Mejora de la detección de un solo dígito.

Mayor precisión en los caracteres 1, I y L.

Mejora de la detección del texto cuando está junto.

v21.5.5

Data Extraction and endpoints

Release date: 18 June 2021

Released in endpoints and Data Extraction ML packages | v21.5.5

Se ha corregido un error que provocaba diferencias de predicción entre Data Manager y la actividad Digitalizar documento.

v21.5.3

Data Extraction and endpoints

Release date: 8 June 2021

Released in endpoints and Data Extraction ML packages | v21.5.3

Novedades

Para las imágenes difíciles de leer, como en el caso de Documentos de identificación y Pasaportes, se han lanzado dos nuevos paquetes preentrenados listos para usar correspondientes.

Mejoras

Incorporamos campos de clasificación reentrenables en nuestros paquetes preentrenados listos para usar.

v21.4.7

Data Extraction and endpoints

Fecha de lanzamiento: 20 de abril de 2021

Released in endpoints and Data Extraction ML packages | v21.4.7

Mejora del análisis sintáctico de fechas para los paquetes ML de extracción de datos.

v21.4.5

Data Extraction and endpoints

Fecha de publicación: 15 de abril de 2021

Released in endpoints and Data Extraction ML packages | v21.4.5

Novedades

Se han implementado todos los puntos finales públicos en la región de Estados Unidos.

Se han implementado los puntos finales públicos para el extractor de formularios, el extractor inteligente de formularios y el clasificador inteligente de palabra clave en las regiones de Canadá y Japón.

v21.4

Data Extraction and endpoints for HandwritingRecognition and DocumentClassifier

Fecha de publicación: 9 de marzo de 2021

Released in Data Extraction ML packages & endpoints for HandwritingRecognition, DocumentClassifier, + Standalone Docker for UiPathDocumentOCR | v21.4

Novedades

HandwritingRecognition with improved recognition using spelling corrections and ability to read machine-printed text reaches general availability.

DocumentClassifier reaches general availability as well.

Mejoras en UiPathDocumentOCR para:

  • Detección de botones de radio/casillas de verificación
  • Precisión en los formularios burbuja
  • Precisión general

v21.1.8

Data Extraction and endpoints

Release date: 17 February 2021

Released in endpoints and Data Extraction ML packages | v21.1.8

Mejoras

Precisión mejorada.

InvoicesIndia y InvoicesAustralia ya están disponibles de forma general.

Puntos finales públicos implementados en la región de Australia.

El argumento de la edición ya no es necesario en las URL de los puntos finales. Por ejemplo, https://du.uipath.com/ie/invoices funcionará tanto para el tráfico empresarial como para el comunitario.

v20.11.3

Extracción de información

Fecha de publicación: 18 de diciembre de 2020

Released in Data Extraction ML packages | v20.11.3

Mejoras

Mejoras en el entrenamiento de la CPU para que sea más rápida y requiera menos memoria.

Mejoras en el análisis de la fecha para los documentos fuera de Estados Unidos.

Reconocimiento de casillas de verificación para UiPathDocumentOCR, incluidas casillas de verificación impresas o escritas a mano.

v20.10.4

Data Extraction and endpoints

Release date: 10 November 2020

Released in endpoints and Data Extraction ML packages | v20.10.4

Nuevas características y mejoras

Un nuevo modelo para las facturas japonesas.

Las líneas de evaluación ahora también devuelven métricas para los campos de clasificación.

Compatibilidad con la versión 3 de Microsoft Read OCR.

Mejoras en el formato de fechas para detectar los formatos de día/mes/año frente a los de mes/día/año.

Mejoras en la detección de puntos decimales y separadores de miles para el correcto análisis de los números.

El entrenamiento en la CPU es compatible con todas las versiones de AI Fabric.

Se ha mejorado el análisis sintáctico de los campos con tipo de contenido id-no.

Soporte para la formación de campos de clasificación (sin campos regulares o de columna).

Se ha aumentado el número máximo de campos permitidos de 32 a 40.

Informa de los niveles de confianza de los campos de la columna.

Problemas conocidos

Al crear un paquete UiPath.DocumentUnderstanding.ML.Activities en AI Center, el nombre del paquete no debe contener ninguna palabra clave reservada de Python, como class, break, from, finally, global o None. Ten en cuenta que esta lista no es exhaustiva, ya que el nombre del paquete se usa para class <pkg-name> y import <pkg-name>.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.