Document Understanding
Más reciente
False
  • Notas relacionadas
Imagen de fondo del banner
Notas de la versión de Document Understanding
Última actualización 13 de may. de 2024

Octubre de 2021

General Release Notes - Document Understanding

19 de octubre de 2021

Mejoras

Los campos con menos de 10 documentos etiquetados pueden eliminarse sin confirmación.

Corrección de errores

  • Se ha corregido un error que afectaba a los archivos importados con el mismo nombre.
  • Se ha corregido un error en Google OCR que generaba un error en documentos con páginas vacías.
  • Se ha corregido un error que mostraba erróneamente el recuento de archivos en el cuadro de diálogo Importar datos para las importaciones de conjuntos de datos de la estación de validación o Data Manager.

Problemas conocidos

  • La exportación por defecto (a nivel de documento) solo funciona con los Paquetes ML versión 21.10 o posterior en AI Center. La versión aparece en la columna Registro de cambios de la vista Paquetes ML en AI Center. Para versiones anteriores, usa la casilla de exportación compatible con versiones anteriores en el cuadro de diálogo Exportar archivos.

1 de octubre de 2021

Soporte de documentos de varias páginas

Data Manager ahora admite documentos de varias páginas. Se trata de una actualización importante que afecta a todos los aspectos de un flujo de aprendizaje automático:

Importar: puedes cargar documentos de hasta 150 páginas; para saltarte este límite, a riesgo de una experiencia de etiquetado inestable, selecciona la casilla Habilitar documentos grandes del cuadro de diálogo Importar datos.

Preetiquetado: el documento se preetiqueta en su totalidad, lo que produce los mismos resultados que el flujo de trabajo RPA, pero lleva más tiempo en el caso de los documentos más grandes. Consulta también Problemas conocidos a continuación.

Etiquetado: etiquetado más cómodo gracias al desplazamiento natural por las páginas del documento.

Exportar: se realiza en el documento de forma predeterminada. Si deseas exportar los documentos a nivel de página, marca la casilla Exportación compatible con versiones anteriores del cuadro de diálogo Exportar archivos. Esto también se recomienda si la precisión del modelo producida por la exportación predeterminada está por debajo de las expectativas.

Entrenamiento: en la mayoría de los casos, los modelos entrenados con los nuevos conjuntos de datos exportados en el documento deberían tener el mismo rendimiento que la Exportación compatible con versiones anteriores en la página. Sin embargo, si el rendimiento de los modelos es inferior al esperado, te recomendamos que vuelvas a intentar el entrenamiento usando también una exportación compatible con versiones anteriores, por si pudiera producir mejores resultados.

Evaluación: esta es la principal motivación para la característica de soporte de documentos de varias páginas, ya que las puntuaciones de las evaluaciones reflejarán con mayor precisión el rendimiento en tiempo de ejecución. Ten en cuenta que esto supone que cada documento de varias páginas contiene un único documento lógico. Por ejemplo, si se importan paquetes de archivos de 20 páginas que contienen 10 facturas de 2 páginas cada una, esto no debe usarse como parte de los conjuntos de evaluación. Sin embargo, pueden usarse como parte de los conjuntos de entrenamiento, pero solo si se exporta con la opción Compatibilidad con versiones anteriores.

Mejoras

Compatibilidad con la exportación de esquemas mediante el botón de radio en el cuadro de diálogo Exportar archivos.

El tamaño máximo de importación ha aumentado a 2 GB o 2000 páginas.

El conjunto de pruebas ha pasado a llamarse conjunto de evaluación, para que sea coherente con los procesos de evaluación de AI Center.

El botón Predecir aparece de forma predeterminada en la barra de administración, pero es necesario configurar Preetiquetado para que el botón esté habilitado.

Todas las restricciones sobre el número de muestras por campo se han eliminado de las exportaciones de conjuntos de evaluación.

Se ha añadido el nombre de la sesión de Data Manager junto al nombre del archivo en la barra de administración para identificar más fácilmente la sesión en la que se está trabajando en caso de que haya varias pestañas de Data Manager abiertas al mismo tiempo.

Compatibilidad con documentos en chino.

Mejoras en la accesibilidad.

Localización para portugués (Portugal), ruso y turco.

Problemas conocidos

  • El modelo Facturas China no aplica a las fechas de estilo chino el formato estándar aaaa-mm-dd. Esto se mejorará en las próximas versiones.
  • El análisis de fechas de Data Manager es incoherente con el análisis realizado por los modelos ML en tiempo de ejecución. Si observas que las fechas se analizan incorrectamente en Data Manager, es probable que se analicen correctamente en la predicción del modelo en tiempo de ejecución. Este es un problema conocido y se resolverá en un próximo parche.
  • Por el momento, al utilizar la opción Predecir con Puntos finales públicos solo se preetiquetan las 10 primeras páginas de un documento. Este es un problema conocido y se incluirá una mejora en un parche futuro. Sin embargo, el uso de la opción Predecir con Habilidades ML en AI Center no impone tal limitación.

Notas generales de la versión: paquetes ML

22 de octubre de 2021 | v.21.10.9

Lanzamiento en AI Center Cloud y Puntos finales: 22 de octubre de 2021, versión del paquete: 21.10.9

Novedades

El paquete ML PurchaseOrders ya está disponible de forma general y listo para usarse en escenarios de producción.

Los paquetes ML InvoicesChina, DeliveryNotes, RemittanceAdvices, W2 y W9 ya están disponibles en Vista previa pública. Te recomendamos que consultes estos paquetes y empieces a usarlos para el tipo de documentos que necesitas procesar.

Mejoras

Se ha implementado la evaluación a nivel de documento. Esto es representativo del rendimiento en tiempo de ejecución en tu flujo de trabajo RPA.

La evaluación también puede realizarse en conjuntos de datos con menos campos que el paquete ML que se está evaluando. Esto facilita la evaluación en paquetes ML preentrenados listos para usar.

Para evaluar el impacto que tiene el OCR en la precisión de la extracción, ahora se puede volver a ejecutar cuando ejecutas un proceso de evaluación. Esto requiere que se configure el OCR al crear un paquete ML y que la variable de entorno eval.redo_ocr se establezca como verdadera en el proceso de evaluación de AI Center.

El entrenamiento en la CPU utiliza ahora un modelo más pequeño para obtener entre 5 y 7 veces más velocidad. Sin embargo, debe esperarse una precisión inferior del 0 al 5 % en la CPU.

Se han añadido las columnas de confianza mínima y tasa de procesamiento directo a los archivos Evaluation.xlsx producidos por Procesos de evaluación.

El paquete ML Facturas de servicios públicos se ha mejorado sustancialmente.

Mejora del análisis de las direcciones que se saltan 1 o 2 líneas de texto.

Mejora en la extracción de valores negativos, valores muy grandes (11 dígitos o más) o fechas lejanas.

Se ha añadido soporte para los recuadros girados en los recibos.

Mejora de los espacios concatenados.

Corrección de errores

  • Se ha corregido un error que no devolvía los caracteres especiales en los campos de tipo Cadena.
  • Se ha corregido un error en el paquete ML Pasaportes por el que la fecha escrita como número ordinal (1.º, 2.º, 3.º, 4.º, etc.) no se analizaba correctamente.

Problemas conocidos

El reentrenamiento de los paquetes ML InvoicesJapan y InvoicesChina usando los datos de la estación de validación no es compatible actualmente. Como solución, utiliza Google Cloud Vision OCR.

Próximas obsolescencias

Todos los puntos finales públicos, excepto UiPathDocumentOCR, FormExtractor, IntelligentFormExtractor y IntelligentFormExtractor, van a quedar obsoletos para las regiones no pertenecientes a Europa Occidental a partir del 1 de diciembre de 2021.

Was this page helpful?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Logotipo blanco de UiPath
Confianza y seguridad
© 2005-2024 UiPath. All rights reserved.