Document Understanding: octubre de 2021

document-understanding

latest

false

Notas de la versión de Document Understanding

Document Understanding para Automation Cloud y Test Cloud
Document Understanding para Automation Cloud y Test Cloud Public Sector
- 2025
- 2024
Document Understanding para Automation Cloud y Test Cloud Dedicado
- 2025
Paquetes ML y puntos finales públicos
- Paquetes ML generales y actualizaciones de puntos finales públicos
- Paquetes ML e historial de versiones de puntos finales públicos

Importante :

La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Octubre de 2021

Notas de la versión de octubre de 2021 para Document Understanding en Automation Cloud.

General Release Notes - Document Understanding

19 de octubre de 2021

Mejoras

Los campos con menos de 10 documentos etiquetados pueden eliminarse sin confirmación.

Corrección de errores

Se ha corregido un error que afectaba a los archivos importados con el mismo nombre.
Se ha corregido un error en Google OCR que generaba un error en documentos con páginas vacías.
Se ha corregido un error que mostraba erróneamente el recuento de archivos en el cuadro de diálogo Importar datos para las importaciones de conjuntos de datos de la estación de validación o Data Manager.

Problemas conocidos

La exportación por defecto (a nivel de documento) solo funciona con los Paquetes ML versión 21.10 o posterior en AI Center. La versión aparece en la columna Registro de cambios de la vista Paquetes ML en AI Center. Para versiones anteriores, usa la casilla de exportación compatible con versiones anteriores en el cuadro de diálogo Exportar archivos.

1 de octubre de 2021

Soporte de documentos de varias páginas

Data Manager ahora admite documentos de varias páginas. Se trata de una actualización importante que afecta a todos los aspectos de un flujo de aprendizaje automático:

Import: you can upload documents up to 150 pages; to bypass this limit, at the risk of an unstable labeling experience, select the Enable large documents checkbox from the Import data dialog box.

Prelabeling: the document is prelabeled as a whole, producing the same results as running in RPA workflow, but it takes more time in case of larger documents. See also Known Issues below.

Labeling: more convenient labeling due to natural scrolling through document pages.

Export: done by default at document level. Should you want to export the documents at page level, select the Backwards-compatible export checkbox from the Export files dialog box; this is also recommended if the model accuracy produced by the default export is below expectations.

Training: on most scenarios, the models trained with the new document level exported datasets should have the same performance with the page level Backwards-compatible export. However, if the models perform below expectations, we recommend that you retry the training using a Backwards-compatible export as well, in case it might produce better results.

Evaluation: this is the main motivation for the multi-page document support feature, since Evaluations scores will more accurately reflect run time performance. Please note that this assumes that each multi-page document contains a single logical document. For instance, if you import 20 page file packets containing 10 invoices of 2 pages each, then this should not be used as part of Evaluation sets. However, they can be used as part of Training sets but only if you export using the Backwards-compatible option enabled.

Mejoras

Compatibilidad con la exportación de esquemas mediante el botón de radio en el cuadro de diálogo Exportar archivos.

El tamaño máximo de importación ha aumentado a 2 GB o 2000 páginas.

El conjunto de pruebas ha pasado a llamarse conjunto de evaluación, para que sea coherente con los procesos de evaluación de AI Center.

El botón Predecir aparece de forma predeterminada en la barra de administración, pero es necesario configurar Preetiquetado para que el botón esté habilitado.

Todas las restricciones sobre el número de muestras por campo se han eliminado de las exportaciones de conjuntos de evaluación.

Se ha añadido el nombre de la sesión de Data Manager junto al nombre del archivo en la barra de administración para identificar más fácilmente la sesión en la que se está trabajando en caso de que haya varias pestañas de Data Manager abiertas al mismo tiempo.

Compatibilidad con documentos en chino.

Mejoras en la accesibilidad.

Localización para portugués (Portugal), ruso y turco.

Problemas conocidos

El modelo Facturas China no aplica a las fechas de estilo chino el formato estándar aaaa-mm-dd. Esto se mejorará en las próximas versiones.
El análisis de fechas de Data Manager es incoherente con el análisis realizado por los modelos ML en tiempo de ejecución. Si observas que las fechas se analizan incorrectamente en Data Manager, es probable que se analicen correctamente en la predicción del modelo en tiempo de ejecución. Este es un problema conocido y se resolverá en un próximo parche.
Por el momento, al utilizar la opción Predecir con Puntos finales públicos solo se preetiquetan las 10 primeras páginas de un documento. Este es un problema conocido y se incluirá una mejora en un parche futuro. Sin embargo, el uso de la opción Predecir con Habilidades ML en AI Center no impone tal limitación.

En esta página

General Release Notes - Document Understanding
19 de octubre de 2021
1 de octubre de 2021

¿Te ha resultado útil esta página?

AnteriorNoviembre de 2021

Sig.Agosto de 2021

General Release Notes - Document Understanding​

19 de octubre de 2021​

Mejoras​

Corrección de errores​

Problemas conocidos​

1 de octubre de 2021​

Soporte de documentos de varias páginas​

Mejoras​

Problemas conocidos​

¿Te ha resultado útil esta página?

General Release Notes - Document Understanding

19 de octubre de 2021

Mejoras

Corrección de errores

Problemas conocidos

1 de octubre de 2021

Soporte de documentos de varias páginas

Mejoras

Problemas conocidos