- Document Understanding para Automation Cloud y Test Cloud
- Document Understanding para Automation Cloud y Test Cloud Public Sector
- Document Understanding para Automation Cloud y Test Cloud Dedicated
- Paquetes ML y puntos finales públicos
Notas de la versión de Document Understanding
General Release Notes - Document Understanding
19 de octubre de 2021
Mejoras
Los campos con menos de 10 documentos etiquetados pueden eliminarse sin confirmación.
Corrección de errores
- Se ha corregido un error que afectaba a los archivos importados con el mismo nombre.
- Se ha corregido un error en Google OCR que generaba un error en documentos con páginas vacías.
- Se ha corregido un error que mostraba erróneamente el recuento de archivos en el cuadro de diálogo Importar datos para las importaciones de conjuntos de datos de la estación de validación o Data Manager.
Problemas conocidos
- La exportación por defecto (a nivel de documento) solo funciona con los Paquetes ML versión 21.10 o posterior en AI Center. La versión aparece en la columna Registro de cambios de la vista Paquetes ML en AI Center. Para versiones anteriores, usa la casilla de exportación compatible con versiones anteriores en el cuadro de diálogo Exportar archivos.
1 de octubre de 2021
Soporte de documentos de varias páginas
Data Manager ahora admite documentos de varias páginas. Se trata de una actualización importante que afecta a todos los aspectos de un flujo de aprendizaje automático:
Import: you can upload documents up to 150 pages; to bypass this limit, at the risk of an unstable labeling experience, select the Enable large documents checkbox from the Import data dialog box.
Prelabeling: the document is prelabeled as a whole, producing the same results as running in RPA workflow, but it takes more time in case of larger documents. See also Known Issues below.
Labeling: more convenient labeling due to natural scrolling through document pages.
Export: done by default at document level. Should you want to export the documents at page level, select the Backwards-compatible export checkbox from the Export files dialog box; this is also recommended if the model accuracy produced by the default export is below expectations.
Training: on most scenarios, the models trained with the new document level exported datasets should have the same performance with the page level Backwards-compatible export. However, if the models perform below expectations, we recommend that you retry the training using a Backwards-compatible export as well, in case it might produce better results.
Evaluation: this is the main motivation for the multi-page document support feature, since Evaluations scores will more accurately reflect run time performance. Please note that this assumes that each multi-page document contains a single logical document. For instance, if you import 20 page file packets containing 10 invoices of 2 pages each, then this should not be used as part of Evaluation sets. However, they can be used as part of Training sets but only if you export using the Backwards-compatible option enabled.
Mejoras
Compatibilidad con la exportación de esquemas mediante el botón de radio en el cuadro de diálogo Exportar archivos.
El tamaño máximo de importación ha aumentado a 2 GB o 2000 páginas.
El conjunto de pruebas ha pasado a llamarse conjunto de evaluación, para que sea coherente con los procesos de evaluación de AI Center.
El botón Predecir aparece de forma predeterminada en la barra de administración, pero es necesario configurar Preetiquetado para que el botón esté habilitado.
Todas las restricciones sobre el número de muestras por campo se han eliminado de las exportaciones de conjuntos de evaluación.
Se ha añadido el nombre de la sesión de Data Manager junto al nombre del archivo en la barra de administración para identificar más fácilmente la sesión en la que se está trabajando en caso de que haya varias pestañas de Data Manager abiertas al mismo tiempo.
Compatibilidad con documentos en chino.
Mejoras en la accesibilidad.
Localización para portugués (Portugal), ruso y turco.
Problemas conocidos
- El modelo Facturas China no aplica a las fechas de estilo chino el formato estándar aaaa-mm-dd. Esto se mejorará en las próximas versiones.
- El análisis de fechas de Data Manager es incoherente con el análisis realizado por los modelos ML en tiempo de ejecución. Si observas que las fechas se analizan incorrectamente en Data Manager, es probable que se analicen correctamente en la predicción del modelo en tiempo de ejecución. Este es un problema conocido y se resolverá en un próximo parche.
- Por el momento, al utilizar la opción Predecir con Puntos finales públicos solo se preetiquetan las 10 primeras páginas de un documento. Este es un problema conocido y se incluirá una mejora en un parche futuro. Sin embargo, el uso de la opción Predecir con Habilidades ML en AI Center no impone tal limitación.