UiPath Documentation
activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Actividades de Document Understanding

Última actualización 22 de abr. de 2026

Notas relacionadas

v7.1.0 - preview

Fecha de lanzamiento: 1 de abril de 2026

Novedades

New field types: Field Group and Monetary Quantity

Two new field types are now available when defining the taxonomy in Intelligent OCR automations: Field Group and Monetary Quantity.

Field Group allows you to structure related extraction fields together, replacing the previous Table-based output. Monetary Quantity is a dedicated field type for currency values, replacing generic numeric handling. Document Validation tasks automatically display Field Group results accordingly.

Mejoras

Advertencia de compatibilidad en tiempo de diseño

Studio ahora muestra una advertencia en tiempo de diseño cuando se utiliza la vista previa de Intelligent OCR 7.0.0 o posterior con un paquete de UiPath Vision anterior a la versión 4.0.0-preview. La advertencia te alerta de la falta de coincidencia de la versión antes de la ejecución del tiempo de ejecución.

Registro mejorado para actividades DU/Intelligent OCR

Ahora se registra contexto adicional para las actividades de Document Understanding e Intelligent OCR, lo que mejora la visibilidad de la resolución de problemas en los registros de Robot.

v7.0.0: vista previa

Fecha de lanzamiento: 25 de febrero de 2026

Cambios de última hora

  • Se ha eliminado la compatibilidad con proyectos de Windows: heredado. A partir de esta versión, el paquete solo es compatible con proyectos de Windows.
  • When upgrading, if you use IXP projects, make sure to review the configuration of your Document Understanding project extractors. Run GetCapabilities again and verify that the configuration in the Data Extraction Scope → Configure Extractors screen is still valid.

Novedades

To provide extraction capabilities tailored to a specific non-Latin document layout, you can now use a dedicated modern project type called Predefined Non-Latin Languages in the Document Understanding Project Extractor activity. This project type offers the following extractors:

  • Invoices Japan – Recommended for Japanse invoice documents. The extractor can handle common Japanese invoice layouts, and can identify and extract key invoice fields such as supplier information, invoice number, and currency.
  • Invoices China - Recommended for Chinese invoice documents. The extractor can handle common Chinese invoice layouts, and can identify and extract key invoice fields such as supplier information, invoice number, and currency.
  • Receipts Japan - Recommended for Japanese receipt documents. You can use the extractor to identify and extract fields such as merchant name, transaction date, total amount, tax, and currency from Japanese-language receipts.

v6.27.3

Fecha de lanzamiento: 16 de marzo de 2026

Mejoras

Se ha mejorado el flujo de actualización de tokens para reducir las solicitudes fallidas causadas por tokens de acceso caducados. La actividad ahora utiliza un token de acceso en caché cuando está disponible. Se ha optimizado el flujo de actualización de tokens, lo que reduce significativamente el número de llamadas de autenticación y mejora el rendimiento y la fiabilidad generales.

v6.27.2

Fecha de lanzamiento: 16 de diciembre de 2025

Mejoras

Las salidas de documentos divididos ahora utilizan nombres de archivo claros y trazables derivados del nombre del documento original y el rango de páginas.

Corrección de errores

Se ha corregido un problema por el que la actividad Redactar documento generaba una sección horizontal en orientación vertical.

v6.27.0

Fecha de lanzamiento: 28 de octubre de 2025

Novedades

Argumento de salida de IdDeDocumentoDeReferencia

The ReferenceDocumentId output argument is now available in the Document Understanding Project Classifier and Document Understanding Project Extractor activities. This is the Document ID within the Document Understanding services.

Corrección de errores

Se ha corregido un problema en el Entrenador del extractor de proyectos de DU para mejorar la autenticación entre tenants.

Problemas conocidos

Erratum - added 11 November 2025: This was erroneously marked as a known issue. With correct configuration, no design-time and runtime errors occur.

Al utilizar actividades con un Orchestrator independiente en el que no existe una estructura de tenant, pueden producirse errores de tiempo de diseño y tiempo de ejecución.

v6.26.0

Fecha de lanzamiento: 25 de agosto de 2025

Novedades

Reordenar páginas dentro de un documento durante la clasificación

For greater flexibility, you can now reorder pages within a document, when classifying them in the Classification Station. To enable this capability, use the EnablePageReorder property, available in the Present Classification Station and Create Document Classification Action activities.

Reentrenar modelos al utilizar proyectos modernos de Document Understanding

You can now enhance the extraction capabilities of your models, by retraining them on the specific documents that you validate through the Validation Station. You can use the Document Understanding Project Extractor Trainer activity to retrain models when working with modern Document Understanding projects.

Redactar documentos

The new Redact Document activity allows you to input a document and an extraction result, generating a new file without any sourced details. The output document is the redacted copy of the input, with all information provided as input being redacted accordingly. Any information within the extraction result is redacted using a style of your choice.

Modo compacto de la estación de validación

Validation Station can now be used with a new face: the Compact Display Mode. This provides more space for fields, easier highlighting for the fields that require attention, a centralized business checks section, and a host of other validator-centered features. To enable the Compact Mode, update the IntelligentOCR.Activities pack to 6.25.0-preview or higher, then go to the Create Document Validation Action or Present Validation Station activity, and set the DisplayMode input argument to Compact.

Cambios de validación para los campos de la tabla en la estación de validación

Hemos actualizado el proceso de validación de tablas tanto en la estación de validación clásica como en la compacta, diseñado para mejorar la experiencia del usuario y el rendimiento general. Hemos traído las siguientes actualizaciones:

  1. Ahora puedes guardar parcialmente una tabla siempre que no haya celdas no válidas. Puedes guardar parcialmente el campo de la tabla utilizando la opción Listo .
  2. <number> <number> Utiliza las opciones Hay <número> celdas no válidas y Hay <número> celdas no confirmadas para navegar a celdas no válidas o no confirmadas.
  3. Cada celda dentro de la tabla ahora muestra una casilla de verificación de confirmación.
  4. Confirma toda la tabla seleccionando Confirmar todas las celdas.
  5. Puedes enviar una acción sin visitar y confirmar manualmente todas las tablas. La opción Enviar mostrará el número de campos y tablas, que se confirmarán automáticamente antes de enviarlos.

También hemos implementado varias mejoras y resuelto problemas para mejorar tu experiencia de usuario:

  • Se ha mejorado el rendimiento general y la navegación de la validación de tablas.
  • Se ha optimizado la visualización de las reglas empresariales no válidas.
  • Se han corregido problemas relacionados con la falta de celdas de tabla que no se renderizaban y la visualización incorrecta de tablas de solo lectura.

La siguiente imagen muestra la interfaz de usuario de la estación de validación compacta para el proceso actualizado.

Figura 1. Proceso de validación actualizado para la estación de validación compacta

Proceso de validación actualizado para la estación de validación compacta

La siguiente imagen muestra la interfaz de usuario de la estación de validación clásica para el proceso actualizado.

Figura 2. Proceso de validación actualizado para la estación de validación clásica

Proceso de validación actualizado para la estación de validación clásica

For more information on the updated validation process, visit Classic Validation Station and Compact Validation Station.

Mejoras

  • The Present Validation Station , Create Document Validation Action, and Create Document Validation Artifacts activities now have the ShowOnlyRelevantPageRane property set by default to True.
  • When you obtain the ClassificationResult from the Classify Document Scope or Present Classification Station activities, you can access the page range for the classified sub-documents using the Item.DocumentBounds.PageRange property on the ClassificationResult variable.
  • The Intelligent Keyword Classifier activity can now classify pages with fewer words.
  • La actividad Recuperar artefactos de validación de documentos ahora tiene el resultado extraído validado en el diseñador principal para facilitar el acceso.
  • Data is now also collected for retraining and available in the Exceptions for the review section of a Modern Project.

Corrección de errores

  • La salida de la actividad Leer texto en PDF extraía por error un documento escrito en español como caracteres del alfabeto griego.
  • When training the Intelligent Keyword Classifier in certain conditions, the classifier would fail to train correctly and would cause a performance degradation.
  • Se ha corregido un problema por el que el valor numérico de ciertos documentos se analizaba incorrectamente.
  • Fixed an issue where the Create action and Create artifacts activities would fail unexpectedly.

v6.24.0

Fecha de lanzamiento: 16 de abril de 2025

Habilitar los controles de derecha a izquierda en la Estación de validación

Use the EnableRTL property to display Validation Station controls from right to left. To interact with Validation Station in right-to-left text format, set EnableRTL to True. This property applies to the following activities:

Validación mejorada con Estación de validación compacta

The DisplayMode property lets you choose your preferred interface when working with the Validation Station:

  • Classic: This is the standard interface. This is the interface which was always used until this release.
  • Compact: This enhanced interface offers a better user experience with improvements, such as:
    • Se ha mejorado el proceso de entrada manual en la Estación de validación para facilitar su uso.
    • Los tokens para los valores resaltados dentro del documento ahora aparecen dentro de una línea roja para una mejor visibilidad.
    • Ability to add values for fields, even when the taxonomy Requires reference setting is disabled.

New display settings for document types in the Taxonomy Manager, including:

  • OCR confidence threshold: Defines a minimum confidence threshold for OCR that the Validation Station considers when compared to confidence thresholds generated during validation.
  • Date display format: Sets a preferred date format.
  • Number decimal separator: Determines a decimal separator for number fields within the document type.
  • Number thousands separator: Determines a thousands separator for number fields within the document type.
    Nota:

    Besides the customizable OCR confidence threshold for the document type, you can set an Extraction confidence threshold for each field in your taxonomy. Find this setting in the Details tab under Validation settings in the Taxonomy Manager.

    For more information on the updates brought to the Taxonomy Manager, visit Load Taxonomy.

Puedes cambiar entre las interfaces de la estación de validación en las siguientes actividades:

Validate documents in Action Center using UiPath® apps

You can now boost the efficiency of your document processing understanding workflows with UiPath® apps. Apart from creating document validation tasks directly in Action Center, you can now build an Action app that shows the document and the validation station. Once set up, the validation station and the target document are displayed inside Action Center, awaiting user intervention. For more information on validating documents using Action apps, visit the Validating documents with App actions tutorial.

Usar etiquetas y versiones para proyectos modernos de Document Understanding

To tailor document understanding workflows to your needs, you can now use specific versions of your projects during classification and extraction. The Tag property provides granular control for testing your Document Understanding workflows before rolling them out into production. For more information, visit Document Understanding Project Classifier and Document Understanding Project Extractor.

Capacidades de extracción mejoradas utilizando nuevos extractores generativos

Para mejorar las capacidades de extracción generativa tanto para documentos cortos como largos que tienen diseños complejos, ahora puedes seleccionar los siguientes extractores generativos al configurar extractores para tus campos de documento:

  • Long Documents Simple Layout – This is the existent Generative Extractor.
  • Long Documents Complex Layout (Preview) – Optimized for long form documents that include images, handwriting, form elements or other complex layouts, such as floating callout boxes. Examples of documents that are suitable for this extractor: insurance policies, or other similar long form documents with complex layouts.
  • Short Document Complex Layout (Preview) – Optimized for short documents that include images, handwriting, form elements or other complex layouts like floating callout boxes. For example: identity cards, or healthcare intake forms with complex layouts.

Mejoras

La parte de digitalización de tus flujos de trabajo de procesamiento de documentos ahora puede reconocer y devolver datos de documentos que contienen valores que están en un círculo, subrayados o tachados.

Corrección de errores

  • Data from certain tables was not appearing in PDF files despite successful digitization with the Digitize Document activity.
  • Al digitalizar archivos PDF, faltaban firmas.
  • En ocasiones, el proceso de extracción identificaba erróneamente el estado de los campos de tipo Dirección debido a problemas de análisis de direcciones.
  • The Digitize Document activity would return text from a PDF document, even when the text was concealed using PDF readers.
  • Los cuadros de texto de un documento no se digitalizaban, por lo que no se mostraban en el Document Manager.
  • Cierto texto no se extraía durante el proceso de extracción del documento debido a problemas relacionados con la sangría y el procesamiento del ángulo de los documentos girados.
  • Después de migrar un proyecto a la compatibilidad de Windows, las ejecuciones fallaban con el siguiente error: "Trabajo detenido con un código de salida inesperado".

v6.22.1

Fecha de lanzamiento: 26 de noviembre de 2024

Mejoras

Se actualizó el texto de explicación en el Editor de plantillas del Extractor de Formularios para reflejar el proceso de definición de anclajes de campo.

Corrección de errores

  • Data from certain tables was not appearing in PDF files despite successful digitization with the Digitize Document activity.
  • Se resolvió un problema por el que el texto mostrado en el documento PDF generado era impreciso.

v.6.9.8

Fecha de lanzamiento: 22 de octubre de 2024

Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.

v6.14.3

Fecha de lanzamiento: 21 de octubre de 2024

Corrección de errores

This version resolves the Unknown sections in the AI Units consumption overview dashboard that were caused by missing data.

v6.19.7

Fecha de lanzamiento: 14 de octubre de 2024

Corrección de errores

This version resolves the Unknown sections in the AI Units consumption overview dashboard that were caused by missing data.

v6.22.0

Fecha de lanzamiento: 3 de octubre de 2024

Nota:

This package version is compatible with UIAutomation.Activities versions that are 24.10.0 or later.

Novedades

Soporte para actividades de una configuración local

You can now use the following activities within the Classify Document Scope and Data Extraction Scope, even if the robot is connected to a local Orchestrator:

For the Data Extraction Scope activity, specifically, we have made it possible to use auto-validation features from a different organization or tenant.

We've added the RuntimeTenantURL and RuntimeCredentialsAsset properties to the previous activities. With these properties, you can now directly use credentials from external applications, stored in Orchestrator, to access Document Understanding resources at runtime. To achieve this, ensure that your selected tenant has Document Understanding enabled and AI Units allocated.

Also, in the Get Capabilities wizard of Document Understanding Project Classifier and Document Understanding Project Extractor activities, we've included properties like App Id, App Secret, and TenantUrl. These properties facilitate accessing resources from different organizations and tenants during the design phase.

Soporte de IntelligentOCR para proyectos modernos

IntelligentOCR.Activities ahora admite el consumo de proyectos modernos de Document Understanding, a través de un nuevo conjunto de actividades dirigidas al uso de proyectos modernos. Ahora puedes utilizar las siguientes actividades para consumir tus proyectos y versiones modernas de Document Understanding:

Importante:

Erratum - May 26, 2025: For consuming modern projects in Document Understanding for Automation Suite version 2024.10 or lower, the only compatible version of the IntelligentOCR activity package is 6.22.0.

OCR de idiomas ampliados

Enhance the capability of your projects to process documents by using the UiPath Extended Languages OCR which is now generally available (GA).

Corrección de errores

  • Se ha resuelto un problema por el que se encontraba el error "La longitud del texto es cero" cuando tanto el Clasificador basado en teclado como el Clasificador inteligente de teclado se habilitaban para el mismo tipo de documento.
  • El extractor ML devolvía valores vacíos, lo que provocaba que las tareas de validación fallaran debido a las propiedades de valor nulo.
  • Los valores de campo añadidos manualmente en la Estación de Validación dentro de Action Center no se formateaban según la taxonomía, lo que provocaba que los resultados exportados mostraran datos incorrectos.
  • Se ha resuelto el problema que le impedía marcar tablas dentro de los archivos de imagen en la estación de validación.

Próximas obsolescencias

The UiPath Chinese, Japanese, Korean OCR will be deprecated starting with January 2025. We recommend using the UiPath Extended Languages OCR instead. Check the deprecation timeline for more information about upcoming deprecations and removals.

v6.19.6

Fecha de publicación: 13 de agosto de 2024

Hemos actualizado algunas dependencias internas para mejorar el rendimiento.

v6.19.5

Fecha de publicación: 31 de julio de 2024

Corrección de errores

  • Al intentar digitalizar un determinado contenido de archivo, se producía una excepción "System.InvalidOperation" junto con un mensaje de "Fullness" durante la actividad Digitalizar documento.
  • Al utilizar las actividades Clasificador generativo y Extractor generativo, introducir una solicitud que comenzaba o terminaba con espacios en blanco provocaba el error "KeyNotFoundException" con el mensaje "La clave dada no estaba presente en el diccionario".

v6.0.2

Fecha de lanzamiento: 29 de julio de 2024

Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.

v6.5.4

Fecha de lanzamiento: 29 de julio de 2024

Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.

v6.19.3

Fecha de publicación: 20 de junio de 2024

Trabajamos constantemente para mejorar su experiencia de UiPath Document Understanding. Aunque no hay cambios significativos importantes con esta versión, nos aseguramos de aportar mejoras secundarias y correcciones de accesibilidad en nuestro producto.

v6.14.2

Fecha de publicación: 5 de junio de 2024

Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.

v6.19.2

Fecha de publicación: 5 de junio de 2024

Corrección de errores

Crear acción de clasificación de documentos arrojaba un error si no se configuraba previamente una URL prefirmada.

v6.19.1

Fecha de publicación: 27 de mayo de 2024

Corrección de errores

  • Se resolvió un problema por el que se producía el error "La longitud del texto es cero" cuando tanto el Clasificador basado en teclado como el Clasificador inteligente de teclado estaban habilitados para el mismo tipo de documento.
  • El extractor ML devolvía valores vacíos, lo que provocaba que las tareas de validación fallaran debido a las propiedades de valor nulo.

v6.19.0

Fecha de lanzamiento: 29 de abril de 2024

Estas notas de la versión contienen todas las actualizaciones realizadas entre noviembre de 2023 y marzo de 2024.

Novedades

Notas del validador

You can now enable Validator Notes for each field in Taxonomy Manager. When enabled, you can set notes on these fields, and they are displayed to the human validator. If the notes are set as editable, the validator can edit them and communicate information back to the automation, through a new ExtractionResult object property.

Nota:

Please note that Validator Notes will be available in Action Center with the 2024.10 release of Automation Suite, and around the 2024.10 timeline for Action Center in Automation Cloud. Check the Action Center release notes to stay up to date.

Validación generativa para el ámbito de extracción de datos

You can use Generative Validation for the Data Extraction Scope activity to adjust confidence using generative extraction cross-checking. Check out the ApplyAutoValidation and AutoValidationConfidenceThreshold properties in the Data Extraction Scope activity.

Mejoras

  • Installing the UiPath.IntelligentOCR.Activities package automatically installs the UiPath.DocumentUnderstanding.ML.Activities package. You do not need to install it separately.

Corrección de errores

  • Se ha solucionado un problema por el que la fuente japonesa no se reconocía al convertir a JPG.
  • Se ha corregido un problema por el que el orden de los números en hebreo se invierte en la estación de validación.
  • Se ha corregido un problema relacionado con la extracción de valores de texto bidireccionales (de izquierda a derecha y de derecha a izquierda), que provocaba un orden incorrecto de los símbolos de puntuación.

Problemas conocidos

A known issue exists when using the Document Understanding Process Template version 2022.10.2 within Studio 2023.4.4 on a Windows project. Opening the Taxonomy Manager results in an error stating that you must install missing.NET frameworks. Regardless of whether you choose to install.NET or not, another error message follows: "Communication between UiPath Studio and Taxonomy Manager ended unexpectedly."

Workaround: Manually install the.NET 6.0 Runtime.

v6.14.1

Fecha de publicación: 24 de octubre de 2023

Nuevas funciones y mejoras

A new property, Extracted fields validation confidence %, is added for the following activities:

  • Mostrar Estación de Validación
  • Crear acción de validación de documentos

A new property, Send documents, is added to the following activities:

  • Extractor de forma
  • Clasificador inteligente de palabra clave

The Digitize Document activity can now detect native PDF radio buttons.

The content type detection capabilities of the Digitize Document is improved.

El Gestor de taxonomía ahora permite la definición de varias expresiones matemáticas en las reglas empresariales.

v6.9.5

Fecha de lanzamiento: 19 de septiembre de 2023

Hemos corregido una incidencia que desencadenaba un error You are not authorized al reanudar un trabajo una vez finalizada la validación de documentos desde Action Center.

v6.9.4

Fecha de lanzamiento: 28 de agosto de 2023

Hemos corregido un error que ralentizaba la Estación de validación cuando los documentos contenían tablas grandes.

v6.9.3

Fecha de lanzamiento: 8 de junio de 2023

Hemos corregido un error que provocaba inconsistencias en los valores formateados cuando la cantidad era negativa.

v6.9.2

Fecha de lanzamiento: 7 de junio de 2023

A new option is available when using the Form Extractor activity, Send documents for algorithm improvements, allowing you to enable or disable the option before running the workflow. The default value is enabled.

Hemos realizado correcciones de errores menores y correcciones de accesibilidad en todo el paquete UiPath.IntelligentOCR.Activities.

v6.5.3

Fecha de lanzamiento: 19 de septiembre de 2023

Hemos corregido una incidencia que desencadenaba un error You are not authorized al reanudar un trabajo una vez finalizada la validación de documentos desde Action Center.

v6.5.2

Fecha de lanzamiento: 7 de junio de 2023

Trabajamos constantemente para mejorar su experiencia de UiPath Document Understanding. Aunque no hay cambios significativos importantes con esta versión, nos aseguramos de aportar mejoras secundarias y correcciones de accesibilidad en nuestro producto.

v6.9.1

Fecha de lanzamiento: 2 de mayo de 2023

Corrección de errores

Hemos corregido un error que provocaba que la actividad Ámbito de extracción de datos se bloqueara cuando la extracción se completaba en todos los documentos secundarios menos en el primero. Esto sucedía cuando se usaba un clasificador para realizar la división de documentos y se devolvían varios resultados de clasificación desde Clasificar ámbito del documento.

v6.9.0

Fecha de lanzamiento: 26 de abril de 2023

Nuevas funciones y mejoras

  • UiPath Document OCR es el nuevo motor de OCR predeterminado para las siguientes actividades: Clasificador inteligente de palabras clave, Entrenador del clasificador inteligente de palabras clave y Extractor de formularios.
  • We've added a retry functionality to the Wait for Document Validation Action and Wait for Document Classification Action activities. You can use the new Retry option and set it as Enabled/Disabled, the default value being Enabled. If enabled, HTTP calls will be retried upon failure.
  • El paquete UiPath.IntelligentOCR.Activities ahora se puede usar con idiomas de derecha a izquierda.
  • La precisión de la extracción de la actividad Extractor de formularios se ha mejorado al incluir la información de coincidencia de página en el algoritmo de extracción.
  • Hemos actualizado el diseño de las reglas de campo que se pueden establecer en el Gestor de taxonomía.
  • Ahora puede aplicar expresiones matemáticas en reglas de campo usando el asistente del Gestor de taxonomía de la actividad Cargar taxonomía.
  • Se ha actualizado el asistente de Estación de validación, lo que le permite ver las reglas aplicadas a los campos. Además, cuando un campo se actualiza manualmente, la regla del campo también se actualiza automáticamente.
  • La actividad Digitalizar documento se ha mejorado y ahora consume menos memoria del sistema.
  • Los widgets de sello ahora están digitalizados en PDF nativos.
  • Se ha mejorado la compatibilidad de archivos PDF para la actividad Digitalizar documento.

Erratum September 2023: Splitting advanced features are available for the Intelligent Keyword Classifier activity.

Corrección de errores

  • We've updated the package dependencies and fixed the Method not found error thrown when an Invoke Code activity was added to the workflow.
  • We've fixed a bug that was preventing the auto population of the API key when your authentication token for the used Orchestrator instance has expired. The error occurred for both UiPath Document OCR and OCR for Chinese, Japanese, Korean API key fields.

Cronología de la obsolescencia

Te recomendamos comprobar periódicamente la fecha de caducidad para ver las actualizaciones relativas a las características que quedarán obsoletas y serán eliminadas.

v6.5.1

Fecha de lanzamiento: 27 de marzo de 2023

Nuevas funciones y mejoras

Trabajamos constantemente para mejorar el paquete UiPath.IntelligentOCR.Activities. Aunque no hay cambios significativos importantes con esta versión de parche, nos aseguramos de aportar mejoras menores y correcciones de accesibilidad en nuestro producto.

v6.6.0

Fecha de publicación: 15 de diciembre de 2022

Nuevas funciones y mejoras

  • La clave de la API de Document Understanding ahora se rellena previamente para las siguientes actividades: OCR de documentos de UiPath, OCR para chino, japonés y coreano, extractor de aprendizaje automático, clasificador de aprendizaje automático y gestión de plantillas del extractor de formularios.
  • La interfaz de usuario de Studio ya está disponible en chino tradicional.
  • Ahora puedes beneficiarte de que el campo Clave de API se rellene previamente para las siguientes actividades incluidas en el paquete UiPath.IntelligentOCR.Activities: Clasificador inteligente de palabras clave y Extractor de formularios.
  • El menú de atajos de teclado ahora incluye nuevas teclas de acceso rápido, agregadas en una sección separada de Accesibilidad. Están disponibles para las actividades Presentar estación de validación y Presentar estación de clasificación.

Corrección de errores

Fixed a bug that was preventing the auto-population of the API key when your authentication token for the used Orchestrator instance has expired. The error occurred for both UiPath Document OCR and OCR for Chinese, Japanese, Korean API key fields.

v6.5.0

Fecha de lanzamiento: 24 de octubre de 2022

Nuevas funciones y mejoras

  • New action objects are available for the Wait for Document Classification Action and Resume and Wait for Document Validation Action and Resume activities.
  • The Digitize Document activity has been upgraded and now comes with a default preselected OCR engine, the UiPath Document OCR engine. As a consequence to this change, the UiPath.OCR.Activities package has become a dependency of the UiPath.IntelligentOCR.Activities package.
  • Digitize Document activity received a new parameter, Detect Checkboxes, that enables the check box detection while the document is digitized.
  • The OCR confidence level can be individually updated for a selected field in Validation Station.
  • Se ha actualizado el diseño del filtro de confianza y se han añadido puntuaciones de confianza a nivel de tabla, para cada entrada, tanto para el OCR como para la extracción. Ahora puede comprobar el nivel de confianza original de un campo que se valida manualmente. Ambos valores están disponibles haciendo clic en el nivel de confianza mostrado.
  • Updates have been made to the Validation Station wizard. You can now set a threshold for the confidence levels and sort them depending on the set limit.
  • The Taxonomy Manager wizard interface was updated, making it even more easy to use. Among the new features are an extra Delete option for all groups, fields, categories, or the Toggle keyboard shortcuts option.
  • La detección de casillas de verificación ahora se aplica en páginas PDF nativas que no tienen caracteres o controles de casillas de verificación nativos integrados.
  • Las capacidades de procesamiento de PDF han recibido una actualización importante, incluida la capacidad de procesar texto basado en vectores, la capacidad de ignorar objetos de texto invisibles, las mejoras en la detección de palabras, las mejoras en el procesamiento de logotipos, las correcciones de problemas de duplicación de caracteres y otras mejoras.
  • Text extraction from PDF files has been upgraded, resulting in an optimized extraction process, where both native and scanned text is retrieved at the same time, with the OCR being applied only on the images identified in the PDF file. This improvement is available only when the ApplyOCROnPDF option is set to Auto.
  • The Document Understanding Process Studio template has been upgraded to a new version. The UiPath.IntelligentOCR.Activities package is a dependency for this template.

Corrección de errores

  • Se ha corregido un error que provocaba errores de extracción al utilizar el digitalizador mediante la actualización de la biblioteca de PDF y el uso de funciones híbridas de OCR.
  • Fixed a bug occurring on the Digitize Document activity that was causing checkbox extraction on some PDFs, even when the DetectCheckboxes option was set to False.
  • Fixed a bug occurring on the Classify Document Scope activity that was throwing an empty error for the documentText parameter when two classifiers were used in the scope and processing a certain document.
  • When a field from Validation Station was manually validated, the confidence level didn't update to 100%. The bug was fixed and now the percentage of the confidence level updates automatically when a field is manually validated by the user.
  • Fixed a bug that occurred in Classification Station wizard and Taxonomy Manager when the mouse cursor was moved to the Document View section. Now, everything works as expected.
  • An error occurred when Validation Station was used in text view with documents that included special characters. The bug was fixed and now you can view documents with special characters in text view as well.

8 de diciembre de 2022

Problemas conocidos

The UiPath.IntelligentOCR.Activities package, v6.5.0, cannot be run with Studio versions older than 2021.10.

v6.0.1

Fecha de publicación: 9 de mayo de 2022

Nuevas funciones y mejoras

  • We have been working hard to give a new face to some of our wizards, hence, the Validation Station, Classification Station, and Taxonomy Manager now all have a brand-new interface that is very user friendly and presents multiple new functionalities.
  • Some of the features worth mentioning from Validation Station are the confidence scores shown for each extracted field. They can be sorted by OCR or Extractor and show you exactly the confidence score for each extracted field. The confidence score should be used only for guidance purposes. You can always improve that score by manually validating the data.
  • The Validation Station wizard also has a restyled header in the PDF viewer from where you can choose to swipe the document view from left to right, to hide the extracted tokens for a clean view of the document, or to visualize the keyboard shortcuts. Don't hesitate anymore and go, try it out.
  • The Classification Station wizard presents itself with the same restyled header in the PDF viewer as its peer, the Validation Station. Here, you can also choose to display the document on the left or right side of the screen, or you can check the available keyboard shortcuts. The rotate option is also available in the new header, making document manipulation easier than ever.
  • The Taxonomy Manager wizard has, among other improvements, a new, particularly useful one, a Delete option available in the header of the document type that also enables a bulk delete.
  • The UiPath.IntelligentOCR.Activities package has been upgraded to .NET5 portable, allowing you to run them on Linux robots.
  • The UiPath Studio MSI size has been optimized and the UiPath.IntelligentOCR.Activities package is not anymore a core package of the UiPath Studio MSI, but an optional one. All functionalities remain the same. The only change is that you need to manually install the package in UiPath Studio.
  • The Digitize Document activity and the Intelligent Keyword Classifier activity have been updated and the ForceApplyOCR option has been replaced by the ApplyOcrOnPdf option. The Apply OCR on PDF has three options available in the dropdown list: True, False, and Auto. If set to True, the OCR is applied to all PDF pages of the document, if set to False, only digitally typed text is extracted. The default value is Auto, determining if the document requires to apply the OCR algorithm depending on the input document.
  • In Classification Station wizard, the value of the Not Classified groups is now set as N/A.
  • The Intelligent Form Extractor activity deprecation is planned for October 2022. We recommend using the Form Extractor activity.
  • The Form Extractor activity can now process documents with detected signatures on them.

Corrección de errores

  • Se ha corregido un error que se producía en el asistente de la Estación de validación. Algunas fuentes asiáticas no se mostraban correctamente en el visor de PDF de la estación de validación.
  • Fixed a bug occurring while using the Digitize Document activity with UiPath Studio v19.10 and v20.10. An error was thrown when trying to process .tiff files. Now, everything works as expected.
  • Se ha corregido un error que se producía en la Estación de validación al usar la tecla de atajo TAB. En lugar de guardar los cambios, la tecla TAB revertía el campo al valor anterior. Ahora todo funciona según lo esperado.
  • Fixed a bug occurring on the Form Extractor activity. The wrong error message was displayed when a template was imported.

Problemas conocidos

In case you use an Intel Xe GPU and Taxonomy Manager, Validation Station, or Classification Station are not displayed properly, we recommend updating the graphics driver to the latest version. For more information, visit Intel Support.

v5.0.2

Fecha de publicación: 19 de octubre de 2021

Mejoras

  • The Taxonomy Manager received a complete overhaul, with an improved UI and user experience. You can now add document types without group or category, configure colors and hotkeys for fields, and more. Consult the documentation for a complete description.
  • The UiPath.IntelligentOCR.Activities package has been upgraded to .NET5. While both .NET versions continue to be supported, the .NET5 projects can only work on 64-bit architectures.
  • The digitization process has been improved for the entire framework throughout Document Understanding and Data Manager.
  • Se han realizado mejoras para optimizar los resultados de OCR en documentos escaneados. Se obtienen los mejores resultados manteniendo el ángulo de inclinación entre +/- 20 grados.
  • Se han mejorado las dimensiones de procesamiento de imágenes para obtener mejores resultados. Para que una imagen se digitalice / procese con éxito, sus dimensiones de ancho y alto deben estar entre 50 y 10 000 píxeles. Cualquier imagen por debajo o por encima de este rango debe ser rechazada, con un mensaje de excepción. Una imagen validada con las dimensiones mencionadas anteriormente y con un tamaño total superior a 14 MP se reducirá a 14 MP, manteniendo la relación de aspecto (relación ancho / alto).
  • The Validation Station error message system has been improved and now, if the user rejects a document, an exception of type DocumentRejectedByUserException is thrown and the process is stopped.
  • Improved the load time of Validation Station for document types with large taxonomies.
  • For derived parts in Validation Station, numbers with more than two decimals are not rounded up anymore.
  • Debido a las mejoras en los algoritmos de procesamiento de imágenes, pueden aparecer cambios en la digitalización de ciertos documentos.
  • A new check box has been added to the Template Manager wizard, allowing you to choose if the added synonyms are case sensitive or not.
  • A design update has been made to the Template Manager wizard accessible from the Intelligent Form Extractor and Form Extractor activities.
  • If you experience timeouts due to long processing time, you can now use the newly added Timeout parameter for Form Extractor and Intelligent Form Extractor to increase the service call timeout.
  • If a field is checked in both Signature and Handwritten boxes in the Template Manager wizard of the Intelligent Form Extractor activity, then a popup message appears informing you that a field can be added only in one box, not both.
  • The wizard available for the Intelligent Keyword Classifier activity received an update, meaning that clicking the OK button of the vector(s) exported message now returns the user to the wizard instead of closing the wizard.
  • The Create Document Validation Action and Present Validation Station activities, received a new parameter, ShowOnlyRelevantPageRange. This allows you to configure the activity so that it only shows the page range captured in the classification part of the extraction result.
  • Performance and memory improvements in the Digitize Document activity.
  • La referencia CefSharp se actualizó a la versión 92.0.260.

Corrección de errores

  • Se ha corregido un error que se producía cuando el OCR se ejecutaba en diferentes formatos de región del sistema operativo. Ahora, el OCR se ejecuta según lo esperado y todos los resultados se generan correctamente, independientemente del formato de región del sistema operativo.
  • Fixed a bug in the Export Extraction Results activity that was deleting the extracted table when a field was marked as handwritten. Now, the entire extraction result is exported as expected.
  • Fixed an issue related to Validation Station that was causing unexpected number formatting when reading the derived parts value.
  • Fixed a bug in the Wait For Validation Action activity that was returning an error when the Automatic Extraction Result parameter was set as empty. Now, the activity runs as expected, without any errors.
  • Fixed an issue that threw a runtime error when no extraction results were served to the Present Validation Station activity.
  • Fixed an issue in Digitize Document activity, that caused the activity to crash when the ForceApplyOCR parameter was set to False.
  • Fixed an issue in the Template Manager wizard that caused data not to be extracted when using the table selection with Form Extractor.
  • Se ha corregido un problema que provocaba que no se extrajeran partes derivadas para un campo de fecha al procesar un documento específico.
  • Fixed an issue in the Template Manager wizard that caused anchors not to be highlighted after marking a table.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when stating that the fields from the extractors configuration could not be found in the taxonomy, although the extractors were removed from the scope.
  • Fixed an issue that caused the Template Manager wizard to throw an error when trying to save a template with certain words added as page evidence.
  • Fixed an issue which prevented the display of an empty Validation Station with full manual processing for data entry when the AutomaticExtractionResults parameter was null.
  • Fixed a bug that was occurring when special characters were included in the file or bucket name for any of the following activities: Create Document Classification Action, Wait for Document Classification Action, Create Document Validation Action, Wait for Document Validation Action. Now, all special characters from the file/bucket names are encoded as expected.
  • Se ha solucionado un problema que provocaba que no se extrajesen los campos de la firma y los escritos a mano debido al contraste de fondo. Ahora todos los campos se extraen correctamente, sin importar el color de fondo.
  • Se ha corregido un error que provocaba que el motor OCR devolviera un error en ciertos sistemas con espacios abiertos.
  • Fixed a bug that was merging the extracted content when using the Digitize Document activity with the UiPath Document OCR engine. Now, each item is extracted separately.

Problemas conocidos

  • If you want to use any OCR activity from this package in Studio v2019.10, please install the UiPath.CoreIPC package, version 2.0.1 or higher.
  • If you install the UiPath.IntelligentOCR.Activities package, v5.0.0 on a machine using Windows N/KN as an operating system, then the Media Features package is also required. Visit Media Feature Pack list for Windows N editions for installation instructions for the Media Features package.

v4.13.2

Fecha de publicación: 28 de mayo de 2021

Mejoras

Improved the load time of Validation Station for document types with large taxonomies.

v4.13.1

Fecha de publicación: 16 de abril de 2021

Mejoras

If you experience timeouts due to long processing time, you can now use the newly added Timeout parameter for Form Extractor and Intelligent Form Extractor to increase the service call timeout.

v4.13.0

Fecha de publicación: 29 de marzo de 2021

Nuevas características y mejoras

  • Extended the Form Extractor and Intelligent Form Extractor capabilities by adding field-level anchor-based extraction rules. Besides page-level anchors, field-level anchors can now be defined in Template Editor - a new option of defining the bounds of a custom area from which data is to be extracted. As opposed to page-level configurations, which define data positions with respect to the entire page content, anchor-based configurations now allow for targeting data extraction based on field-level configurations, thus allowing for more flexibility.
  • Performance improvements on Validation Station.
  • Updated Validation Station and Classification Station design system for a better user experience.
  • The Validation Station, Classification Station, and Template Manager now have a three-state button, in the Document View side, that allow users to choose between different document interaction modes: Tokens (word selections), Custom area (area selection), and Choice on selection (users can choose between Tokens and Custom Area at each selection).
  • The user interfaces, Validation Station, Classification Station, and Template Manager, have been improved with a new selection mode in text view, now allowing users to perform selections from the text version of a document in the same way they interact with the original version. A new hotkey, d+s, was also added, to assist in switching between the original document view and the text view modes.
  • The Validation Station now displays a "crop" from the original document, when you assign a value to a data field, under the reported text value selected. This helps with locating and verifying a specific field value against the value area in the document.
  • Changed confidence calculation for Intelligent Keyword Classifier to be scalable with the length of the word vectors.
  • Added the IncludeOCRConfidence checkbox to the properties panel of the Export Extraction Results activity. If selected, the exported information will contain OCR Confidence for each value as well.
  • Algoritmos mejorados de procesamiento de letras y palabras para evitar informar de caracteres o palabras duplicados en ciertas situaciones.
  • Classify Document Scope and Train Classifiers Scope now support classifier capabilities.
  • Classify Document Scope has been optimized to perform sequential calls to the classifiers in its scope, with only the page ranges that are not already classified by a previous extractor.

Corrección de errores

  • Fixed an issue that threw a runtime error in specific cases when a Form Extractor activity and an Intelligent Form Extractor activity were in the same Data Extraction Scope.
  • Se ha solucionado un problema que impedía que se produjeran errores del clasificador en casos específicos, pero la clasificación fallaba silenciosamente.
  • Se ha solucionado un problema que provocaba que no se extrajesen las partes derivadas de un campo numérico al procesar un documento específico.
  • Fixed an issue in Digitize Document, that caused the activity to process document pages even after an exception was reported, thus increasing the overall execution time for cases of failure.
  • Fixed a bug that did not allow for the correct configuration of Regex expressions in Regex Based Extractor, in C# projects, and other very specific situations.
  • Fixed a performance issue that appeared in Validation Station and Template Editor, when a document type contained more than 200 fields.
  • Se ha corregido un error por el que, en determinadas situaciones, los números se fusionaban en un solo valor numérico informado.
  • Fixed an issue through which, in certain situations, the Wait for Document Validation Action and Resume activity would throw an exception when communicating with storage buckets.

Problemas conocidos

The Create Document Classification Action,Create Document Validation Action and Wait for Document Classification and Resume ,Wait for Document Validation and Resume activities do not work with storage buckets on which the Access Data Through Orchestrator has been enabled.

versión 4.10.5

Fecha de publicación: 28 de mayo de 2021

Mejoras

Improved the load time of Validation Station for document types with large taxonomies.

v4.10.4

Fecha de publicación: 3 de febrero de 2021

Mejoras

Performance improvement of Validation Station.

v4.10.3

Fecha de lanzamiento: 11 de enero de 2021

Mejoras

Improved file upload from Create Document Validation Action and Create Document Classification Action on AWS hosted storage bucket.

v4.10.2

Fecha de publicación: 12 de noviembre de 2020

Nuevas características y mejoras

  • Referencia de CefSharp actualizada a la versión 84.4.10.
  • Puntos finales actualizados de la siguiente manera:
    • Form Extractor - from https://formextractor.uipath.com to https://du.uipath.com/svc/formextractor
    • Intelligent Form Extractor - from https://intelligentforms.uipath.com to https://du.uipath.com/svc/intelligentforms
    • Intelligent Keyword Classifier - from https://intelligentkeywords.uipath.com to https://du.uipath.com/svc/intelligentkeywords
  • Made improvements to Validation Station while in mark table mode.

Corrección de errores

Fixed an issue for Classification Document Classification Action related to the expiration of the Bearer Token.

v4.10.1

Fecha de publicación: 20 de octubre de 2020

Mejoras

More detailed error logging for Form Extractor, Intelligent Form Extractor and Intelligent Keyword Classifier.

Corrección de errores

  • Análisis de direcciones mejorado.
  • Fixed an issue where not all ML Skills were usable by the Form Extractor, Intelligent Form Extractor, and Intelligent Keyword Classifier activities.

v4.10.0

Fecha de lanzamiento: 5 de octubre de 2020

Nuevas características y mejoras

Nuevas actividades

Las siguientes actividades se han incluido en el paquete:

Estación de validación

To easily identify the information in the Validation Station, color codes were added to field cards and tokens or custom areas. Each field card has by default a color code, while tokens or custom areas get the same color code as the field card they are assigned to.

New shortcuts have been added to Validation Station allowing the user to move a selected line from a table up, down, left, or right. Also, when selections are made in Validation Station, these can be assigned to a specific field using field-level shortcuts. Each field card has a key associated with it. When no selections are made, you can use field-level shortcuts to jump from one field card to another.

For Validation Station table fields, a row-level checkmark was added. You can now check all the fields from a row by selecting the checkmark or it will be automatically checked when you visit all the fields.

Tokens in Validation Station have been updated. Thus, the highlighted tokens have a red bottom border and the selected tokens have a dashed border.

Field values with no reference are now supported in Validation Station. Users can assign values to fields that do not have a reference in the document. To do so, while the user creates a field in Taxonomy Manager, the Requires Reference checkbox needs to be unchecked.

Estación de clasificación

New shortcuts were created for Classification Station allowing the user to navigate through document types; add, change, remove or highlight reference; move all pages up or down; split after selected page; discard changes; save; report as exception.

Además de usar el menú de tipo de documento, ahora también se puede eliminar una referencia a nivel de página al pasar el cursor sobre una página y hacer clic en el icono azul en la esquina inferior derecha. El icono también permite resaltar la referencia.

Visor de PDF en la estación de clasificación y la estación de validación

The Rotate button was added to the PDF Viewer. By clicking the button, the current document page will rotate clockwise.

El modo de selección está habilitado por defecto en el Visor de PDF.

Otras actividades

The Intelligent Form Extractor and Form Extractor activities can now incorporate imported templates that have the same name but different content as the already available ones. Each template is analyzed, and a warning message is displayed for each case.

The ActionPriority property from the Create Document Validation Action activity now supports expressions and variables.

The terms BucketFolderPath and DirectoryFolderPath were changed to BucketDirectoryPath and DownloadDirectoryPath for the Create Document Validation Action activity, respectively for the Wait for Document Validation Action and Resume activity. The reason behind this is to clearly separate from the Orchestrator concept of “Folder”.

v4.5.2

Fecha de publicación: 24 de agosto de 2020

Corrección de errores

  • Se ha solucionado un problema que, en algunos casos, devolvía un mensaje de error 407ProxyAuthenticationRequired para las solicitudes de autenticación de Kerberos o NTLM. Esto se aplica al Extractor de formularios, el Extractor inteligente de formularios y el Clasificador inteligente de palabras clave.
  • Fixed an issue that was causing the Intelligent Form Extractor to not properly display a timeout error.
  • Missing translations were added for certain Validation Station strings.
  • Fixed an issue that was causing the Data Extraction Scope to throw an error when unselecting a table field.

v4.5.1

Fecha de lanzamiento: 24 de junio de 2020

Corrección de errores

  • Fixed an issue that was causing synchronization problems between the configuration window and the Properties panel for the Wait for Document Validation Action and Resume activity.
  • Se ha solucionado un problema por el que, en algunas situaciones, los campos de la tabla se guardaban por error como multivalores en la taxonomía.

v1.3.2

Fecha de publicación: 2 de junio de 2020

Mejoras

The UiPath.IntelligentOCR.Activities package was updated to reference the latest Uipath Vision library.

v4.5.0

Fecha de Lanzamiento: 4 de mayo de 2020

Nuevas características y mejoras

  • This release brings many new exciting activities such as Create Document Validation Action, and Wait for Document Validation Action and Resume that can be used to create, suspend, and resume orchestration workflows in the UiPath Action Center.
  • Two new extractors are here to be of your help. You can find them under the name of Form Extractor and Intelligent Form Extractor. Both activities can extract information from fixed form documents based on predefined templates, the difference being that the Intelligent Form Extractor can also be configured to interpret fields that are signed or handwritten. You can extract information from any type of field, including tables and create custom table extraction rules by using the Template Manager wizard.
  • While using the Intelligent Form Extractor activity, if the number of handwritten fields might have been exceeded, then a warning is displayed directly in the workflow. This does not stop the user from running the workflow.
  • The Regex Based Extractor activity received a new option named UseVisualAlignment that can be used for complex layouts where it is easier for users to write regular expressions based on how words are visually organized on lines, ignoring any sentence, paragraph, or layout group otherwise identified in the document.
  • Puede definir una expresión regular para identificar el área de la tabla, una expresión regular para identificar una fila de la tabla en esa área y expresiones regulares para identificar columnas específicas en las filas de la tabla.
  • Presentar estación de validación y su asistente incluyen muchas funciones nuevas y mejoradas.
  • The Validation Station wizard now has a new button named Discard changes. You can use it for confirming or dismissing any changes done in Validation Station. The function can be used on each document type individually.
  • The wizard also has a new option named Show Suggestions that allows you to select one value from multiple candidates if the used extractors report multiple possible values.
  • La lista de accesos directos disponibles en la Estación de validación se ha mejorado con uno nuevo, f+a, que le permite añadir un nuevo valor en un campo de varios valores.
  • Improvements have been made on the Digitize Document activity that can now better identify the check boxes in a document.
  • The Digitize Document activity also has a new option named ForceApplyOCR. When selected, it applies the OCR engine to all the pages of the document, including native PDF.
  • The Data Extraction Scope activity can now automatically read Extractor capabilities (internal taxonomies) if the Extractor declares them. This simplifies the configuration step by exposing the extractor's known fields. The Machine Learning Extractor now supports this new functionality, making it very easy to use and configure.
  • The Export Extraction Results activity received a new option named IncludeConfidence. If selected, the confidence level is provided.
  • Los asistentes de extracción y configuración ahora admiten la selección de campos en masa para tipos de documentos y campos de tablas.

v4.0.1

Fecha de lanzamiento: 14 de enero de 2020

Corrección de errores

  • Fixed an issue that was causing the Validation Station wizard to display incorrectly the table preferences, when using the Extract new table option.
  • Fixed an issue that was returning an error when Validation Station wizard was run with Callout activity chained before or after it. Now, the activity runs as expected.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when it was run with a customized machine culture and the FormatValuesIfPossible option selected. Now, the activity runs as expected.
  • Fixed an issue that was causing some performance issues when large amounts of text were selected in the Text View option of the Validation Station wizard. Now, the Text View option displays the text as expected.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when it was run with an extractor without an internal taxonomy set and a new field was added in the project’s taxonomy. Now, the activity runs as expected.
  • En ciertas máquinas, los documentos girados no se mostraban correctamente al usar la Estación de validación.

v4.0.0

Fecha de lanzamiento: 6 de diciembre de 2019

Cambios de última hora

Problemas conocidos

  • The UiPath.Abbyy.Activities package cannot be used with versions lower than v19.11 for the UiPath.UIAutomation.Activities package and lower than v4.0.0 for the UiPath.IntelligentOCR.Activities package.
  • If after updating a workflow to the new UiPath.IntelligentOCR.Activities v4.0.0 and UiPath.Abbyy.Activities v1.0.0 you encounter runtime validation errors, please force a new save on the .xaml file by making a small change and then reverting it. This might occur for workflows using FlexiCapture activities.
  • Workflows created or upgraded to UiPath.IntelligentOCR.Activities v4.0.0 cannot be downgraded to a lower UiPath.IntelligentOCR.Activities version.

Corrección de errores

An exception was thrown when the Digitize Document activity was used together with the OmniPage OCR for documents with special characters included in the Extended engine pack. The issue was fixed and now the activity is executed as expected.

v2.0.2

Fecha de lanzamiento: 25 de noviembre de 2019

Mejoras

Performance improvements took place for processing files within the document processing framework, for the UiPath.IntelligentOCR.Activities package.

v1.3.1

Fecha de lanzamiento: 25 de noviembre de 2019

Mejoras

Performance improvements took place for processing files within the document processing framework, for the UiPath.IntelligentOCR.Activities package.

v3.1.0

Fecha de lanzamiento: 8 de noviembre de 2019

Nuevas características y mejoras

  • A new activity meant to help you better organize and manage your trainable classifiers is available: Keyword Based Classifier Trainer. This activity can be used only together with the Train Classifiers Scope activity.
  • The Validation Station wizard received an important upgrade and is now available for you to explore its maximum potential. This wizard becomes available only when the Present Validation Station activity is used in a workflow. You can use the upgraded version for benefiting from a new user-friendly interface, navigating through the document while using the keyboard shortcuts, or selecting one or multiple words or a custom area. You can easily mark a field as missing, extract new data, edit a table, or extract a new table. All these marvelous things can be done with the Validation Station wizard while using a dark theme.
  • One of the improvements included in this release is that the Keyword Based Classifier activity received a new parameter named LearningData. Besides specifying where the learning file data are located, you can now also use the string containing the serialized classifier data. This activity was enhanced with a wizard named Manage Keyword Based Classifier Learning that can be used for configuring and managing the keywords used for identifying specific document types.
  • Both the Keyword Based Classifier and Keyword Based Classifier Trainer activities are now able to manage multiple keywords. After the keyword sets are selected, the extraction is based on a full match of the selected words.
  • Another great improvement is that the DocumentObjectModel output, included in the Digitize Document activity, can now support word polygons, besides word horizontal boxes.
  • The Taxonomy Manager wizard received a new scrolling bar that incorporates all UI elements and it provides a better user experience.
  • Data Extraction Scope, Train Extractors Scope, Train Classifier Scope, and Classify Document Scope activities are now arranging their extractors and classifiers in horizontal order, replacing the previous vertical order.
  • The Regex Based Extractor activity has been improved and can now process and return multi-values. The output is visible only when the activity is used together with the Validation Station.
  • Cuatro nuevos idiomas, turco (TR), portugués (PT), español (ES) y Spanish-México (ES-MX) están disponibles para el paquete UiPath.IntelligentOCR.Activities.

Problemas conocidos

Solo se puede acceder al Gestor de taxonomía si has abierto previamente un archivo .xaml . Si no hay archivos abiertos al acceder al Gestor de taxonomía, se mostrará una ventana de grabación y el Gestor de taxonomía solo se mostrará después de cerrar la ventana de grabación.

Corrección de errores

  • An exception was thrown when using the Data Extraction Scope activity together with a Try Catch activity. The issue was fixed and now the activity is executed as expected.
  • When a Boolean field was set to No in Validation Station, the output file should have shown the result as No but instead is showing it as missing. The issue was fixed and now the output file shows the correct result.
  • Fixed incorrect number parsing that occurred when the Data Extraction Scope was trying to parse numbers in documents using a different number format than the document's culture.
  • When using multiple Validation Stations, the order of the derived parts was not respected in the validated results. The issue was fixed and now the results are displaying the derived parts in the same order they were introduced.
  • Differences between the boxes with custom selection occurred when the results of a Validation Station were run through a second Validation Station. The issue was fixed and now there are no differences between boxes with custom selection.
  • When the Digitize Document activity was used together with Microsoft Azure Computer Vision OCR engine, the rotation was not working when HandwritingRecognition parameter was set as True. The issue was fixed and now the information is processed correctly.
  • When using Digitize Document activity, an error occurred when trying to process images with a lot of text. The bug was fixed by improving the scaling process.
  • Fixed an issue that was throwing when trying to train the Keyword Based Classifier activity in the training scope and the extraction was run without a classification reference. The issue was fixed and now the fact that there is no learning information is only logged, not thrown as an error.
  • An error was thrown when using the FlexiCapture Extractor activity and the same name was given to both a table column and a field. The issue was fixed and the .fcdot file is now processed as expected.

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado