- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado

Actividades de Document Understanding
Notas relacionadas
v7.1.0 - preview
Fecha de lanzamiento: 1 de abril de 2026
Novedades
New field types: Field Group and Monetary Quantity
Two new field types are now available when defining the taxonomy in Intelligent OCR automations: Field Group and Monetary Quantity.
Field Group allows you to structure related extraction fields together, replacing the previous Table-based output. Monetary Quantity is a dedicated field type for currency values, replacing generic numeric handling. Document Validation tasks automatically display Field Group results accordingly.
Mejoras
Advertencia de compatibilidad en tiempo de diseño
Studio ahora muestra una advertencia en tiempo de diseño cuando se utiliza la vista previa de Intelligent OCR 7.0.0 o posterior con un paquete de UiPath Vision anterior a la versión 4.0.0-preview. La advertencia te alerta de la falta de coincidencia de la versión antes de la ejecución del tiempo de ejecución.
Registro mejorado para actividades DU/Intelligent OCR
Ahora se registra contexto adicional para las actividades de Document Understanding e Intelligent OCR, lo que mejora la visibilidad de la resolución de problemas en los registros de Robot.
v7.0.0: vista previa
Fecha de lanzamiento: 25 de febrero de 2026
Cambios de última hora
- Se ha eliminado la compatibilidad con proyectos de Windows: heredado. A partir de esta versión, el paquete solo es compatible con proyectos de Windows.
- When upgrading, if you use IXP projects, make sure to review the configuration of your Document Understanding project extractors. Run
GetCapabilitiesagain and verify that the configuration in the Data Extraction Scope → Configure Extractors screen is still valid.
Novedades
To provide extraction capabilities tailored to a specific non-Latin document layout, you can now use a dedicated modern project type called Predefined Non-Latin Languages in the Document Understanding Project Extractor activity. This project type offers the following extractors:
- Invoices Japan – Recommended for Japanse invoice documents. The extractor can handle common Japanese invoice layouts, and can identify and extract key invoice fields such as supplier information, invoice number, and currency.
- Invoices China - Recommended for Chinese invoice documents. The extractor can handle common Chinese invoice layouts, and can identify and extract key invoice fields such as supplier information, invoice number, and currency.
- Receipts Japan - Recommended for Japanese receipt documents. You can use the extractor to identify and extract fields such as merchant name, transaction date, total amount, tax, and currency from Japanese-language receipts.
v6.27.3
Fecha de lanzamiento: 16 de marzo de 2026
Mejoras
Se ha mejorado el flujo de actualización de tokens para reducir las solicitudes fallidas causadas por tokens de acceso caducados. La actividad ahora utiliza un token de acceso en caché cuando está disponible. Se ha optimizado el flujo de actualización de tokens, lo que reduce significativamente el número de llamadas de autenticación y mejora el rendimiento y la fiabilidad generales.
v6.27.2
Fecha de lanzamiento: 16 de diciembre de 2025
Mejoras
Las salidas de documentos divididos ahora utilizan nombres de archivo claros y trazables derivados del nombre del documento original y el rango de páginas.
Corrección de errores
Se ha corregido un problema por el que la actividad Redactar documento generaba una sección horizontal en orientación vertical.
v6.27.0
Fecha de lanzamiento: 28 de octubre de 2025
Novedades
Argumento de salida de IdDeDocumentoDeReferencia
The ReferenceDocumentId output argument is now available in the Document Understanding Project Classifier and Document Understanding Project Extractor activities. This is the Document ID within the Document Understanding services.
Corrección de errores
Se ha corregido un problema en el Entrenador del extractor de proyectos de DU para mejorar la autenticación entre tenants.
Problemas conocidos
Erratum - added 11 November 2025: This was erroneously marked as a known issue. With correct configuration, no design-time and runtime errors occur.
Al utilizar actividades con un Orchestrator independiente en el que no existe una estructura de tenant, pueden producirse errores de tiempo de diseño y tiempo de ejecución.
v6.26.0
Fecha de lanzamiento: 25 de agosto de 2025
Novedades
Reordenar páginas dentro de un documento durante la clasificación
For greater flexibility, you can now reorder pages within a document, when classifying them in the Classification Station. To enable this capability, use the EnablePageReorder property, available in the Present Classification Station and Create Document Classification Action activities.
Reentrenar modelos al utilizar proyectos modernos de Document Understanding
You can now enhance the extraction capabilities of your models, by retraining them on the specific documents that you validate through the Validation Station. You can use the Document Understanding Project Extractor Trainer activity to retrain models when working with modern Document Understanding projects.
Redactar documentos
The new Redact Document activity allows you to input a document and an extraction result, generating a new file without any sourced details. The output document is the redacted copy of the input, with all information provided as input being redacted accordingly. Any information within the extraction result is redacted using a style of your choice.
Modo compacto de la estación de validación
Validation Station can now be used with a new face: the Compact Display Mode. This provides more space for fields, easier highlighting for the fields that require attention, a centralized business checks section, and a host of other validator-centered features. To enable the Compact Mode, update the IntelligentOCR.Activities pack to 6.25.0-preview or higher, then go to the Create Document Validation Action or Present Validation Station activity, and set the DisplayMode input argument to Compact.
Cambios de validación para los campos de la tabla en la estación de validación
Hemos actualizado el proceso de validación de tablas tanto en la estación de validación clásica como en la compacta, diseñado para mejorar la experiencia del usuario y el rendimiento general. Hemos traído las siguientes actualizaciones:
- Ahora puedes guardar parcialmente una tabla siempre que no haya celdas no válidas. Puedes guardar parcialmente el campo de la tabla utilizando la opción Listo .
- <number> <number> Utiliza las opciones Hay <número> celdas no válidas y Hay <número> celdas no confirmadas para navegar a celdas no válidas o no confirmadas.
- Cada celda dentro de la tabla ahora muestra una casilla de verificación de confirmación.
- Confirma toda la tabla seleccionando Confirmar todas las celdas.
- Puedes enviar una acción sin visitar y confirmar manualmente todas las tablas. La opción Enviar mostrará el número de campos y tablas, que se confirmarán automáticamente antes de enviarlos.
También hemos implementado varias mejoras y resuelto problemas para mejorar tu experiencia de usuario:
- Se ha mejorado el rendimiento general y la navegación de la validación de tablas.
- Se ha optimizado la visualización de las reglas empresariales no válidas.
- Se han corregido problemas relacionados con la falta de celdas de tabla que no se renderizaban y la visualización incorrecta de tablas de solo lectura.
La siguiente imagen muestra la interfaz de usuario de la estación de validación compacta para el proceso actualizado.
Figura 1. Proceso de validación actualizado para la estación de validación compacta

La siguiente imagen muestra la interfaz de usuario de la estación de validación clásica para el proceso actualizado.
Figura 2. Proceso de validación actualizado para la estación de validación clásica

For more information on the updated validation process, visit Classic Validation Station and Compact Validation Station.
Mejoras
- The Present Validation Station , Create Document Validation Action, and Create Document Validation Artifacts activities now have the ShowOnlyRelevantPageRane property set by default to
True. - When you obtain the
ClassificationResultfrom the Classify Document Scope or Present Classification Station activities, you can access the page range for the classified sub-documents using theItem.DocumentBounds.PageRangeproperty on theClassificationResultvariable. - The Intelligent Keyword Classifier activity can now classify pages with fewer words.
- La actividad Recuperar artefactos de validación de documentos ahora tiene el resultado extraído validado en el diseñador principal para facilitar el acceso.
- Data is now also collected for retraining and available in the Exceptions for the review section of a Modern Project.
Corrección de errores
- La salida de la actividad Leer texto en PDF extraía por error un documento escrito en español como caracteres del alfabeto griego.
- When training the Intelligent Keyword Classifier in certain conditions, the classifier would fail to train correctly and would cause a performance degradation.
- Se ha corregido un problema por el que el valor numérico de ciertos documentos se analizaba incorrectamente.
- Fixed an issue where the Create action and Create artifacts activities would fail unexpectedly.
v6.24.0
Fecha de lanzamiento: 16 de abril de 2025
Habilitar los controles de derecha a izquierda en la Estación de validación
Use the EnableRTL property to display Validation Station controls from right to left. To interact with Validation Station in right-to-left text format, set EnableRTL to True. This property applies to the following activities:
Validación mejorada con Estación de validación compacta
The DisplayMode property lets you choose your preferred interface when working with the Validation Station:
- Classic: This is the standard interface. This is the interface which was always used until this release.
- Compact: This enhanced interface offers a better user experience with improvements, such as:
- Se ha mejorado el proceso de entrada manual en la Estación de validación para facilitar su uso.
- Los tokens para los valores resaltados dentro del documento ahora aparecen dentro de una línea roja para una mejor visibilidad.
- Ability to add values for fields, even when the taxonomy Requires reference setting is disabled.
New display settings for document types in the Taxonomy Manager, including:
- OCR confidence threshold: Defines a minimum confidence threshold for OCR that the Validation Station considers when compared to confidence thresholds generated during validation.
- Date display format: Sets a preferred date format.
- Number decimal separator: Determines a decimal separator for number fields within the document type.
- Number thousands separator: Determines a thousands separator for number fields within the document type.
Nota:For more information on the updates brought to the Taxonomy Manager, visit Load Taxonomy.
Besides the customizable OCR confidence threshold for the document type, you can set an Extraction confidence threshold for each field in your taxonomy. Find this setting in the Details tab under Validation settings in the Taxonomy Manager.
Puedes cambiar entre las interfaces de la estación de validación en las siguientes actividades:
Validate documents in Action Center using UiPath® apps
You can now boost the efficiency of your document processing understanding workflows with UiPath® apps. Apart from creating document validation tasks directly in Action Center, you can now build an Action app that shows the document and the validation station. Once set up, the validation station and the target document are displayed inside Action Center, awaiting user intervention. For more information on validating documents using Action apps, visit the Validating documents with App actions tutorial.
Usar etiquetas y versiones para proyectos modernos de Document Understanding
To tailor document understanding workflows to your needs, you can now use specific versions of your projects during classification and extraction. The Tag property provides granular control for testing your Document Understanding workflows before rolling them out into production. For more information, visit Document Understanding Project Classifier and Document Understanding Project Extractor.
Capacidades de extracción mejoradas utilizando nuevos extractores generativos
Para mejorar las capacidades de extracción generativa tanto para documentos cortos como largos que tienen diseños complejos, ahora puedes seleccionar los siguientes extractores generativos al configurar extractores para tus campos de documento:
- Long Documents Simple Layout – This is the existent Generative Extractor.
- Long Documents Complex Layout (Preview) – Optimized for long form documents that include images, handwriting, form elements or other complex layouts, such as floating callout boxes. Examples of documents that are suitable for this extractor: insurance policies, or other similar long form documents with complex layouts.
- Short Document Complex Layout (Preview) – Optimized for short documents that include images, handwriting, form elements or other complex layouts like floating callout boxes. For example: identity cards, or healthcare intake forms with complex layouts.
Mejoras
La parte de digitalización de tus flujos de trabajo de procesamiento de documentos ahora puede reconocer y devolver datos de documentos que contienen valores que están en un círculo, subrayados o tachados.
Corrección de errores
- Data from certain tables was not appearing in PDF files despite successful digitization with the Digitize Document activity.
- Al digitalizar archivos PDF, faltaban firmas.
- En ocasiones, el proceso de extracción identificaba erróneamente el estado de los campos de tipo Dirección debido a problemas de análisis de direcciones.
- The Digitize Document activity would return text from a PDF document, even when the text was concealed using PDF readers.
- Los cuadros de texto de un documento no se digitalizaban, por lo que no se mostraban en el Document Manager.
- Cierto texto no se extraía durante el proceso de extracción del documento debido a problemas relacionados con la sangría y el procesamiento del ángulo de los documentos girados.
- Después de migrar un proyecto a la compatibilidad de Windows, las ejecuciones fallaban con el siguiente error: "Trabajo detenido con un código de salida inesperado".
v6.22.1
Fecha de lanzamiento: 26 de noviembre de 2024
Mejoras
Se actualizó el texto de explicación en el Editor de plantillas del Extractor de Formularios para reflejar el proceso de definición de anclajes de campo.
Corrección de errores
- Data from certain tables was not appearing in PDF files despite successful digitization with the Digitize Document activity.
- Se resolvió un problema por el que el texto mostrado en el documento PDF generado era impreciso.
v.6.9.8
Fecha de lanzamiento: 22 de octubre de 2024
Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.
v6.14.3
Fecha de lanzamiento: 21 de octubre de 2024
Corrección de errores
This version resolves the Unknown sections in the AI Units consumption overview dashboard that were caused by missing data.
v6.19.7
Fecha de lanzamiento: 14 de octubre de 2024
Corrección de errores
This version resolves the Unknown sections in the AI Units consumption overview dashboard that were caused by missing data.
v6.22.0
Fecha de lanzamiento: 3 de octubre de 2024
This package version is compatible with UIAutomation.Activities versions that are 24.10.0 or later.
Novedades
Soporte para actividades de una configuración local
You can now use the following activities within the Classify Document Scope and Data Extraction Scope, even if the robot is connected to a local Orchestrator:
- Clasificador generativo
- Extractor generativo
- Clasificador de proyectos de Document Understanding
- Extractor de proyectos de Document Understanding
For the Data Extraction Scope activity, specifically, we have made it possible to use auto-validation features from a different organization or tenant.
We've added the RuntimeTenantURL and RuntimeCredentialsAsset properties to the previous activities. With these properties, you can now directly use credentials from external applications, stored in Orchestrator, to access Document Understanding resources at runtime. To achieve this, ensure that your selected tenant has Document Understanding enabled and AI Units allocated.
Also, in the Get Capabilities wizard of Document Understanding Project Classifier and Document Understanding Project Extractor activities, we've included properties like App Id, App Secret, and TenantUrl. These properties facilitate accessing resources from different organizations and tenants during the design phase.
Soporte de IntelligentOCR para proyectos modernos
IntelligentOCR.Activities ahora admite el consumo de proyectos modernos de Document Understanding, a través de un nuevo conjunto de actividades dirigidas al uso de proyectos modernos. Ahora puedes utilizar las siguientes actividades para consumir tus proyectos y versiones modernas de Document Understanding:
- Document Understanding Project Classifier, used within a Classify Document Scope activity.
- Document Understanding Project Extractor within a Data Extraction Scope activity.
Erratum - May 26, 2025: For consuming modern projects in Document Understanding for Automation Suite version 2024.10 or lower, the only compatible version of the IntelligentOCR activity package is 6.22.0.
OCR de idiomas ampliados
Enhance the capability of your projects to process documents by using the UiPath Extended Languages OCR which is now generally available (GA).
Corrección de errores
- Se ha resuelto un problema por el que se encontraba el error "La longitud del texto es cero" cuando tanto el Clasificador basado en teclado como el Clasificador inteligente de teclado se habilitaban para el mismo tipo de documento.
- El extractor ML devolvía valores vacíos, lo que provocaba que las tareas de validación fallaran debido a las propiedades de valor nulo.
- Los valores de campo añadidos manualmente en la Estación de Validación dentro de Action Center no se formateaban según la taxonomía, lo que provocaba que los resultados exportados mostraran datos incorrectos.
- Se ha resuelto el problema que le impedía marcar tablas dentro de los archivos de imagen en la estación de validación.
Próximas obsolescencias
The UiPath Chinese, Japanese, Korean OCR will be deprecated starting with January 2025. We recommend using the UiPath Extended Languages OCR instead. Check the deprecation timeline for more information about upcoming deprecations and removals.
v6.19.6
Fecha de publicación: 13 de agosto de 2024
Hemos actualizado algunas dependencias internas para mejorar el rendimiento.
v6.19.5
Fecha de publicación: 31 de julio de 2024
Corrección de errores
- Al intentar digitalizar un determinado contenido de archivo, se producía una excepción "System.InvalidOperation" junto con un mensaje de "Fullness" durante la actividad Digitalizar documento.
- Al utilizar las actividades Clasificador generativo y Extractor generativo, introducir una solicitud que comenzaba o terminaba con espacios en blanco provocaba el error "KeyNotFoundException" con el mensaje "La clave dada no estaba presente en el diccionario".
v6.0.2
Fecha de lanzamiento: 29 de julio de 2024
Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.
v6.5.4
Fecha de lanzamiento: 29 de julio de 2024
Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.
v6.19.3
Fecha de publicación: 20 de junio de 2024
Trabajamos constantemente para mejorar su experiencia de UiPath Document Understanding. Aunque no hay cambios significativos importantes con esta versión, nos aseguramos de aportar mejoras secundarias y correcciones de accesibilidad en nuestro producto.
v6.14.2
Fecha de publicación: 5 de junio de 2024
Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.
v6.19.2
Fecha de publicación: 5 de junio de 2024
Corrección de errores
Crear acción de clasificación de documentos arrojaba un error si no se configuraba previamente una URL prefirmada.
v6.19.1
Fecha de publicación: 27 de mayo de 2024
Corrección de errores
- Se resolvió un problema por el que se producía el error "La longitud del texto es cero" cuando tanto el Clasificador basado en teclado como el Clasificador inteligente de teclado estaban habilitados para el mismo tipo de documento.
- El extractor ML devolvía valores vacíos, lo que provocaba que las tareas de validación fallaran debido a las propiedades de valor nulo.
v6.19.0
Fecha de lanzamiento: 29 de abril de 2024
Estas notas de la versión contienen todas las actualizaciones realizadas entre noviembre de 2023 y marzo de 2024.
Novedades
Notas del validador
You can now enable Validator Notes for each field in Taxonomy Manager. When enabled, you can set notes on these fields, and they are displayed to the human validator. If the notes are set as editable, the validator can edit them and communicate information back to the automation, through a new ExtractionResult object property.
Please note that Validator Notes will be available in Action Center with the 2024.10 release of Automation Suite, and around the 2024.10 timeline for Action Center in Automation Cloud. Check the Action Center release notes to stay up to date.
Validación generativa para el ámbito de extracción de datos
You can use Generative Validation for the Data Extraction Scope activity to adjust confidence using generative extraction cross-checking. Check out the ApplyAutoValidation and AutoValidationConfidenceThreshold properties in the Data Extraction Scope activity.
Mejoras
- Installing the UiPath.IntelligentOCR.Activities package automatically installs the UiPath.DocumentUnderstanding.ML.Activities package. You do not need to install it separately.
Corrección de errores
- Se ha solucionado un problema por el que la fuente japonesa no se reconocía al convertir a JPG.
- Se ha corregido un problema por el que el orden de los números en hebreo se invierte en la estación de validación.
- Se ha corregido un problema relacionado con la extracción de valores de texto bidireccionales (de izquierda a derecha y de derecha a izquierda), que provocaba un orden incorrecto de los símbolos de puntuación.
Problemas conocidos
A known issue exists when using the Document Understanding Process Template version 2022.10.2 within Studio 2023.4.4 on a Windows project. Opening the Taxonomy Manager results in an error stating that you must install missing.NET frameworks. Regardless of whether you choose to install.NET or not, another error message follows: "Communication between UiPath Studio and Taxonomy Manager ended unexpectedly."
Workaround: Manually install the.NET 6.0 Runtime.
v6.14.1
Fecha de publicación: 24 de octubre de 2023
Nuevas funciones y mejoras
A new property, Extracted fields validation confidence %, is added for the following activities:
- Mostrar Estación de Validación
- Crear acción de validación de documentos
A new property, Send documents, is added to the following activities:
- Extractor de forma
- Clasificador inteligente de palabra clave
The Digitize Document activity can now detect native PDF radio buttons.
The content type detection capabilities of the Digitize Document is improved.
El Gestor de taxonomía ahora permite la definición de varias expresiones matemáticas en las reglas empresariales.
v6.9.5
Fecha de lanzamiento: 19 de septiembre de 2023
Hemos corregido una incidencia que desencadenaba un error You are not authorized al reanudar un trabajo una vez finalizada la validación de documentos desde Action Center.
v6.9.4
Fecha de lanzamiento: 28 de agosto de 2023
Hemos corregido un error que ralentizaba la Estación de validación cuando los documentos contenían tablas grandes.
v6.9.3
Fecha de lanzamiento: 8 de junio de 2023
Hemos corregido un error que provocaba inconsistencias en los valores formateados cuando la cantidad era negativa.
v6.9.2
Fecha de lanzamiento: 7 de junio de 2023
A new option is available when using the Form Extractor activity, Send documents for algorithm improvements, allowing you to enable or disable the option before running the workflow. The default value is enabled.
Hemos realizado correcciones de errores menores y correcciones de accesibilidad en todo el paquete UiPath.IntelligentOCR.Activities.
v6.5.3
Fecha de lanzamiento: 19 de septiembre de 2023
Hemos corregido una incidencia que desencadenaba un error You are not authorized al reanudar un trabajo una vez finalizada la validación de documentos desde Action Center.
v6.5.2
Fecha de lanzamiento: 7 de junio de 2023
Trabajamos constantemente para mejorar su experiencia de UiPath Document Understanding. Aunque no hay cambios significativos importantes con esta versión, nos aseguramos de aportar mejoras secundarias y correcciones de accesibilidad en nuestro producto.
v6.9.1
Fecha de lanzamiento: 2 de mayo de 2023
Corrección de errores
Hemos corregido un error que provocaba que la actividad Ámbito de extracción de datos se bloqueara cuando la extracción se completaba en todos los documentos secundarios menos en el primero. Esto sucedía cuando se usaba un clasificador para realizar la división de documentos y se devolvían varios resultados de clasificación desde Clasificar ámbito del documento.
v6.9.0
Fecha de lanzamiento: 26 de abril de 2023
Nuevas funciones y mejoras
- UiPath Document OCR es el nuevo motor de OCR predeterminado para las siguientes actividades: Clasificador inteligente de palabras clave, Entrenador del clasificador inteligente de palabras clave y Extractor de formularios.
- We've added a retry functionality to the Wait for Document Validation Action and Wait for Document Classification Action activities. You can use the new Retry option and set it as Enabled/Disabled, the default value being Enabled. If enabled, HTTP calls will be retried upon failure.
- El paquete UiPath.IntelligentOCR.Activities ahora se puede usar con idiomas de derecha a izquierda.
- La precisión de la extracción de la actividad Extractor de formularios se ha mejorado al incluir la información de coincidencia de página en el algoritmo de extracción.
- Hemos actualizado el diseño de las reglas de campo que se pueden establecer en el Gestor de taxonomía.
- Ahora puede aplicar expresiones matemáticas en reglas de campo usando el asistente del Gestor de taxonomía de la actividad Cargar taxonomía.
- Se ha actualizado el asistente de Estación de validación, lo que le permite ver las reglas aplicadas a los campos. Además, cuando un campo se actualiza manualmente, la regla del campo también se actualiza automáticamente.
- La actividad Digitalizar documento se ha mejorado y ahora consume menos memoria del sistema.
- Los widgets de sello ahora están digitalizados en PDF nativos.
- Se ha mejorado la compatibilidad de archivos PDF para la actividad Digitalizar documento.
Erratum September 2023: Splitting advanced features are available for the Intelligent Keyword Classifier activity.
Corrección de errores
- We've updated the package dependencies and fixed the Method not found error thrown when an Invoke Code activity was added to the workflow.
- We've fixed a bug that was preventing the auto population of the API key when your authentication token for the used Orchestrator instance has expired. The error occurred for both UiPath Document OCR and OCR for Chinese, Japanese, Korean API key fields.
Cronología de la obsolescencia
Te recomendamos comprobar periódicamente la fecha de caducidad para ver las actualizaciones relativas a las características que quedarán obsoletas y serán eliminadas.
v6.5.1
Fecha de lanzamiento: 27 de marzo de 2023
Nuevas funciones y mejoras
Trabajamos constantemente para mejorar el paquete UiPath.IntelligentOCR.Activities. Aunque no hay cambios significativos importantes con esta versión de parche, nos aseguramos de aportar mejoras menores y correcciones de accesibilidad en nuestro producto.
v6.6.0
Fecha de publicación: 15 de diciembre de 2022
Nuevas funciones y mejoras
- La clave de la API de Document Understanding ahora se rellena previamente para las siguientes actividades: OCR de documentos de UiPath, OCR para chino, japonés y coreano, extractor de aprendizaje automático, clasificador de aprendizaje automático y gestión de plantillas del extractor de formularios.
- La interfaz de usuario de Studio ya está disponible en chino tradicional.
- Ahora puedes beneficiarte de que el campo Clave de API se rellene previamente para las siguientes actividades incluidas en el paquete UiPath.IntelligentOCR.Activities: Clasificador inteligente de palabras clave y Extractor de formularios.
- El menú de atajos de teclado ahora incluye nuevas teclas de acceso rápido, agregadas en una sección separada de Accesibilidad. Están disponibles para las actividades Presentar estación de validación y Presentar estación de clasificación.
Corrección de errores
Fixed a bug that was preventing the auto-population of the API key when your authentication token for the used Orchestrator instance has expired. The error occurred for both UiPath Document OCR and OCR for Chinese, Japanese, Korean API key fields.
v6.5.0
Fecha de lanzamiento: 24 de octubre de 2022
Nuevas funciones y mejoras
- New action objects are available for the Wait for Document Classification Action and Resume and Wait for Document Validation Action and Resume activities.
- The Digitize Document activity has been upgraded and now comes with a default preselected OCR engine, the UiPath Document OCR engine. As a consequence to this change, the UiPath.OCR.Activities package has become a dependency of the UiPath.IntelligentOCR.Activities package.
- Digitize Document activity received a new parameter,
Detect Checkboxes, that enables the check box detection while the document is digitized. - The OCR confidence level can be individually updated for a selected field in Validation Station.
- Se ha actualizado el diseño del filtro de confianza y se han añadido puntuaciones de confianza a nivel de tabla, para cada entrada, tanto para el OCR como para la extracción. Ahora puede comprobar el nivel de confianza original de un campo que se valida manualmente. Ambos valores están disponibles haciendo clic en el nivel de confianza mostrado.
- Updates have been made to the Validation Station wizard. You can now set a threshold for the confidence levels and sort them depending on the set limit.
- The Taxonomy Manager wizard interface was updated, making it even more easy to use. Among the new features are an extra Delete option for all groups, fields, categories, or the Toggle keyboard shortcuts option.
- La detección de casillas de verificación ahora se aplica en páginas PDF nativas que no tienen caracteres o controles de casillas de verificación nativos integrados.
- Las capacidades de procesamiento de PDF han recibido una actualización importante, incluida la capacidad de procesar texto basado en vectores, la capacidad de ignorar objetos de texto invisibles, las mejoras en la detección de palabras, las mejoras en el procesamiento de logotipos, las correcciones de problemas de duplicación de caracteres y otras mejoras.
- Text extraction from PDF files has been upgraded, resulting in an optimized extraction process, where both native and scanned text is retrieved at the same time, with the OCR being applied only on the images identified in the PDF file. This improvement is available only when the ApplyOCROnPDF option is set to Auto.
- The Document Understanding Process Studio template has been upgraded to a new version. The UiPath.IntelligentOCR.Activities package is a dependency for this template.
Corrección de errores
- Se ha corregido un error que provocaba errores de extracción al utilizar el digitalizador mediante la actualización de la biblioteca de PDF y el uso de funciones híbridas de OCR.
- Fixed a bug occurring on the Digitize Document activity that was causing checkbox extraction on some PDFs, even when the
DetectCheckboxesoption was set to False. - Fixed a bug occurring on the Classify Document Scope activity that was throwing an empty error for the
documentTextparameter when two classifiers were used in the scope and processing a certain document. - When a field from Validation Station was manually validated, the confidence level didn't update to 100%. The bug was fixed and now the percentage of the confidence level updates automatically when a field is manually validated by the user.
- Fixed a bug that occurred in Classification Station wizard and Taxonomy Manager when the mouse cursor was moved to the Document View section. Now, everything works as expected.
- An error occurred when Validation Station was used in text view with documents that included special characters. The bug was fixed and now you can view documents with special characters in text view as well.
8 de diciembre de 2022
Problemas conocidos
The UiPath.IntelligentOCR.Activities package, v6.5.0, cannot be run with Studio versions older than 2021.10.
v6.0.1
Fecha de publicación: 9 de mayo de 2022
Nuevas funciones y mejoras
- We have been working hard to give a new face to some of our wizards, hence, the Validation Station, Classification Station, and Taxonomy Manager now all have a brand-new interface that is very user friendly and presents multiple new functionalities.
- Some of the features worth mentioning from Validation Station are the confidence scores shown for each extracted field. They can be sorted by OCR or Extractor and show you exactly the confidence score for each extracted field. The confidence score should be used only for guidance purposes. You can always improve that score by manually validating the data.
- The Validation Station wizard also has a restyled header in the PDF viewer from where you can choose to swipe the document view from left to right, to hide the extracted tokens for a clean view of the document, or to visualize the keyboard shortcuts. Don't hesitate anymore and go, try it out.
- The Classification Station wizard presents itself with the same restyled header in the PDF viewer as its peer, the Validation Station. Here, you can also choose to display the document on the left or right side of the screen, or you can check the available keyboard shortcuts. The rotate option is also available in the new header, making document manipulation easier than ever.
- The Taxonomy Manager wizard has, among other improvements, a new, particularly useful one, a Delete option available in the header of the document type that also enables a bulk delete.
- The UiPath.IntelligentOCR.Activities package has been upgraded to .NET5 portable, allowing you to run them on Linux robots.
- The UiPath Studio MSI size has been optimized and the UiPath.IntelligentOCR.Activities package is not anymore a core package of the UiPath Studio MSI, but an optional one. All functionalities remain the same. The only change is that you need to manually install the package in UiPath Studio.
- The Digitize Document activity and the Intelligent Keyword Classifier activity have been updated and the ForceApplyOCR option has been replaced by the ApplyOcrOnPdf option. The Apply OCR on PDF has three options available in the dropdown list: True, False, and Auto. If set to True, the OCR is applied to all PDF pages of the document, if set to False, only digitally typed text is extracted. The default value is Auto, determining if the document requires to apply the OCR algorithm depending on the input document.
- In Classification Station wizard, the value of the Not Classified groups is now set as N/A.
- The Intelligent Form Extractor activity deprecation is planned for October 2022. We recommend using the Form Extractor activity.
- The Form Extractor activity can now process documents with detected signatures on them.
Corrección de errores
- Se ha corregido un error que se producía en el asistente de la Estación de validación. Algunas fuentes asiáticas no se mostraban correctamente en el visor de PDF de la estación de validación.
- Fixed a bug occurring while using the Digitize Document activity with UiPath Studio v19.10 and v20.10. An error was thrown when trying to process
.tifffiles. Now, everything works as expected. - Se ha corregido un error que se producía en la Estación de validación al usar la tecla de atajo TAB. En lugar de guardar los cambios, la tecla TAB revertía el campo al valor anterior. Ahora todo funciona según lo esperado.
- Fixed a bug occurring on the Form Extractor activity. The wrong error message was displayed when a template was imported.
Problemas conocidos
In case you use an Intel Xe GPU and Taxonomy Manager, Validation Station, or Classification Station are not displayed properly, we recommend updating the graphics driver to the latest version. For more information, visit Intel Support.
v5.0.2
Fecha de publicación: 19 de octubre de 2021
Mejoras
- The Taxonomy Manager received a complete overhaul, with an improved UI and user experience. You can now add document types without group or category, configure colors and hotkeys for fields, and more. Consult the documentation for a complete description.
- The UiPath.IntelligentOCR.Activities package has been upgraded to .NET5. While both .NET versions continue to be supported, the .NET5 projects can only work on 64-bit architectures.
- The digitization process has been improved for the entire framework throughout Document Understanding and Data Manager.
- Se han realizado mejoras para optimizar los resultados de OCR en documentos escaneados. Se obtienen los mejores resultados manteniendo el ángulo de inclinación entre +/- 20 grados.
- Se han mejorado las dimensiones de procesamiento de imágenes para obtener mejores resultados. Para que una imagen se digitalice / procese con éxito, sus dimensiones de ancho y alto deben estar entre 50 y 10 000 píxeles. Cualquier imagen por debajo o por encima de este rango debe ser rechazada, con un mensaje de excepción. Una imagen validada con las dimensiones mencionadas anteriormente y con un tamaño total superior a 14 MP se reducirá a 14 MP, manteniendo la relación de aspecto (relación ancho / alto).
- The Validation Station error message system has been improved and now, if the user rejects a document, an exception of type
DocumentRejectedByUserExceptionis thrown and the process is stopped. - Improved the load time of Validation Station for document types with large taxonomies.
- For derived parts in Validation Station, numbers with more than two decimals are not rounded up anymore.
- Debido a las mejoras en los algoritmos de procesamiento de imágenes, pueden aparecer cambios en la digitalización de ciertos documentos.
- A new check box has been added to the Template Manager wizard, allowing you to choose if the added synonyms are case sensitive or not.
- A design update has been made to the Template Manager wizard accessible from the Intelligent Form Extractor and Form Extractor activities.
- If you experience timeouts due to long processing time, you can now use the newly added Timeout parameter for Form Extractor and Intelligent Form Extractor to increase the service call timeout.
- If a field is checked in both Signature and Handwritten boxes in the Template Manager wizard of the Intelligent Form Extractor activity, then a popup message appears informing you that a field can be added only in one box, not both.
- The wizard available for the Intelligent Keyword Classifier activity received an update, meaning that clicking the OK button of the vector(s) exported message now returns the user to the wizard instead of closing the wizard.
- The Create Document Validation Action and Present Validation Station activities, received a new parameter, ShowOnlyRelevantPageRange. This allows you to configure the activity so that it only shows the page range captured in the classification part of the extraction result.
- Performance and memory improvements in the Digitize Document activity.
- La referencia CefSharp se actualizó a la versión 92.0.260.
Corrección de errores
- Se ha corregido un error que se producía cuando el OCR se ejecutaba en diferentes formatos de región del sistema operativo. Ahora, el OCR se ejecuta según lo esperado y todos los resultados se generan correctamente, independientemente del formato de región del sistema operativo.
- Fixed a bug in the Export Extraction Results activity that was deleting the extracted table when a field was marked as handwritten. Now, the entire extraction result is exported as expected.
- Fixed an issue related to Validation Station that was causing unexpected number formatting when reading the derived parts value.
- Fixed a bug in the Wait For Validation Action activity that was returning an error when the Automatic Extraction Result parameter was set as empty. Now, the activity runs as expected, without any errors.
- Fixed an issue that threw a runtime error when no extraction results were served to the Present Validation Station activity.
- Fixed an issue in Digitize Document activity, that caused the activity to crash when the ForceApplyOCR parameter was set to False.
- Fixed an issue in the Template Manager wizard that caused data not to be extracted when using the table selection with Form Extractor.
- Se ha corregido un problema que provocaba que no se extrajeran partes derivadas para un campo de fecha al procesar un documento específico.
- Fixed an issue in the Template Manager wizard that caused anchors not to be highlighted after marking a table.
- Fixed an issue that was causing the Data Extraction Scope activity to throw an error when stating that the fields from the extractors configuration could not be found in the taxonomy, although the extractors were removed from the scope.
- Fixed an issue that caused the Template Manager wizard to throw an error when trying to save a template with certain words added as page evidence.
- Fixed an issue which prevented the display of an empty Validation Station with full manual processing for data entry when the AutomaticExtractionResults parameter was null.
- Fixed a bug that was occurring when special characters were included in the file or bucket name for any of the following activities: Create Document Classification Action, Wait for Document Classification Action, Create Document Validation Action, Wait for Document Validation Action. Now, all special characters from the file/bucket names are encoded as expected.
- Se ha solucionado un problema que provocaba que no se extrajesen los campos de la firma y los escritos a mano debido al contraste de fondo. Ahora todos los campos se extraen correctamente, sin importar el color de fondo.
- Se ha corregido un error que provocaba que el motor OCR devolviera un error en ciertos sistemas con espacios abiertos.
- Fixed a bug that was merging the extracted content when using the Digitize Document activity with the UiPath Document OCR engine. Now, each item is extracted separately.
Problemas conocidos
- If you want to use any OCR activity from this package in Studio v2019.10, please install the UiPath.CoreIPC package, version 2.0.1 or higher.
- If you install the UiPath.IntelligentOCR.Activities package, v5.0.0 on a machine using Windows N/KN as an operating system, then the Media Features package is also required. Visit Media Feature Pack list for Windows N editions for installation instructions for the Media Features package.
v4.13.2
Fecha de publicación: 28 de mayo de 2021
Mejoras
Improved the load time of Validation Station for document types with large taxonomies.
v4.13.1
Fecha de publicación: 16 de abril de 2021
Mejoras
If you experience timeouts due to long processing time, you can now use the newly added Timeout parameter for Form Extractor and Intelligent Form Extractor to increase the service call timeout.
v4.13.0
Fecha de publicación: 29 de marzo de 2021
Nuevas características y mejoras
- Extended the Form Extractor and Intelligent Form Extractor capabilities by adding field-level anchor-based extraction rules. Besides page-level anchors, field-level anchors can now be defined in Template Editor - a new option of defining the bounds of a custom area from which data is to be extracted. As opposed to page-level configurations, which define data positions with respect to the entire page content, anchor-based configurations now allow for targeting data extraction based on field-level configurations, thus allowing for more flexibility.
- Performance improvements on Validation Station.
- Updated Validation Station and Classification Station design system for a better user experience.
- The Validation Station, Classification Station, and Template Manager now have a three-state button, in the Document View side, that allow users to choose between different document interaction modes: Tokens (word selections), Custom area (area selection), and Choice on selection (users can choose between Tokens and Custom Area at each selection).
- The user interfaces, Validation Station, Classification Station, and Template Manager, have been improved with a new selection mode in text view, now allowing users to perform selections from the text version of a document in the same way they interact with the original version. A new hotkey, d+s, was also added, to assist in switching between the original document view and the text view modes.
- The Validation Station now displays a "crop" from the original document, when you assign a value to a data field, under the reported text value selected. This helps with locating and verifying a specific field value against the value area in the document.
- Changed confidence calculation for Intelligent Keyword Classifier to be scalable with the length of the word vectors.
- Added the IncludeOCRConfidence checkbox to the properties panel of the Export Extraction Results activity. If selected, the exported information will contain OCR Confidence for each value as well.
- Algoritmos mejorados de procesamiento de letras y palabras para evitar informar de caracteres o palabras duplicados en ciertas situaciones.
- Classify Document Scope and Train Classifiers Scope now support classifier capabilities.
- Classify Document Scope has been optimized to perform sequential calls to the classifiers in its scope, with only the page ranges that are not already classified by a previous extractor.
Corrección de errores
- Fixed an issue that threw a runtime error in specific cases when a Form Extractor activity and an Intelligent Form Extractor activity were in the same Data Extraction Scope.
- Se ha solucionado un problema que impedía que se produjeran errores del clasificador en casos específicos, pero la clasificación fallaba silenciosamente.
- Se ha solucionado un problema que provocaba que no se extrajesen las partes derivadas de un campo numérico al procesar un documento específico.
- Fixed an issue in Digitize Document, that caused the activity to process document pages even after an exception was reported, thus increasing the overall execution time for cases of failure.
- Fixed a bug that did not allow for the correct configuration of Regex expressions in Regex Based Extractor, in C# projects, and other very specific situations.
- Fixed a performance issue that appeared in Validation Station and Template Editor, when a document type contained more than 200 fields.
- Se ha corregido un error por el que, en determinadas situaciones, los números se fusionaban en un solo valor numérico informado.
- Fixed an issue through which, in certain situations, the Wait for Document Validation Action and Resume activity would throw an exception when communicating with storage buckets.
Problemas conocidos
The Create Document Classification Action,Create Document Validation Action and Wait for Document Classification and Resume ,Wait for Document Validation and Resume activities do not work with storage buckets on which the Access Data Through Orchestrator has been enabled.
versión 4.10.5
Fecha de publicación: 28 de mayo de 2021
Mejoras
Improved the load time of Validation Station for document types with large taxonomies.
v4.10.4
Fecha de publicación: 3 de febrero de 2021
Mejoras
Performance improvement of Validation Station.
v4.10.3
Fecha de lanzamiento: 11 de enero de 2021
Mejoras
Improved file upload from Create Document Validation Action and Create Document Classification Action on AWS hosted storage bucket.
v4.10.2
Fecha de publicación: 12 de noviembre de 2020
Nuevas características y mejoras
- Referencia de CefSharp actualizada a la versión 84.4.10.
- Puntos finales actualizados de la siguiente manera:
- Form Extractor - from
https://formextractor.uipath.comtohttps://du.uipath.com/svc/formextractor - Intelligent Form Extractor - from
https://intelligentforms.uipath.comtohttps://du.uipath.com/svc/intelligentforms - Intelligent Keyword Classifier - from
https://intelligentkeywords.uipath.comtohttps://du.uipath.com/svc/intelligentkeywords
- Form Extractor - from
- Made improvements to Validation Station while in mark table mode.
Corrección de errores
Fixed an issue for Classification Document Classification Action related to the expiration of the Bearer Token.
v4.10.1
Fecha de publicación: 20 de octubre de 2020
Mejoras
More detailed error logging for Form Extractor, Intelligent Form Extractor and Intelligent Keyword Classifier.
Corrección de errores
- Análisis de direcciones mejorado.
- Fixed an issue where not all ML Skills were usable by the Form Extractor, Intelligent Form Extractor, and Intelligent Keyword Classifier activities.
v4.10.0
Fecha de lanzamiento: 5 de octubre de 2020
Nuevas características y mejoras
Nuevas actividades
Las siguientes actividades se han incluido en el paquete:
- Present Classification Station - designed for classifying and separating files based on the document type.
- Create Document Classification Action & Wait for Document Classification and Resume - designed for integration with Orchestrator.
- Intelligent Keyword Classifier & Intelligent Keyword Classifier Trainer - designed for classifying, splitting, and training document packages into individual document types.
Estación de validación
To easily identify the information in the Validation Station, color codes were added to field cards and tokens or custom areas. Each field card has by default a color code, while tokens or custom areas get the same color code as the field card they are assigned to.
New shortcuts have been added to Validation Station allowing the user to move a selected line from a table up, down, left, or right. Also, when selections are made in Validation Station, these can be assigned to a specific field using field-level shortcuts. Each field card has a key associated with it. When no selections are made, you can use field-level shortcuts to jump from one field card to another.
For Validation Station table fields, a row-level checkmark was added. You can now check all the fields from a row by selecting the checkmark or it will be automatically checked when you visit all the fields.
Tokens in Validation Station have been updated. Thus, the highlighted tokens have a red bottom border and the selected tokens have a dashed border.
Field values with no reference are now supported in Validation Station. Users can assign values to fields that do not have a reference in the document. To do so, while the user creates a field in Taxonomy Manager, the Requires Reference checkbox needs to be unchecked.
Estación de clasificación
New shortcuts were created for Classification Station allowing the user to navigate through document types; add, change, remove or highlight reference; move all pages up or down; split after selected page; discard changes; save; report as exception.
Además de usar el menú de tipo de documento, ahora también se puede eliminar una referencia a nivel de página al pasar el cursor sobre una página y hacer clic en el icono azul en la esquina inferior derecha. El icono también permite resaltar la referencia.
Visor de PDF en la estación de clasificación y la estación de validación
The Rotate button was added to the PDF Viewer. By clicking the button, the current document page will rotate clockwise.
El modo de selección está habilitado por defecto en el Visor de PDF.
Otras actividades
The Intelligent Form Extractor and Form Extractor activities can now incorporate imported templates that have the same name but different content as the already available ones. Each template is analyzed, and a warning message is displayed for each case.
The ActionPriority property from the Create Document Validation Action activity now supports expressions and variables.
The terms BucketFolderPath and DirectoryFolderPath were changed to BucketDirectoryPath and DownloadDirectoryPath for the Create Document Validation Action activity, respectively for the Wait for Document Validation Action and Resume activity. The reason behind this is to clearly separate from the Orchestrator concept of “Folder”.
v4.5.2
Fecha de publicación: 24 de agosto de 2020
Corrección de errores
- Se ha solucionado un problema que, en algunos casos, devolvía un mensaje de error
407ProxyAuthenticationRequiredpara las solicitudes de autenticación de Kerberos o NTLM. Esto se aplica al Extractor de formularios, el Extractor inteligente de formularios y el Clasificador inteligente de palabras clave. - Fixed an issue that was causing the Intelligent Form Extractor to not properly display a timeout error.
- Missing translations were added for certain Validation Station strings.
- Fixed an issue that was causing the Data Extraction Scope to throw an error when unselecting a table field.
v4.5.1
Fecha de lanzamiento: 24 de junio de 2020
Corrección de errores
- Fixed an issue that was causing synchronization problems between the configuration window and the Properties panel for the Wait for Document Validation Action and Resume activity.
- Se ha solucionado un problema por el que, en algunas situaciones, los campos de la tabla se guardaban por error como multivalores en la taxonomía.
v1.3.2
Fecha de publicación: 2 de junio de 2020
Mejoras
The UiPath.IntelligentOCR.Activities package was updated to reference the latest Uipath Vision library.
v4.5.0
Fecha de Lanzamiento: 4 de mayo de 2020
Nuevas características y mejoras
- This release brings many new exciting activities such as Create Document Validation Action, and Wait for Document Validation Action and Resume that can be used to create, suspend, and resume orchestration workflows in the UiPath Action Center.
- Two new extractors are here to be of your help. You can find them under the name of Form Extractor and Intelligent Form Extractor. Both activities can extract information from fixed form documents based on predefined templates, the difference being that the Intelligent Form Extractor can also be configured to interpret fields that are signed or handwritten. You can extract information from any type of field, including tables and create custom table extraction rules by using the Template Manager wizard.
- While using the Intelligent Form Extractor activity, if the number of handwritten fields might have been exceeded, then a warning is displayed directly in the workflow. This does not stop the user from running the workflow.
- The Regex Based Extractor activity received a new option named
UseVisualAlignmentthat can be used for complex layouts where it is easier for users to write regular expressions based on how words are visually organized on lines, ignoring any sentence, paragraph, or layout group otherwise identified in the document. - Puede definir una expresión regular para identificar el área de la tabla, una expresión regular para identificar una fila de la tabla en esa área y expresiones regulares para identificar columnas específicas en las filas de la tabla.
- Presentar estación de validación y su asistente incluyen muchas funciones nuevas y mejoradas.
- The Validation Station wizard now has a new button named Discard changes. You can use it for confirming or dismissing any changes done in Validation Station. The function can be used on each document type individually.
- The wizard also has a new option named Show Suggestions that allows you to select one value from multiple candidates if the used extractors report multiple possible values.
- La lista de accesos directos disponibles en la Estación de validación se ha mejorado con uno nuevo,
f+a, que le permite añadir un nuevo valor en un campo de varios valores. - Improvements have been made on the Digitize Document activity that can now better identify the check boxes in a document.
- The Digitize Document activity also has a new option named ForceApplyOCR. When selected, it applies the OCR engine to all the pages of the document, including native PDF.
- The Data Extraction Scope activity can now automatically read Extractor capabilities (internal taxonomies) if the Extractor declares them. This simplifies the configuration step by exposing the extractor's known fields. The Machine Learning Extractor now supports this new functionality, making it very easy to use and configure.
- The Export Extraction Results activity received a new option named IncludeConfidence. If selected, the confidence level is provided.
- Los asistentes de extracción y configuración ahora admiten la selección de campos en masa para tipos de documentos y campos de tablas.
v4.0.1
Fecha de lanzamiento: 14 de enero de 2020
Corrección de errores
- Fixed an issue that was causing the Validation Station wizard to display incorrectly the table preferences, when using the Extract new table option.
- Fixed an issue that was returning an error when Validation Station wizard was run with Callout activity chained before or after it. Now, the activity runs as expected.
- Fixed an issue that was causing the Data Extraction Scope activity to throw an error when it was run with a customized machine culture and the FormatValuesIfPossible option selected. Now, the activity runs as expected.
- Fixed an issue that was causing some performance issues when large amounts of text were selected in the Text View option of the Validation Station wizard. Now, the Text View option displays the text as expected.
- Fixed an issue that was causing the Data Extraction Scope activity to throw an error when it was run with an extractor without an internal taxonomy set and a new field was added in the project’s taxonomy. Now, the activity runs as expected.
- En ciertas máquinas, los documentos girados no se mostraban correctamente al usar la Estación de validación.
v4.0.0
Fecha de lanzamiento: 6 de diciembre de 2019
Cambios de última hora
- Se produjeron actualizaciones importantes para el paquete UiPath.IntelligentOCR.Activities. Todas las actividades utilizadas para trabajar con las familias de productos FineReader y FlexiCapture Abbyy se han trasladado a un paquete independiente denominado UiPath.Abbyy.Activities. Esto ha llevado a un cambio disruptivo para el paquete UiPath.IntelligentOCR.Activities, que provocó que la versión se saltara desde v3.1.0 a v4.0.0. La siguiente lista muestra las actividades que se movieron desde el paquete UiPath.IntelligentOCR.Activities al UiPath.Abbyy.Activities:
Problemas conocidos
- The UiPath.Abbyy.Activities package cannot be used with versions lower than v19.11 for the UiPath.UIAutomation.Activities package and lower than v4.0.0 for the UiPath.IntelligentOCR.Activities package.
- If after updating a workflow to the new UiPath.IntelligentOCR.Activities v4.0.0 and UiPath.Abbyy.Activities v1.0.0 you encounter runtime validation errors, please force a new save on the
.xamlfile by making a small change and then reverting it. This might occur for workflows using FlexiCapture activities. - Workflows created or upgraded to UiPath.IntelligentOCR.Activities v4.0.0 cannot be downgraded to a lower UiPath.IntelligentOCR.Activities version.
Corrección de errores
An exception was thrown when the Digitize Document activity was used together with the OmniPage OCR for documents with special characters included in the Extended engine pack. The issue was fixed and now the activity is executed as expected.
v2.0.2
Fecha de lanzamiento: 25 de noviembre de 2019
Mejoras
Performance improvements took place for processing files within the document processing framework, for the UiPath.IntelligentOCR.Activities package.
v1.3.1
Fecha de lanzamiento: 25 de noviembre de 2019
Mejoras
Performance improvements took place for processing files within the document processing framework, for the UiPath.IntelligentOCR.Activities package.
v3.1.0
Fecha de lanzamiento: 8 de noviembre de 2019
Nuevas características y mejoras
- A new activity meant to help you better organize and manage your trainable classifiers is available: Keyword Based Classifier Trainer. This activity can be used only together with the Train Classifiers Scope activity.
- The Validation Station wizard received an important upgrade and is now available for you to explore its maximum potential. This wizard becomes available only when the Present Validation Station activity is used in a workflow. You can use the upgraded version for benefiting from a new user-friendly interface, navigating through the document while using the keyboard shortcuts, or selecting one or multiple words or a custom area. You can easily mark a field as missing, extract new data, edit a table, or extract a new table. All these marvelous things can be done with the Validation Station wizard while using a dark theme.
- One of the improvements included in this release is that the Keyword Based Classifier activity received a new parameter named LearningData. Besides specifying where the learning file data are located, you can now also use the string containing the serialized classifier data. This activity was enhanced with a wizard named Manage Keyword Based Classifier Learning that can be used for configuring and managing the keywords used for identifying specific document types.
- Both the Keyword Based Classifier and Keyword Based Classifier Trainer activities are now able to manage multiple keywords. After the keyword sets are selected, the extraction is based on a full match of the selected words.
- Another great improvement is that the
DocumentObjectModeloutput, included in the Digitize Document activity, can now support word polygons, besides word horizontal boxes. - The Taxonomy Manager wizard received a new scrolling bar that incorporates all UI elements and it provides a better user experience.
- Data Extraction Scope, Train Extractors Scope, Train Classifier Scope, and Classify Document Scope activities are now arranging their extractors and classifiers in horizontal order, replacing the previous vertical order.
- The Regex Based Extractor activity has been improved and can now process and return multi-values. The output is visible only when the activity is used together with the Validation Station.
- Cuatro nuevos idiomas, turco (TR), portugués (PT), español (ES) y Spanish-México (ES-MX) están disponibles para el paquete UiPath.IntelligentOCR.Activities.
Problemas conocidos
Solo se puede acceder al Gestor de taxonomía si has abierto previamente un archivo .xaml . Si no hay archivos abiertos al acceder al Gestor de taxonomía, se mostrará una ventana de grabación y el Gestor de taxonomía solo se mostrará después de cerrar la ventana de grabación.
Corrección de errores
- An exception was thrown when using the Data Extraction Scope activity together with a Try Catch activity. The issue was fixed and now the activity is executed as expected.
- When a Boolean field was set to No in Validation Station, the output file should have shown the result as No but instead is showing it as missing. The issue was fixed and now the output file shows the correct result.
- Fixed incorrect number parsing that occurred when the Data Extraction Scope was trying to parse numbers in documents using a different number format than the document's culture.
- When using multiple Validation Stations, the order of the derived parts was not respected in the validated results. The issue was fixed and now the results are displaying the derived parts in the same order they were introduced.
- Differences between the boxes with custom selection occurred when the results of a Validation Station were run through a second Validation Station. The issue was fixed and now there are no differences between boxes with custom selection.
- When the Digitize Document activity was used together with Microsoft Azure Computer Vision OCR engine, the rotation was not working when HandwritingRecognition parameter was set as True. The issue was fixed and now the information is processed correctly.
- When using Digitize Document activity, an error occurred when trying to process images with a lot of text. The bug was fixed by improving the scaling process.
- Fixed an issue that was throwing when trying to train the Keyword Based Classifier activity in the training scope and the extraction was run without a classification reference. The issue was fixed and now the fact that there is no learning information is only logged, not thrown as an error.
- An error was thrown when using the FlexiCapture Extractor activity and the same name was given to both a table column and a field. The issue was fixed and the
.fcdotfile is now processed as expected.
- v7.1.0 - preview
- Novedades
- Mejoras
- v7.0.0: vista previa
- Cambios de última hora
- Novedades
- v6.27.3
- Mejoras
- v6.27.2
- Mejoras
- Corrección de errores
- v6.27.0
- Novedades
- Corrección de errores
- Problemas conocidos
- v6.26.0
- Novedades
- Mejoras
- Corrección de errores
- v6.24.0
- Habilitar los controles de derecha a izquierda en la Estación de validación
- Validación mejorada con Estación de validación compacta
- Validate documents in Action Center using UiPath® apps
- Usar etiquetas y versiones para proyectos modernos de Document Understanding
- Capacidades de extracción mejoradas utilizando nuevos extractores generativos
- Mejoras
- Corrección de errores
- v6.22.1
- Mejoras
- Corrección de errores
- v.6.9.8
- v6.14.3
- Corrección de errores
- v6.19.7
- Corrección de errores
- v6.22.0
- Novedades
- Soporte para actividades de una configuración local
- Soporte de IntelligentOCR para proyectos modernos
- OCR de idiomas ampliados
- Corrección de errores
- Próximas obsolescencias
- v6.19.6
- v6.19.5
- Corrección de errores
- v6.0.2
- v6.5.4
- v6.19.3
- v6.14.2
- v6.19.2
- Corrección de errores
- v6.19.1
- Corrección de errores
- v6.19.0
- Novedades
- Mejoras
- Corrección de errores
- Problemas conocidos
- v6.14.1
- Nuevas funciones y mejoras
- v6.9.5
- v6.9.4
- v6.9.3
- v6.9.2
- v6.5.3
- v6.5.2
- v6.9.1
- Corrección de errores
- v6.9.0
- Nuevas funciones y mejoras
- Corrección de errores
- Cronología de la obsolescencia
- v6.5.1
- Nuevas funciones y mejoras
- v6.6.0
- Nuevas funciones y mejoras
- Corrección de errores
- v6.5.0
- Nuevas funciones y mejoras
- Corrección de errores
- 8 de diciembre de 2022
- v6.0.1
- Nuevas funciones y mejoras
- Corrección de errores
- Problemas conocidos
- v5.0.2
- Mejoras
- Corrección de errores
- Problemas conocidos
- v4.13.2
- Mejoras
- v4.13.1
- Mejoras
- v4.13.0
- Nuevas características y mejoras
- Corrección de errores
- Problemas conocidos
- versión 4.10.5
- Mejoras
- v4.10.4
- Mejoras
- v4.10.3
- Mejoras
- v4.10.2
- Nuevas características y mejoras
- Corrección de errores
- v4.10.1
- Mejoras
- Corrección de errores
- v4.10.0
- Nuevas características y mejoras
- v4.5.2
- Corrección de errores
- v4.5.1
- Corrección de errores
- v1.3.2
- Mejoras
- v4.5.0
- Nuevas características y mejoras
- v4.0.1
- Corrección de errores
- v4.0.0
- Cambios de última hora
- Problemas conocidos
- Corrección de errores
- v2.0.2
- Mejoras
- v1.3.1
- Mejoras
- v3.1.0
- Nuevas características y mejoras
- Problemas conocidos
- Corrección de errores