UiPath Documentation
activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.
UiPath logo, featuring letters U and I in white

Actividades de Document Understanding

Última actualización 27 de abr. de 2026

Notas relacionadas

v7.1.0 - preview

Fecha de lanzamiento: 1 de abril de 2026

Novedades

Nuevos tipos de campo: grupo de campos y cantidad monetaria

Ahora hay dos nuevos tipos de campo disponibles al definir la taxonomía en las automatizaciones de OCR inteligente: Grupo de campos y Cantidad monetaria.

Grupo de campos te permite estructurar campos de extracción relacionados juntos, reemplazando la salida anterior basada en tabla. Cantidad monetaria es un tipo de campo dedicado para valores de moneda, que reemplaza el manejo numérico genérico. Las tareas de validación de documentos muestran automáticamente los resultados del grupo de campos en consecuencia.

Mejoras

Advertencia de compatibilidad en tiempo de diseño

Studio ahora muestra una advertencia en tiempo de diseño cuando se utiliza la vista previa de Intelligent OCR 7.0.0 o posterior con un paquete de UiPath Vision anterior a la versión 4.0.0-preview. La advertencia te alerta de la falta de coincidencia de la versión antes de la ejecución del tiempo de ejecución.

Registro mejorado para actividades DU/Intelligent OCR

Ahora se registra contexto adicional para las actividades de Document Understanding e Intelligent OCR, lo que mejora la visibilidad de la resolución de problemas en los registros de Robot.

v7.0.0: vista previa

Fecha de lanzamiento: 25 de febrero de 2026

Cambios de última hora

  • Se ha eliminado la compatibilidad con proyectos de Windows: heredado. A partir de esta versión, el paquete solo es compatible con proyectos de Windows.
  • Al actualizar, si utilizas proyectos Extracción y Procesamiento Inteligentes (IXP), asegúrate de revisar la configuración de tus extractores de proyectos de Document Understanding. Ejecuta GetCapabilities de nuevo y verifica que la configuración en la pantalla Ámbito de extracción de datos → Configurar extractores sigue siendo válida.

Novedades

Para proporcionar capacidades de extracción adaptadas a un diseño de documento no latino específico, ahora puedes utilizar un tipo de proyecto moderno dedicado llamado Idiomas no latinos predefinidos en la actividad Extractor de proyectos de Document Understanding . Este tipo de proyecto ofrece los siguientes extractores:

  • Facturas Japón : recomendado para documentos de factura japoneses. El extractor puede manejar diseños de factura japoneses comunes y puede identificar y extraer campos clave de la factura, como la información del proveedor, el número de factura y la moneda.
  • Facturas China : recomendado para documentos de factura chinos. El extractor puede manejar diseños de factura chinos comunes y puede identificar y extraer campos clave de la factura, como la información del proveedor, el número de factura y la moneda.
  • Recibos de Japón : recomendado para documentos de recibo en japonés. Puedes utilizar el extractor para identificar y extraer campos como el nombre del comerciante, la fecha de la transacción, el importe total, los impuestos y la moneda de los recibos en japonés.

v6.27.3

Fecha de lanzamiento: 16 de marzo de 2026

Mejoras

Se ha mejorado el flujo de actualización de tokens para reducir las solicitudes fallidas causadas por tokens de acceso caducados. La actividad ahora utiliza un token de acceso en caché cuando está disponible. Se ha optimizado el flujo de actualización de tokens, lo que reduce significativamente el número de llamadas de autenticación y mejora el rendimiento y la fiabilidad generales.

v6.27.2

Fecha de lanzamiento: 16 de diciembre de 2025

Mejoras

Las salidas de documentos divididos ahora utilizan nombres de archivo claros y trazables derivados del nombre del documento original y el rango de páginas.

Corrección de errores

Se ha corregido un problema por el que la actividad Redactar documento generaba una sección horizontal en orientación vertical.

v6.27.0

Fecha de lanzamiento: 28 de octubre de 2025

Novedades

Argumento de salida de IdDeDocumentoDeReferencia

El argumento de salida ReferenceDocumentId ahora está disponible en las actividades Clasificador de proyectos de Document Understanding y Extractor de proyectos de Document Understanding. Este es el ID de documento dentro de los servicios de Document Understanding.

Corrección de errores

Se ha corregido un problema en el Entrenador del extractor de proyectos de DU para mejorar la autenticación entre tenants.

Problemas conocidos

Fe de erratas: añadida el 11 de noviembre de 2025: esto se marcó erróneamente como un problema conocido. Con la configuración correcta, no se producen errores de tiempo de diseño y tiempo de ejecución.

Al utilizar actividades con un Orchestrator independiente en el que no existe una estructura de tenant, pueden producirse errores de tiempo de diseño y tiempo de ejecución.

v6.26.0

Fecha de lanzamiento: 25 de agosto de 2025

Novedades

Reordenar páginas dentro de un documento durante la clasificación

Para una mayor flexibilidad, ahora puedes reordenar las páginas dentro de un documento, al clasificarlas en la Estación de clasificación. Para habilitar esta capacidad, utiliza la propiedad EnablePageReorder , disponible en las actividades Presentar estación de clasificación y Crear acción de clasificación de documentos .

Reentrenar modelos al utilizar proyectos modernos de Document Understanding

Ahora puedes mejorar las capacidades de extracción de tus modelos, reentrenándolos en los documentos específicos que validas a través de la Estación de validación. Puedes utilizar la actividad Entrenador del extractor de proyectos de Document Understanding para volver a entrenar los modelos cuando se trabaja con proyectos modernos de Document Understanding.

Redactar documentos

La nueva actividad Redactar documento te permite introducir un documento y un resultado de extracción, generando un nuevo archivo sin ningún detalle de origen. El documento de salida es la copia redactada de la entrada, y toda la información proporcionada como entrada se redacta en consecuencia. Cualquier información dentro del resultado de la extracción se redacta utilizando un estilo de tu elección.

Modo compacto de la estación de validación

La estación de validación ahora se puede utilizar con una nueva cara: el modo de visualización compacto. Esto proporciona más espacio para los campos, un resaltado más fácil para los campos que requieren atención, una sección centralizada de comprobaciones empresariales y una serie de otras características centradas en el validador. Para habilitar el modo compacto, actualiza el paquete IntelligentOCR.Activities a la versión 6.25.0-preview o posterior, luego ve a la actividad Crear acción de validación de documentos o presentar estación de validación y establece el argumento de entrada DisplayMode en Compacto.

Cambios de validación para los campos de la tabla en la estación de validación

Hemos actualizado el proceso de validación de tablas tanto en la estación de validación clásica como en la compacta, diseñado para mejorar la experiencia del usuario y el rendimiento general. Hemos traído las siguientes actualizaciones:

  1. Ahora puedes guardar parcialmente una tabla siempre que no haya celdas no válidas. Puedes guardar parcialmente el campo de la tabla utilizando la opción Listo .
  2. <number> <number> Utiliza las opciones Hay <número> celdas no válidas y Hay <número> celdas no confirmadas para navegar a celdas no válidas o no confirmadas.
  3. Cada celda dentro de la tabla ahora muestra una casilla de verificación de confirmación.
  4. Confirma toda la tabla seleccionando Confirmar todas las celdas.
  5. Puedes enviar una acción sin visitar y confirmar manualmente todas las tablas. La opción Enviar mostrará el número de campos y tablas, que se confirmarán automáticamente antes de enviarlos.

También hemos implementado varias mejoras y resuelto problemas para mejorar tu experiencia de usuario:

  • Se ha mejorado el rendimiento general y la navegación de la validación de tablas.
  • Se ha optimizado la visualización de las reglas empresariales no válidas.
  • Se han corregido problemas relacionados con la falta de celdas de tabla que no se renderizaban y la visualización incorrecta de tablas de solo lectura.

La siguiente imagen muestra la interfaz de usuario de la estación de validación compacta para el proceso actualizado.

Figura 1. Proceso de validación actualizado para la estación de validación compacta

Proceso de validación actualizado para la estación de validación compacta

La siguiente imagen muestra la interfaz de usuario de la estación de validación clásica para el proceso actualizado.

Figura 2. Proceso de validación actualizado para la estación de validación clásica

Proceso de validación actualizado para la estación de validación clásica

Para obtener más información sobre el proceso de validación actualizado, consulta Estación de validación clásica y Estación de validación compacta.

Mejoras

  • Las actividades Presentar estación de validación , Crear acción de validación de documentos y Crear artefactos de validación de documentos ahora tienen la propiedad ShowOnlyRelevantPageRane establecida de forma predeterminada en True.
  • Cuando obtienes el ClassificationResult de las actividades Clasificar ámbito de documento o Mostrar estación de clasificación , puedes acceder al intervalo de páginas de los documentos secundarios clasificados utilizando la propiedad Item.DocumentBounds.PageRange en la variable ClassificationResult .
  • La actividad Clasificador inteligente de palabras clave ahora puede clasificar páginas con menos palabras.
  • La actividad Recuperar artefactos de validación de documentos ahora tiene el resultado extraído validado en el diseñador principal para facilitar el acceso.
  • Los datos ahora también se recopilan para el reentrenamiento y están disponibles en la sección Excepciones para la revisión de un proyecto moderno.

Corrección de errores

  • La salida de la actividad Leer texto en PDF extraía por error un documento escrito en español como caracteres del alfabeto griego.
  • Al entrenar el Clasificador inteligente de palabras clave en ciertas condiciones, el clasificador no se entrenaba correctamente y causaba una degradación del rendimiento.
  • Se ha corregido un problema por el que el valor numérico de ciertos documentos se analizaba incorrectamente.
  • Se ha corregido un problema por el que las actividades Crear acción y Crear artefactos fallaban inesperadamente.

v6.24.0

Fecha de lanzamiento: 16 de abril de 2025

Habilitar los controles de derecha a izquierda en la Estación de validación

Utiliza la propiedad EnableRTL para mostrar los controles de la Estación de validación de derecha a izquierda. Para interactuar con la Estación de validación en formato de texto de derecha a izquierda, establece EnableRTL en True. Esta propiedad se aplica a las siguientes actividades:

Validación mejorada con Estación de validación compacta

La propiedad DisplayMode te permite elegir tu interfaz preferida al trabajar con la estación de validación:

  • Clásica: esta es la interfaz estándar. Esta es la interfaz que siempre se utilizó hasta esta versión.
  • Compacto: esta interfaz mejorada ofrece una mejor experiencia de usuario con mejoras, como:
    • Se ha mejorado el proceso de entrada manual en la Estación de validación para facilitar su uso.
    • Los tokens para los valores resaltados dentro del documento ahora aparecen dentro de una línea roja para una mejor visibilidad.
    • Posibilidad de añadir valores para los campos, incluso cuando la configuración de taxonomía Requiere referencia está deshabilitada.

Nueva configuración de visualización para los tipos de documentos en el Gestor de taxonomía, que incluye:

  • Umbral de confianza de OCR: define un umbral de confianza mínimo para OCR que la estación de validación considera en comparación con los umbrales de confianza generados durante la validación.
  • Formato de visualización de fecha: establece un formato de fecha preferido.
  • Separador decimal numérico: determina un separador decimal para los campos numéricos dentro del tipo de documento.
  • Separador de miles de números: determina un separador de miles para los campos numéricos dentro del tipo de documento.
    Nota:

    Además del umbral de confianza de OCR personalizable para el tipo de documento, puedes establecer un umbral de confianza de extracción para cada campo de tu taxonomía. Encuentra esta configuración en la pestaña Detalles en Configuración de validación en el Gestor de taxonomía.

    Para obtener más información sobre las actualizaciones introducidas en el Gestor de taxonomía, consulta Cargar taxonomía.

Puedes cambiar entre las interfaces de la estación de validación en las siguientes actividades:

Validar documentos en Action Center utilizando aplicaciones de UiPath®

Ahora puede aumentar la eficiencia de sus flujos de trabajo de procesamiento de documentos con las aplicaciones de UiPath®. Además de crear tareas de validación de documentos directamente en Action Center, ahora puedes crear una aplicación de acción que muestre el documento y la estación de validación. Una vez configurada, la estación de validación y el documento de destino se muestran dentro de Action Center, esperando la intervención del usuario. Para obtener más información sobre la validación de documentos utilizando aplicaciones de acción, consulta el tutorial Validar documentos con acciones de aplicación .

Usar etiquetas y versiones para proyectos modernos de Document Understanding

Para adaptar los flujos de trabajo de Document Understanding a tus necesidades, ahora puedes utilizar versiones específicas de tus proyectos durante la clasificación y la extracción. La propiedad Etiqueta proporciona un control granular para probar tus flujos de trabajo de Document Understanding antes de implementarlos en producción. Para obtener más información, consulta Clasificador de proyectos de Document Understanding y Extractor de proyectos de Document Understanding.

Capacidades de extracción mejoradas utilizando nuevos extractores generativos

Para mejorar las capacidades de extracción generativa tanto para documentos cortos como largos que tienen diseños complejos, ahora puedes seleccionar los siguientes extractores generativos al configurar extractores para tus campos de documento:

  • Diseño simple de documentos largos : este es el extractor generativo existente.
  • Diseño complejo de documentos largos (vista previa): optimizado para documentos de formato largo que incluyen imágenes, escritura a mano, elementos de formulario u otros diseños complejos, como cuadros de aviso flotantes. Ejemplos de documentos adecuados para este extractor: pólizas de seguro u otros documentos similares de formato largo con diseños complejos.
  • Diseño complejo de documento corto (vista previa): optimizado para documentos cortos que incluyen imágenes, escritura a mano, elementos de formulario u otros diseños complejos como cuadros de aviso flotantes. Por ejemplo: documentos de identidad o formularios de admisión de atención médica con diseños complejos.

Mejoras

La parte de digitalización de tus flujos de trabajo de procesamiento de documentos ahora puede reconocer y devolver datos de documentos que contienen valores que están en un círculo, subrayados o tachados.

Corrección de errores

  • Los datos de ciertas tablas no aparecían en archivos PDF a pesar de la digitalización exitosa con la actividad Digitalizar documentos.
  • Al digitalizar archivos PDF, faltaban firmas.
  • En ocasiones, el proceso de extracción identificaba erróneamente el estado de los campos de tipo Dirección debido a problemas de análisis de direcciones.
  • La actividad Digitalizar documento devolvía texto de un documento PDF, incluso cuando el texto se ocultaba utilizando lectores de PDF.
  • Los cuadros de texto de un documento no se digitalizaban, por lo que no se mostraban en el Document Manager.
  • Cierto texto no se extraía durante el proceso de extracción del documento debido a problemas relacionados con la sangría y el procesamiento del ángulo de los documentos girados.
  • Después de migrar un proyecto a la compatibilidad de Windows, las ejecuciones fallaban con el siguiente error: "Trabajo detenido con un código de salida inesperado".

v6.22.1

Fecha de lanzamiento: 26 de noviembre de 2024

Mejoras

Se actualizó el texto de explicación en el Editor de plantillas del Extractor de Formularios para reflejar el proceso de definición de anclajes de campo.

Corrección de errores

  • Los datos de ciertas tablas no aparecían en archivos PDF a pesar de la digitalización exitosa con la actividad Digitalizar documentos.
  • Se resolvió un problema por el que el texto mostrado en el documento PDF generado era impreciso.

v.6.9.8

Fecha de lanzamiento: 22 de octubre de 2024

Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.

v6.14.3

Fecha de lanzamiento: 21 de octubre de 2024

Corrección de errores

Esta versión resuelve las secciones Desconocido en el panel de resumen del consumo de unidades de IA que fueron causadas por datos faltantes.

v6.19.7

Fecha de lanzamiento: 14 de octubre de 2024

Corrección de errores

Esta versión resuelve las secciones Desconocido en el panel de resumen del consumo de unidades de IA que fueron causadas por datos faltantes.

v6.22.0

Fecha de lanzamiento: 3 de octubre de 2024

Nota:

Esta versión del paquete es compatible con las versiones 24.10.0 o posteriores de UIAutomation.Activities.

Novedades

Soporte para actividades de una configuración local

Ahora puedes utilizar las siguientes actividades dentro del ámbito de clasificación de documentos y el ámbito de extracción de datos, incluso si el robot está conectado a un Orchestrator local:

Para la actividad Ámbito de extracción de datos, en concreto, hemos hecho posible utilizar características de validación automática de una organización o tenant diferente.

Hemos añadido las propiedades RuntimeTenantURL y RuntimeCredentialsAsset a las actividades anteriores. Con estas propiedades, ahora puedes utilizar directamente las credenciales de aplicaciones externas, almacenadas en Orchestrator, para acceder a los recursos de Document Understanding en tiempo de ejecución. Para lograr esto, asegúrate de que tu tenant seleccionado tenga Document Understanding habilitado y unidades de IA asignadas.

Además, en el asistente Obtener capacidades de las actividades Clasificador de proyectos de Document Understanding y Extractor de proyectos de Document Understanding, hemos incluido propiedades como App Id, App Secret y TenantUrl.Estas propiedades facilitan el acceso a recursos de diferentes organizaciones y tenants durante la fase de diseño.

Soporte de IntelligentOCR para proyectos modernos

IntelligentOCR.Activities ahora admite el consumo de proyectos modernos de Document Understanding, a través de un nuevo conjunto de actividades dirigidas al uso de proyectos modernos. Ahora puedes utilizar las siguientes actividades para consumir tus proyectos y versiones modernas de Document Understanding:

Importante:

Fe de erratas: 26 de mayo de 2025: para consumir proyectos modernos en Document Understanding para Automation Suite versión 2024.10 o inferior, la única versión compatible del paquete de actividades IntelligentOCR es 6.22.0.

OCR de idiomas ampliados

Mejora la capacidad de tus proyectos para procesar documentos utilizando el UiPath Extended Languages OCR, que ahora está disponible de forma generalizada (GA).

Corrección de errores

  • Se ha resuelto un problema por el que se encontraba el error "La longitud del texto es cero" cuando tanto el Clasificador basado en teclado como el Clasificador inteligente de teclado se habilitaban para el mismo tipo de documento.
  • El extractor ML devolvía valores vacíos, lo que provocaba que las tareas de validación fallaran debido a las propiedades de valor nulo.
  • Los valores de campo añadidos manualmente en la Estación de Validación dentro de Action Center no se formateaban según la taxonomía, lo que provocaba que los resultados exportados mostraran datos incorrectos.
  • Se ha resuelto el problema que le impedía marcar tablas dentro de los archivos de imagen en la estación de validación.

Próximas obsolescencias

El UiPath OCR chino, japonés, coreano quedará obsoleto a partir de enero de 2025. Recomendamos utilizar el UiPath Extended Languages OCR en su lugar. Consulta el línea de tiempo de obsolescencia para obtener más información sobre las próximas desaprobaciones y eliminaciones.

v6.19.6

Fecha de publicación: 13 de agosto de 2024

Hemos actualizado algunas dependencias internas para mejorar el rendimiento.

v6.19.5

Fecha de publicación: 31 de julio de 2024

Corrección de errores

  • Al intentar digitalizar un determinado contenido de archivo, se producía una excepción "System.InvalidOperation" junto con un mensaje de "Fullness" durante la actividad Digitalizar documento.
  • Al utilizar las actividades Clasificador generativo y Extractor generativo, introducir una solicitud que comenzaba o terminaba con espacios en blanco provocaba el error "KeyNotFoundException" con el mensaje "La clave dada no estaba presente en el diccionario".

v6.0.2

Fecha de lanzamiento: 29 de julio de 2024

Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.

v6.5.4

Fecha de lanzamiento: 29 de julio de 2024

Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.

v6.19.3

Fecha de publicación: 20 de junio de 2024

Trabajamos constantemente para mejorar su experiencia de UiPath Document Understanding. Aunque no hay cambios significativos importantes con esta versión, nos aseguramos de aportar mejoras secundarias y correcciones de accesibilidad en nuestro producto.

v6.14.2

Fecha de publicación: 5 de junio de 2024

Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.

v6.19.2

Fecha de publicación: 5 de junio de 2024

Corrección de errores

Crear acción de clasificación de documentos arrojaba un error si no se configuraba previamente una URL prefirmada.

v6.19.1

Fecha de publicación: 27 de mayo de 2024

Corrección de errores

  • Se resolvió un problema por el que se producía el error "La longitud del texto es cero" cuando tanto el Clasificador basado en teclado como el Clasificador inteligente de teclado estaban habilitados para el mismo tipo de documento.
  • El extractor ML devolvía valores vacíos, lo que provocaba que las tareas de validación fallaran debido a las propiedades de valor nulo.

v6.19.0

Fecha de lanzamiento: 29 de abril de 2024

Estas notas de la versión contienen todas las actualizaciones realizadas entre noviembre de 2023 y marzo de 2024.

Novedades

Notas del validador

Ahora puedes habilitar las notas del validador para cada campo en el Gestor de taxonomía. Cuando está habilitado, puedes establecer notas en estos campos, y se muestran al validador humano. Si las notas se establecen como editables, el validador puede editarlas y comunicar información a la automatización, a través de una nueva propiedad de objeto ExtractionResult .

Nota:

Ten en cuenta que las notas del validador estarán disponibles en Action Center con la versión 2024.10 de Automation Suite, y alrededor de la línea de tiempo 2024.10 para Action Center en Automation Cloud. Consulta las notas de la versión de Action Center para estar al día.

Validación generativa para el ámbito de extracción de datos

Puedes utilizar Validación generativa para la actividad Ámbito de extracción de datos para ajustar la confianza utilizando la comprobación cruzada de extracción generativa. Comprueba las propiedades ApplyAutoValidation y AutoValidationConfidenceThreshold en la actividad Ámbito de extracción de datos.

Mejoras

  • La instalación del paquete UiPath.IntelligentOCR.Activities instala automáticamente el paquete UiPath.DocumentUnderstanding.ML.Activities . No es necesario instalarlo por separado.

Corrección de errores

  • Se ha solucionado un problema por el que la fuente japonesa no se reconocía al convertir a JPG.
  • Se ha corregido un problema por el que el orden de los números en hebreo se invierte en la estación de validación.
  • Se ha corregido un problema relacionado con la extracción de valores de texto bidireccionales (de izquierda a derecha y de derecha a izquierda), que provocaba un orden incorrecto de los símbolos de puntuación.

Problemas conocidos

Existe un problema conocido al utilizar la plantilla de proceso de Document Understanding versión 2022.10.2 dentro de Studio 2023.4.4 en un proyecto de Windows. Al abrir el Gestor de taxonomía se produce un error que indica que debes instalar los marcos .NET que faltan. Independientemente de si eliges instalar.NET o no, sigue otro mensaje de error: "La comunicación entre UiPath Studio y el Gestor de taxonomía finalizó de forma inesperada".

Solución alternativa: instala manualmente .NET 6.0 Runtime.

v6.14.1

Fecha de publicación: 24 de octubre de 2023

Nuevas funciones y mejoras

Se añade una nueva propiedad, Porcentaje de confianza de validación de campos extraídos, para las siguientes actividades:

  • Mostrar Estación de Validación
  • Crear acción de validación de documentos

Se añade una nueva propiedad, Enviar documentos, a las siguientes actividades:

  • Extractor de forma
  • Clasificador inteligente de palabra clave

La actividad Digitalizar documento ahora puede detectar botones de radio de PDF nativos.

Se han mejorado las capacidades de detección de tipo de contenido de Digitalizar documento.

El Gestor de taxonomía ahora permite la definición de varias expresiones matemáticas en las reglas empresariales.

v6.9.5

Fecha de lanzamiento: 19 de septiembre de 2023

Hemos corregido una incidencia que desencadenaba un error You are not authorized al reanudar un trabajo una vez finalizada la validación de documentos desde Action Center.

v6.9.4

Fecha de lanzamiento: 28 de agosto de 2023

Hemos corregido un error que ralentizaba la Estación de validación cuando los documentos contenían tablas grandes.

v6.9.3

Fecha de lanzamiento: 8 de junio de 2023

Hemos corregido un error que provocaba inconsistencias en los valores formateados cuando la cantidad era negativa.

v6.9.2

Fecha de lanzamiento: 7 de junio de 2023

Hay una nueva opción disponible al utilizar la actividad Extractor de formularios, Enviar documentos para mejorar el algoritmo, que te permite habilitar o deshabilitar la opción antes de ejecutar el flujo de trabajo. El valor predeterminado es habilitado.

Hemos realizado correcciones de errores menores y correcciones de accesibilidad en todo el paquete UiPath.IntelligentOCR.Activities.

v6.5.3

Fecha de lanzamiento: 19 de septiembre de 2023

Hemos corregido una incidencia que desencadenaba un error You are not authorized al reanudar un trabajo una vez finalizada la validación de documentos desde Action Center.

v6.5.2

Fecha de lanzamiento: 7 de junio de 2023

Trabajamos constantemente para mejorar su experiencia de UiPath Document Understanding. Aunque no hay cambios significativos importantes con esta versión, nos aseguramos de aportar mejoras secundarias y correcciones de accesibilidad en nuestro producto.

v6.9.1

Fecha de lanzamiento: 2 de mayo de 2023

Corrección de errores

Hemos corregido un error que provocaba que la actividad Ámbito de extracción de datos se bloqueara cuando la extracción se completaba en todos los documentos secundarios menos en el primero. Esto sucedía cuando se usaba un clasificador para realizar la división de documentos y se devolvían varios resultados de clasificación desde Clasificar ámbito del documento.

v6.9.0

Fecha de lanzamiento: 26 de abril de 2023

Nuevas funciones y mejoras

  • UiPath Document OCR es el nuevo motor de OCR predeterminado para las siguientes actividades: Clasificador inteligente de palabras clave, Entrenador del clasificador inteligente de palabras clave y Extractor de formularios.
  • Hemos añadido una funcionalidad de reintento a las actividades Esperar la acción de validación de documentos y Esperar la acción de clasificación de documentos . Puedes utilizar la nueva opción Reintentar y establecerla como Habilitado/Deshabilitado, siendo el valor predeterminado Habilitado. Si está habilitado, las llamadas HTTP se volverán a intentar en caso de fallo.
  • El paquete UiPath.IntelligentOCR.Activities ahora se puede usar con idiomas de derecha a izquierda.
  • La precisión de la extracción de la actividad Extractor de formularios se ha mejorado al incluir la información de coincidencia de página en el algoritmo de extracción.
  • Hemos actualizado el diseño de las reglas de campo que se pueden establecer en el Gestor de taxonomía.
  • Ahora puede aplicar expresiones matemáticas en reglas de campo usando el asistente del Gestor de taxonomía de la actividad Cargar taxonomía.
  • Se ha actualizado el asistente de Estación de validación, lo que le permite ver las reglas aplicadas a los campos. Además, cuando un campo se actualiza manualmente, la regla del campo también se actualiza automáticamente.
  • La actividad Digitalizar documento se ha mejorado y ahora consume menos memoria del sistema.
  • Los widgets de sello ahora están digitalizados en PDF nativos.
  • Se ha mejorado la compatibilidad de archivos PDF para la actividad Digitalizar documento.

Fe de erratas de septiembre de 2023: las funciones avanzadas de división están disponibles para la actividad Clasificador inteligente de palabras clave.

Corrección de errores

  • Hemos actualizado las dependencias de los paquetes y corregido el error Método no encontrado que se producía cuando se añadía una actividad Invocar código al flujo de trabajo.
  • Hemos corregido un error que impedía el rellenado automático de la clave API cuando tu token de autenticación para la instancia de Orchestrator utilizada había caducado. El error se producía tanto para UiPath Document OCR como para OCR para los campos de clave API en chino, japonés y coreano .

Cronología de la obsolescencia

Te recomendamos comprobar periódicamente la fecha de caducidad para ver las actualizaciones relativas a las características que quedarán obsoletas y serán eliminadas.

v6.5.1

Fecha de lanzamiento: 27 de marzo de 2023

Nuevas funciones y mejoras

Trabajamos constantemente para mejorar el paquete UiPath.IntelligentOCR.Activities. Aunque no hay cambios significativos importantes con esta versión de parche, nos aseguramos de aportar mejoras menores y correcciones de accesibilidad en nuestro producto.

v6.6.0

Fecha de publicación: 15 de diciembre de 2022

Nuevas funciones y mejoras

  • La clave de la API de Document Understanding ahora se rellena previamente para las siguientes actividades: OCR de documentos de UiPath, OCR para chino, japonés y coreano, extractor de aprendizaje automático, clasificador de aprendizaje automático y gestión de plantillas del extractor de formularios.
  • La interfaz de usuario de Studio ya está disponible en chino tradicional.
  • Ahora puedes beneficiarte de que el campo Clave de API se rellene previamente para las siguientes actividades incluidas en el paquete UiPath.IntelligentOCR.Activities: Clasificador inteligente de palabras clave y Extractor de formularios.
  • El menú de atajos de teclado ahora incluye nuevas teclas de acceso rápido, agregadas en una sección separada de Accesibilidad. Están disponibles para las actividades Presentar estación de validación y Presentar estación de clasificación.

Corrección de errores

Fixed a bug that was preventing the auto-population of the API key when your authentication token for the used Orchestrator instance has expired. The error occurred for both UiPath Document OCR and OCR for Chinese, Japanese, Korean API key fields.

v6.5.0

Fecha de lanzamiento: 24 de octubre de 2022

Nuevas funciones y mejoras

  • New action objects are available for the Wait for Document Classification Action and Resume and Wait for Document Validation Action and Resume activities.
  • The Digitize Document activity has been upgraded and now comes with a default preselected OCR engine, the UiPath Document OCR engine. As a consequence to this change, the UiPath.OCR.Activities package has become a dependency of the UiPath.IntelligentOCR.Activities package.
  • La actividad Digitalizar documento recibió un nuevo parámetro, Detect Checkboxes, que habilita la detección de casillas de verificación mientras se digitaliza el documento.
  • The OCR confidence level can be individually updated for a selected field in Validation Station.
  • Se ha actualizado el diseño del filtro de confianza y se han añadido puntuaciones de confianza a nivel de tabla, para cada entrada, tanto para el OCR como para la extracción. Ahora puede comprobar el nivel de confianza original de un campo que se valida manualmente. Ambos valores están disponibles haciendo clic en el nivel de confianza mostrado.
  • Updates have been made to the Validation Station wizard. You can now set a threshold for the confidence levels and sort them depending on the set limit.
  • The Taxonomy Manager wizard interface was updated, making it even more easy to use. Among the new features are an extra Delete option for all groups, fields, categories, or the Toggle keyboard shortcuts option.
  • La detección de casillas de verificación ahora se aplica en páginas PDF nativas que no tienen caracteres o controles de casillas de verificación nativos integrados.
  • Las capacidades de procesamiento de PDF han recibido una actualización importante, incluida la capacidad de procesar texto basado en vectores, la capacidad de ignorar objetos de texto invisibles, las mejoras en la detección de palabras, las mejoras en el procesamiento de logotipos, las correcciones de problemas de duplicación de caracteres y otras mejoras.
  • Text extraction from PDF files has been upgraded, resulting in an optimized extraction process, where both native and scanned text is retrieved at the same time, with the OCR being applied only on the images identified in the PDF file. This improvement is available only when the ApplyOCROnPDF option is set to Auto.
  • La plantilla Proceso de Document Understanding de Studio se ha actualizado a una nueva versión. El paquete UiPath.IntelligentOCR.Activities es una dependencia para esta plantilla.

Corrección de errores

  • Se ha corregido un error que provocaba errores de extracción al utilizar el digitalizador mediante la actualización de la biblioteca de PDF y el uso de funciones híbridas de OCR.
  • Fixed a bug occurring on the Digitize Document activity that was causing checkbox extraction on some PDFs, even when the DetectCheckboxes option was set to False.
  • Fixed a bug occurring on the Classify Document Scope activity that was throwing an empty error for the documentText parameter when two classifiers were used in the scope and processing a certain document.
  • When a field from Validation Station was manually validated, the confidence level didn't update to 100%. The bug was fixed and now the percentage of the confidence level updates automatically when a field is manually validated by the user.
  • Fixed a bug that occurred in Classification Station wizard and Taxonomy Manager when the mouse cursor was moved to the Document View section. Now, everything works as expected.
  • An error occurred when Validation Station was used in text view with documents that included special characters. The bug was fixed and now you can view documents with special characters in text view as well.

8 de diciembre de 2022

Problemas conocidos

The UiPath.IntelligentOCR.Activities package, v6.5.0, cannot be run with Studio versions older than 2021.10.

v6.0.1

Fecha de publicación: 9 de mayo de 2022

Nuevas funciones y mejoras

  • We have been working hard to give a new face to some of our wizards, hence, the Validation Station, Classification Station, and Taxonomy Manager now all have a brand-new interface that is very user friendly and presents multiple new functionalities.
  • Some of the features worth mentioning from Validation Station are the confidence scores shown for each extracted field. They can be sorted by OCR or Extractor and show you exactly the confidence score for each extracted field. The confidence score should be used only for guidance purposes. You can always improve that score by manually validating the data.
  • El asistente Estación de validación también tiene un encabezado rediseñado en el visor de PDF desde donde puedes elegir deslizar la vista del documento de izquierda a derecha, para ocultar los tokens extraídos para una vista limpia del documento o visualizar los accesos directos de teclado. No dudes más y pruébalo.
  • El asistente Estación de clasificación se presenta con el mismo encabezado rediseñado en el visor de PDF que su par, la Estación de validación. Aquí, también puedes elegir mostrar el documento en el lado izquierdo o derecho de la pantalla, o puedes comprobar los accesos directos de teclado disponibles. La opción Rotar también está disponible en el nuevo encabezado, lo que hace que la manipulación de documentos sea más fácil que nunca.
  • The Taxonomy Manager wizard has, among other improvements, a new, particularly useful one, a Delete option available in the header of the document type that also enables a bulk delete.
  • The UiPath.IntelligentOCR.Activities package has been upgraded to .NET5 portable, allowing you to run them on Linux robots.
  • The UiPath Studio MSI size has been optimized and the UiPath.IntelligentOCR.Activities package is not anymore a core package of the UiPath Studio MSI, but an optional one. All functionalities remain the same. The only change is that you need to manually install the package in UiPath Studio.
  • The Digitize Document activity and the Intelligent Keyword Classifier activity have been updated and the ForceApplyOCR option has been replaced by the ApplyOcrOnPdf option. The Apply OCR on PDF has three options available in the dropdown list: True, False, and Auto. If set to True, the OCR is applied to all PDF pages of the document, if set to False, only digitally typed text is extracted. The default value is Auto, determining if the document requires to apply the OCR algorithm depending on the input document.
  • In Classification Station wizard, the value of the Not Classified groups is now set as N/A.
  • The Intelligent Form Extractor activity deprecation is planned for October 2022. We recommend using the Form Extractor activity.
  • The Form Extractor activity can now process documents with detected signatures on them.

Corrección de errores

  • Se ha corregido un error que se producía en el asistente de la Estación de validación. Algunas fuentes asiáticas no se mostraban correctamente en el visor de PDF de la estación de validación.
  • Fixed a bug occurring while using the Digitize Document activity with UiPath Studio v19.10 and v20.10. An error was thrown when trying to process .tiff files. Now, everything works as expected.
  • Se ha corregido un error que se producía en la Estación de validación al usar la tecla de atajo TAB. En lugar de guardar los cambios, la tecla TAB revertía el campo al valor anterior. Ahora todo funciona según lo esperado.
  • Fixed a bug occurring on the Form Extractor activity. The wrong error message was displayed when a template was imported.

Problemas conocidos

En caso de que utilices una GPU Intel Xe y el Gestor de taxonomía, la Estación de validación o la Estación de clasificación no se muestren correctamente, recomendamos actualizar el controlador gráfico a la última versión. Para obtener más información, visite Soporte de Intel.

v5.0.2

Fecha de publicación: 19 de octubre de 2021

Mejoras

  • The Taxonomy Manager received a complete overhaul, with an improved UI and user experience. You can now add document types without group or category, configure colors and hotkeys for fields, and more. Consult the documentation for a complete description.
  • The UiPath.IntelligentOCR.Activities package has been upgraded to .NET5. While both .NET versions continue to be supported, the .NET5 projects can only work on 64-bit architectures.
  • The digitization process has been improved for the entire framework throughout Document Understanding and Data Manager.
  • Se han realizado mejoras para optimizar los resultados de OCR en documentos escaneados. Se obtienen los mejores resultados manteniendo el ángulo de inclinación entre +/- 20 grados.
  • Se han mejorado las dimensiones de procesamiento de imágenes para obtener mejores resultados. Para que una imagen se digitalice / procese con éxito, sus dimensiones de ancho y alto deben estar entre 50 y 10 000 píxeles. Cualquier imagen por debajo o por encima de este rango debe ser rechazada, con un mensaje de excepción. Una imagen validada con las dimensiones mencionadas anteriormente y con un tamaño total superior a 14 MP se reducirá a 14 MP, manteniendo la relación de aspecto (relación ancho / alto).
  • The Validation Station error message system has been improved and now, if the user rejects a document, an exception of type DocumentRejectedByUserException is thrown and the process is stopped.
  • Improved the load time of Validation Station for document types with large taxonomies.
  • For derived parts in Validation Station, numbers with more than two decimals are not rounded up anymore.
  • Debido a las mejoras en los algoritmos de procesamiento de imágenes, pueden aparecer cambios en la digitalización de ciertos documentos.
  • Se ha añadido una nueva casilla de verificación al asistente Gestor de plantillas, lo que te permite elegir si los sinónimos añadidos distinguen entre mayúsculas y minúsculas o no.
  • A design update has been made to the Template Manager wizard accessible from the Intelligent Form Extractor and Form Extractor activities.
  • If you experience timeouts due to long processing time, you can now use the newly added Timeout parameter for Form Extractor and Intelligent Form Extractor to increase the service call timeout.
  • If a field is checked in both Signature and Handwritten boxes in the Template Manager wizard of the Intelligent Form Extractor activity, then a popup message appears informing you that a field can be added only in one box, not both.
  • The wizard available for the Intelligent Keyword Classifier activity received an update, meaning that clicking the OK button of the vector(s) exported message now returns the user to the wizard instead of closing the wizard.
  • The Create Document Validation Action and Present Validation Station activities, received a new parameter, ShowOnlyRelevantPageRange. This allows you to configure the activity so that it only shows the page range captured in the classification part of the extraction result.
  • Performance and memory improvements in the Digitize Document activity.
  • La referencia CefSharp se actualizó a la versión 92.0.260.

Corrección de errores

  • Se ha corregido un error que se producía cuando el OCR se ejecutaba en diferentes formatos de región del sistema operativo. Ahora, el OCR se ejecuta según lo esperado y todos los resultados se generan correctamente, independientemente del formato de región del sistema operativo.
  • Fixed a bug in the Export Extraction Results activity that was deleting the extracted table when a field was marked as handwritten. Now, the entire extraction result is exported as expected.
  • Fixed an issue related to Validation Station that was causing unexpected number formatting when reading the derived parts value.
  • Fixed a bug in the Wait For Validation Action activity that was returning an error when the Automatic Extraction Result parameter was set as empty. Now, the activity runs as expected, without any errors.
  • Fixed an issue that threw a runtime error when no extraction results were served to the Present Validation Station activity.
  • Fixed an issue in Digitize Document activity, that caused the activity to crash when the ForceApplyOCR parameter was set to False.
  • Fixed an issue in the Template Manager wizard that caused data not to be extracted when using the table selection with Form Extractor.
  • Se ha corregido un problema que provocaba que no se extrajeran partes derivadas para un campo de fecha al procesar un documento específico.
  • Fixed an issue in the Template Manager wizard that caused anchors not to be highlighted after marking a table.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when stating that the fields from the extractors configuration could not be found in the taxonomy, although the extractors were removed from the scope.
  • Fixed an issue that caused the Template Manager wizard to throw an error when trying to save a template with certain words added as page evidence.
  • Fixed an issue which prevented the display of an empty Validation Station with full manual processing for data entry when the AutomaticExtractionResults parameter was null.
  • Fixed a bug that was occurring when special characters were included in the file or bucket name for any of the following activities: Create Document Classification Action, Wait for Document Classification Action, Create Document Validation Action, Wait for Document Validation Action. Now, all special characters from the file/bucket names are encoded as expected.
  • Se ha solucionado un problema que provocaba que no se extrajesen los campos de la firma y los escritos a mano debido al contraste de fondo. Ahora todos los campos se extraen correctamente, sin importar el color de fondo.
  • Se ha corregido un error que provocaba que el motor OCR devolviera un error en ciertos sistemas con espacios abiertos.
  • Fixed a bug that was merging the extracted content when using the Digitize Document activity with the UiPath Document OCR engine. Now, each item is extracted separately.

Problemas conocidos

  • If you want to use any OCR activity from this package in Studio v2019.10, please install the UiPath.CoreIPC package, version 2.0.1 or higher.
  • Si instalas el paquete UiPath.IntelligentOCR.Activities v5.0.0 en una máquina que utiliza Windows N/KN como sistema operativo, también se requiere el paquete Características multimedia. Consulta Lista de paquetes de características multimedia para ediciones de Windows N para obtener instrucciones de instalación para el paquete de características multimedia.

v4.13.2

Fecha de publicación: 28 de mayo de 2021

Mejoras

Improved the load time of Validation Station for document types with large taxonomies.

v4.13.1

Fecha de publicación: 16 de abril de 2021

Mejoras

If you experience timeouts due to long processing time, you can now use the newly added Timeout parameter for Form Extractor and Intelligent Form Extractor to increase the service call timeout.

v4.13.0

Fecha de publicación: 29 de marzo de 2021

Nuevas características y mejoras

  • Extended the Form Extractor and Intelligent Form Extractor capabilities by adding field-level anchor-based extraction rules. Besides page-level anchors, field-level anchors can now be defined in Template Editor - a new option of defining the bounds of a custom area from which data is to be extracted. As opposed to page-level configurations, which define data positions with respect to the entire page content, anchor-based configurations now allow for targeting data extraction based on field-level configurations, thus allowing for more flexibility.
  • Performance improvements on Validation Station.
  • Updated Validation Station and Classification Station design system for a better user experience.
  • The Validation Station, Classification Station, and Template Manager now have a three-state button, in the Document View side, that allow users to choose between different document interaction modes: Tokens (word selections), Custom area (area selection), and Choice on selection (users can choose between Tokens and Custom Area at each selection).
  • The user interfaces, Validation Station, Classification Station, and Template Manager, have been improved with a new selection mode in text view, now allowing users to perform selections from the text version of a document in the same way they interact with the original version. A new hotkey, d+s, was also added, to assist in switching between the original document view and the text view modes.
  • The Validation Station now displays a "crop" from the original document, when you assign a value to a data field, under the reported text value selected. This helps with locating and verifying a specific field value against the value area in the document.
  • Changed confidence calculation for Intelligent Keyword Classifier to be scalable with the length of the word vectors.
  • Added the IncludeOCRConfidence checkbox to the properties panel of the Export Extraction Results activity. If selected, the exported information will contain OCR Confidence for each value as well.
  • Algoritmos mejorados de procesamiento de letras y palabras para evitar informar de caracteres o palabras duplicados en ciertas situaciones.
  • Classify Document Scope and Train Classifiers Scope now support classifier capabilities.
  • Classify Document Scope has been optimized to perform sequential calls to the classifiers in its scope, with only the page ranges that are not already classified by a previous extractor.

Corrección de errores

  • Fixed an issue that threw a runtime error in specific cases when a Form Extractor activity and an Intelligent Form Extractor activity were in the same Data Extraction Scope.
  • Se ha solucionado un problema que impedía que se produjeran errores del clasificador en casos específicos, pero la clasificación fallaba silenciosamente.
  • Se ha solucionado un problema que provocaba que no se extrajesen las partes derivadas de un campo numérico al procesar un documento específico.
  • Fixed an issue in Digitize Document, that caused the activity to process document pages even after an exception was reported, thus increasing the overall execution time for cases of failure.
  • Fixed a bug that did not allow for the correct configuration of Regex expressions in Regex Based Extractor, in C# projects, and other very specific situations.
  • Fixed a performance issue that appeared in Validation Station and Template Editor, when a document type contained more than 200 fields.
  • Se ha corregido un error por el que, en determinadas situaciones, los números se fusionaban en un solo valor numérico informado.
  • Fixed an issue through which, in certain situations, the Wait for Document Validation Action and Resume activity would throw an exception when communicating with storage buckets.

Problemas conocidos

Las actividades Crear clasificación de documentos, Crear acción de validación de documentos y Esperar a la clasificación de documentos y reanudar ,Esperar a la validación de documentos y reanudar no funcionan con depósitos de almacenamiento en los que se ha habilitado el acceso a datos a través de Orchestrator.

versión 4.10.5

Fecha de publicación: 28 de mayo de 2021

Mejoras

Improved the load time of Validation Station for document types with large taxonomies.

v4.10.4

Fecha de publicación: 3 de febrero de 2021

Mejoras

Performance improvement of Validation Station.

v4.10.3

Fecha de lanzamiento: 11 de enero de 2021

Mejoras

Improved file upload from Create Document Validation Action and Create Document Classification Action on AWS hosted storage bucket.

v4.10.2

Fecha de publicación: 12 de noviembre de 2020

Nuevas características y mejoras

  • Referencia de CefSharp actualizada a la versión 84.4.10.
  • Puntos finales actualizados de la siguiente manera:
    • Form Extractor - from https://formextractor.uipath.com to https://du.uipath.com/svc/formextractor
    • Intelligent Form Extractor - from https://intelligentforms.uipath.com to https://du.uipath.com/svc/intelligentforms
    • Intelligent Keyword Classifier - from https://intelligentkeywords.uipath.com to https://du.uipath.com/svc/intelligentkeywords
  • Made improvements to Validation Station while in mark table mode.

Corrección de errores

Fixed an issue for Classification Document Classification Action related to the expiration of the Bearer Token.

v4.10.1

Fecha de publicación: 20 de octubre de 2020

Mejoras

More detailed error logging for Form Extractor, Intelligent Form Extractor and Intelligent Keyword Classifier.

Corrección de errores

  • Análisis de direcciones mejorado.
  • Fixed an issue where not all ML Skills were usable by the Form Extractor, Intelligent Form Extractor, and Intelligent Keyword Classifier activities.

v4.10.0

Fecha de lanzamiento: 5 de octubre de 2020

Nuevas características y mejoras

Nuevas actividades

Las siguientes actividades se han incluido en el paquete:

Estación de validación

To easily identify the information in the Validation Station, color codes were added to field cards and tokens or custom areas. Each field card has by default a color code, while tokens or custom areas get the same color code as the field card they are assigned to.

New shortcuts have been added to Validation Station allowing the user to move a selected line from a table up, down, left, or right. Also, when selections are made in Validation Station, these can be assigned to a specific field using field-level shortcuts. Each field card has a key associated with it. When no selections are made, you can use field-level shortcuts to jump from one field card to another.

For Validation Station table fields, a row-level checkmark was added. You can now check all the fields from a row by selecting the checkmark or it will be automatically checked when you visit all the fields.

Tokens in Validation Station have been updated. Thus, the highlighted tokens have a red bottom border and the selected tokens have a dashed border.

Field values with no reference are now supported in Validation Station. Users can assign values to fields that do not have a reference in the document. To do so, while the user creates a field in Taxonomy Manager, the Requires Reference checkbox needs to be unchecked.

Estación de clasificación

New shortcuts were created for Classification Station allowing the user to navigate through document types; add, change, remove or highlight reference; move all pages up or down; split after selected page; discard changes; save; report as exception.

Además de usar el menú de tipo de documento, ahora también se puede eliminar una referencia a nivel de página al pasar el cursor sobre una página y hacer clic en el icono azul en la esquina inferior derecha. El icono también permite resaltar la referencia.

Visor de PDF en la estación de clasificación y la estación de validación

The Rotate button was added to the PDF Viewer. By clicking the button, the current document page will rotate clockwise.

El modo de selección está habilitado por defecto en el Visor de PDF.

Otras actividades

The Intelligent Form Extractor and Form Extractor activities can now incorporate imported templates that have the same name but different content as the already available ones. Each template is analyzed, and a warning message is displayed for each case.

The ActionPriority property from the Create Document Validation Action activity now supports expressions and variables.

The terms BucketFolderPath and DirectoryFolderPath were changed to BucketDirectoryPath and DownloadDirectoryPath for the Create Document Validation Action activity, respectively for the Wait for Document Validation Action and Resume activity. The reason behind this is to clearly separate from the Orchestrator concept of “Folder”.

v4.5.2

Fecha de publicación: 24 de agosto de 2020

Corrección de errores

  • Se ha solucionado un problema que, en algunos casos, devolvía un mensaje de error 407ProxyAuthenticationRequired para las solicitudes de autenticación de Kerberos o NTLM. Esto se aplica al Extractor de formularios, el Extractor inteligente de formularios y el Clasificador inteligente de palabras clave.
  • Fixed an issue that was causing the Intelligent Form Extractor to not properly display a timeout error.
  • Missing translations were added for certain Validation Station strings.
  • Fixed an issue that was causing the Data Extraction Scope to throw an error when unselecting a table field.

v4.5.1

Fecha de lanzamiento: 24 de junio de 2020

Corrección de errores

  • Fixed an issue that was causing synchronization problems between the configuration window and the Properties panel for the Wait for Document Validation Action and Resume activity.
  • Se ha solucionado un problema por el que, en algunas situaciones, los campos de la tabla se guardaban por error como multivalores en la taxonomía.

v1.3.2

Fecha de publicación: 2 de junio de 2020

Mejoras

The UiPath.IntelligentOCR.Activities package was updated to reference the latest Uipath Vision library.

v4.5.0

Fecha de Lanzamiento: 4 de mayo de 2020

Nuevas características y mejoras

  • This release brings many new exciting activities such as Create Document Validation Action, and Wait for Document Validation Action and Resume that can be used to create, suspend, and resume orchestration workflows in the UiPath Action Center.
  • Two new extractors are here to be of your help. You can find them under the name of Form Extractor and Intelligent Form Extractor. Both activities can extract information from fixed form documents based on predefined templates, the difference being that the Intelligent Form Extractor can also be configured to interpret fields that are signed or handwritten. You can extract information from any type of field, including tables and create custom table extraction rules by using the Template Manager wizard.
  • While using the Intelligent Form Extractor activity, if the number of handwritten fields might have been exceeded, then a warning is displayed directly in the workflow. This does not stop the user from running the workflow.
  • The Regex Based Extractor activity received a new option named UseVisualAlignment that can be used for complex layouts where it is easier for users to write regular expressions based on how words are visually organized on lines, ignoring any sentence, paragraph, or layout group otherwise identified in the document.
  • Puede definir una expresión regular para identificar el área de la tabla, una expresión regular para identificar una fila de la tabla en esa área y expresiones regulares para identificar columnas específicas en las filas de la tabla.
  • Presentar estación de validación y su asistente incluyen muchas funciones nuevas y mejoradas.
  • The Validation Station wizard now has a new button named Discard changes. You can use it for confirming or dismissing any changes done in Validation Station. The function can be used on each document type individually.
  • The wizard also has a new option named Show Suggestions that allows you to select one value from multiple candidates if the used extractors report multiple possible values.
  • La lista de accesos directos disponibles en la Estación de validación se ha mejorado con uno nuevo, f+a, que le permite añadir un nuevo valor en un campo de varios valores.
  • Improvements have been made on the Digitize Document activity that can now better identify the check boxes in a document.
  • La actividad Digitalizar documento también tiene una nueva opción llamada ForceApplyOCR. Cuando se selecciona, aplica el motor OCR a todas las páginas del documento, incluido el PDF nativo.
  • The Data Extraction Scope activity can now automatically read Extractor capabilities (internal taxonomies) if the Extractor declares them. This simplifies the configuration step by exposing the extractor's known fields. The Machine Learning Extractor now supports this new functionality, making it very easy to use and configure.
  • The Export Extraction Results activity received a new option named IncludeConfidence. If selected, the confidence level is provided.
  • Los asistentes de extracción y configuración ahora admiten la selección de campos en masa para tipos de documentos y campos de tablas.

v4.0.1

Fecha de lanzamiento: 14 de enero de 2020

Corrección de errores

  • Fixed an issue that was causing the Validation Station wizard to display incorrectly the table preferences, when using the Extract new table option.
  • Fixed an issue that was returning an error when Validation Station wizard was run with Callout activity chained before or after it. Now, the activity runs as expected.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when it was run with a customized machine culture and the FormatValuesIfPossible option selected. Now, the activity runs as expected.
  • Fixed an issue that was causing some performance issues when large amounts of text were selected in the Text View option of the Validation Station wizard. Now, the Text View option displays the text as expected.
  • Fixed an issue that was causing the Data Extraction Scope activity to throw an error when it was run with an extractor without an internal taxonomy set and a new field was added in the project’s taxonomy. Now, the activity runs as expected.
  • En ciertas máquinas, los documentos girados no se mostraban correctamente al usar la Estación de validación.

v4.0.0

Fecha de lanzamiento: 6 de diciembre de 2019

Cambios de última hora

Problemas conocidos

  • The UiPath.Abbyy.Activities package cannot be used with versions lower than v19.11 for the UiPath.UIAutomation.Activities package and lower than v4.0.0 for the UiPath.IntelligentOCR.Activities package.
  • If after updating a workflow to the new UiPath.IntelligentOCR.Activities v4.0.0 and UiPath.Abbyy.Activities v1.0.0 you encounter runtime validation errors, please force a new save on the .xaml file by making a small change and then reverting it. This might occur for workflows using FlexiCapture activities.
  • Workflows created or upgraded to UiPath.IntelligentOCR.Activities v4.0.0 cannot be downgraded to a lower UiPath.IntelligentOCR.Activities version.

Corrección de errores

An exception was thrown when the Digitize Document activity was used together with the OmniPage OCR for documents with special characters included in the Extended engine pack. The issue was fixed and now the activity is executed as expected.

v2.0.2

Fecha de lanzamiento: 25 de noviembre de 2019

Mejoras

Performance improvements took place for processing files within the document processing framework, for the UiPath.IntelligentOCR.Activities package.

v1.3.1

Fecha de lanzamiento: 25 de noviembre de 2019

Mejoras

Performance improvements took place for processing files within the document processing framework, for the UiPath.IntelligentOCR.Activities package.

v3.1.0

Fecha de lanzamiento: 8 de noviembre de 2019

Nuevas características y mejoras

  • Está disponible una nueva actividad destinada a ayudarte a organizar y gestionar mejor tus clasificadores entrenables: Entrenador de clasificadores basado en palabras clave. Esta actividad solo se puede utilizar junto con la actividad Entrenar el alcance de los clasificadores .
  • El asistente de la Estación de validación recibió una actualización importante y ahora está disponible para que explores su máximo potencial. Este asistente solo está disponible cuando la actividad Mostrar estación de validación se utiliza en un flujo de trabajo. Puedes utilizar la versión actualizada para beneficiarte de una nueva interfaz fácil de usar, navegar por el documento mientras utilizas los atajos de teclado, o seleccionar una o varias palabras o un área personalizada. Puedes marcar fácilmente un campo como faltante, extraer nuevos datos, editar una tabla o extraer una nueva tabla. Todas estas cosas maravillosas se pueden hacer con el asistente de la Estación de validación mientras se utiliza un tema oscuro.
  • Una de las mejoras incluidas en esta versión es que la actividad Clasificador basado en palabras clave recibió un nuevo parámetro llamado LearningData. Además de especificar dónde se encuentran los datos del archivo de aprendizaje, ahora también puedes utilizar la cadena que contiene los datos del clasificador serializados. Esta actividad se ha mejorado con un asistente denominado Gestionar el aprendizaje del clasificador basado en palabras clave que puede utilizarse para configurar y gestionar las palabras clave utilizadas para identificar tipos de documentos específicos.
  • Both the Keyword Based Classifier and Keyword Based Classifier Trainer activities are now able to manage multiple keywords. After the keyword sets are selected, the extraction is based on a full match of the selected words.
  • Otra gran mejora es que la salida DocumentObjectModel , incluida en la actividad Digitalizar documento , ahora puede admitir polígonos de palabras, además de cuadros horizontales de palabras.
  • The Taxonomy Manager wizard received a new scrolling bar that incorporates all UI elements and it provides a better user experience.
  • Data Extraction Scope, Train Extractors Scope, Train Classifier Scope, and Classify Document Scope activities are now arranging their extractors and classifiers in horizontal order, replacing the previous vertical order.
  • The Regex Based Extractor activity has been improved and can now process and return multi-values. The output is visible only when the activity is used together with the Validation Station.
  • Cuatro nuevos idiomas, turco (TR), portugués (PT), español (ES) y Spanish-México (ES-MX) están disponibles para el paquete UiPath.IntelligentOCR.Activities.

Problemas conocidos

Solo se puede acceder al Gestor de taxonomía si has abierto previamente un archivo .xaml . Si no hay archivos abiertos al acceder al Gestor de taxonomía, se mostrará una ventana de grabación y el Gestor de taxonomía solo se mostrará después de cerrar la ventana de grabación.

Corrección de errores

  • Se lanzaba una excepción al utilizar la actividad Ámbito de extracción de datos junto con una actividad Intentar capturar . El problema se ha solucionado y ahora la actividad se ejecuta como se espera.
  • When a Boolean field was set to No in Validation Station, the output file should have shown the result as No but instead is showing it as missing. The issue was fixed and now the output file shows the correct result.
  • Se ha corregido el análisis de números incorrecto que se producía cuando el ámbito de extracción de datos intentaba analizar números en documentos utilizando un formato de número diferente al de la cultura del documento.
  • When using multiple Validation Stations, the order of the derived parts was not respected in the validated results. The issue was fixed and now the results are displaying the derived parts in the same order they were introduced.
  • Differences between the boxes with custom selection occurred when the results of a Validation Station were run through a second Validation Station. The issue was fixed and now there are no differences between boxes with custom selection.
  • Cuando la actividad Digitalizar documento se utilizaba junto con el motor OCR Computer Vision de Microsoft Azure , la rotación no funcionaba cuando el parámetro HandwritingRecognition se establecía como True. El problema se ha solucionado y ahora la información se procesa correctamente.
  • Al utilizar la actividad Digitalizar documento , se producía un error al intentar procesar imágenes con mucho texto. El error se ha corregido mejorando el proceso de escalado.
  • Se ha corregido un problema que se producía al intentar entrenar la actividad Clasificador basado en palabras clave en el ámbito de entrenamiento y la extracción se ejecutaba sin una referencia de clasificación. El problema se ha solucionado y ahora el hecho de que no haya información de aprendizaje solo se registra, no se muestra como un error.
  • Se producía un error al utilizar la actividad Extractor de CapturaFlexible y se daba el mismo nombre tanto a una columna de la tabla como a un campo. El problema se ha solucionado y el archivo .fcdot ahora se procesa como se esperaba.

¿Te ha resultado útil esta página?

Conectar

¿Necesita ayuda? Soporte

¿Quiere aprender? UiPath Academy

¿Tiene alguna pregunta? Foro de UiPath

Manténgase actualizado