- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado

Actividades de Document Understanding
Fecha de lanzamiento: 25 de agosto de 2025
Novedades
Reordenar páginas dentro de un documento durante la clasificación
For greater flexibility, you can now reorder pages within a document, when classifying them in the Classification Station. To enable this capability, use the EnablePageReorder property, available in the Present Classification Station and Create Document Classification Action activities.
Reentrenar modelos al utilizar proyectos modernos de Document Understanding
You can now enhance the extraction capabilities of your models, by retraining them on the specific documents that you validate through the Validation Station. You can use the Document Understanding Project Extractor Trainer activity to retrain models when working with modern Document Understanding projects.
Redactar documentos
The new Redact Document activity allows you to input a document and an extraction result, generating a new file without any sourced details. The output document is the redacted copy of the input, with all information provided as input being redacted accordingly. Any information within the extraction result is redacted using a style of your choice.
Modo compacto de la estación de validación
La estación de validación ahora se puede utilizar con una nueva cara: el modo de visualización compacto. Esto proporciona más espacio para los campos, un resaltado más fácil para los campos que requieren atención, una sección centralizada de comprobaciones empresariales y una serie de otras características centradas en el validador. Para habilitar el modo compacto, actualiza el paquete IntelligentOCR.Activities a la versión 6.25.0-preview o posterior, luego ve a la actividad Crear acción de validación de documentos o presentar estación de validación y establece el argumento de entrada DisplayMode en Compacto.
Cambios de validación para los campos de la tabla en la estación de validación
Hemos actualizado el proceso de validación de tablas tanto en la estación de validación clásica como en la compacta, diseñado para mejorar la experiencia del usuario y el rendimiento general. Hemos traído las siguientes actualizaciones:
- Ahora puedes guardar parcialmente una tabla siempre que no haya celdas no válidas. Puedes guardar parcialmente el campo de la tabla utilizando la opción Listo .
- <number> <number> Utiliza las opciones Hay <número> celdas no válidas y Hay <número> celdas no confirmadas para navegar a celdas no válidas o no confirmadas.
- Cada celda dentro de la tabla ahora muestra una casilla de verificación de confirmación.
- Confirma toda la tabla seleccionando Confirmar todas las celdas.
- Puedes enviar una acción sin visitar y confirmar manualmente todas las tablas. La opción Enviar mostrará el número de campos y tablas, que se confirmarán automáticamente antes de enviarlos.
También hemos implementado varias mejoras y resuelto problemas para mejorar tu experiencia de usuario:
- Se ha mejorado el rendimiento general y la navegación de la validación de tablas.
- Se ha optimizado la visualización de las reglas empresariales no válidas.
- Se han corregido problemas relacionados con la falta de celdas de tabla que no se renderizaban y la visualización incorrecta de tablas de solo lectura.
La siguiente imagen muestra la interfaz de usuario de la estación de validación clásica para el proceso actualizado.
For more information on the updated validation process, visit Classic Validation Station and Compact Validation Station.
Mejoras
- Las actividades Presentar Estación de Validación , Crear Acción de Validación de Documentos y Crear Artefactos de Validación de Documentos ahora tienen la propiedad ShowOnlyRelevantPageRane establecida de forma predeterminada en
True
. - Cuando obtienes el
ClassificationResult
de las actividades Clasificar ámbito de documento o Mostrar estación de clasificación , puedes acceder al intervalo de páginas de los documentos secundarios clasificados utilizando la propiedadItem.DocumentBounds.PageRange
en la variableClassificationResult
. - La actividad Clasificador inteligente de palabras clave ahora puede clasificar páginas con menos palabras.
- La actividad Recuperar artefactos de validación de documentos ahora tiene el resultado extraído validado en el diseñador principal para facilitar el acceso.
- Los datos ahora también se recopilan para el reentrenamiento y están disponibles en la sección Excepciones para la revisión de un proyecto moderno.
Corrección de errores
- La salida de la actividad Leer texto en PDF extraía por error un documento escrito en español como caracteres del alfabeto griego.
- Al entrenar el Clasificador inteligente de palabras clave en ciertas condiciones, el clasificador no se entrenaba correctamente y causaba una degradación del rendimiento.
- Se ha corregido un problema por el que el valor numérico de ciertos documentos se analizaba incorrectamente.
- Se ha corregido un problema por el que las actividades Crear acción y Crear artefactos fallaban inesperadamente.
Fecha de lanzamiento: 16 de abril de 2025
Habilitar los controles de derecha a izquierda en la Estación de validación
True
. Esta propiedad se aplica a las siguientes actividades:
Validación mejorada con Estación de validación compacta
- Classic: This is the standard interface. This is the interface which was always used until this release.
- Compact: This enhanced interface offers a better user experience with improvements, such as:
- Se ha mejorado el proceso de entrada manual en la Estación de validación para facilitar su uso.
- Los tokens para los valores resaltados dentro del documento ahora aparecen dentro de una línea roja para una mejor visibilidad.
- Posibilidad de añadir valores para los campos, incluso cuando la configuración de taxonomía Requiere referencia está deshabilitada.
Nueva configuración de visualización para los tipos de documentos en el Gestor de taxonomía, que incluye:
- Umbral de confianza de OCR: define un umbral de confianza mínimo para OCR que la estación de validación considera en comparación con los umbrales de confianza generados durante la validación.
- Formato de visualización de fecha: establece un formato de fecha preferido.
- Separador decimal numérico: determina un separador decimal para los campos numéricos dentro del tipo de documento.
- Separador de miles de números: determina un separador de miles para los campos numéricos dentro del tipo de documento.
Nota: además del umbral de confianza de OCR personalizable para el tipo de documento, puedes establecer un umbral de confianza de extracción para cada campo de tu taxonomía. Encuentra esta configuración en la pestaña Detalles en Configuración de validación en el Gestor de taxonomía.
For more information on the updates brought to the Taxonomy Manager, visit Load Taxonomy.
Validar documentos en Action Center utilizando las aplicaciones de UiPath®
You can now boost the efficiency of your document processing understanding workflows with UiPath® apps. Apart from creating document validation tasks directly in Action Center, you can now build an Action app that shows the document and the validation station. Once set up, the validation station and the target document are displayed inside Action Center, awaiting user intervention. For more information on validating documents using Action apps, visit the Validating documents with App actions tutorial.
Usar etiquetas y versiones para proyectos modernos de Document Understanding
To tailor document understanding workflows to your needs, you can now use specific versions of your projects during classification and extraction. The Tag property provides granular control for testing your Document Understanding workflows before rolling them out into production. For more information, visit Document Understanding Project Classifier and Document Understanding Project Extractor.
Capacidades de extracción mejoradas utilizando nuevos extractores generativos
Para mejorar las capacidades de extracción generativa tanto para documentos cortos como largos que tienen diseños complejos, ahora puedes seleccionar los siguientes extractores generativos al configurar extractores para tus campos de documento:
- Diseño simple de documentos largos : este es el extractor generativo existente.
- Diseño complejo de documentos largos (vista previa): optimizado para documentos de formato largo que incluyen imágenes, escritura a mano, elementos de formulario u otros diseños complejos, como cuadros de llamada flotantes. Ejemplos de documentos que son adecuados para este extractor: pólizas de seguro u otros documentos similares de formato largo con diseños complejos.
- Diseño complejo de documento corto (vista previa): optimizado para documentos cortos que incluyen imágenes, escritura a mano, elementos de formulario u otros diseños complejos como cuadros de llamada flotantes. Por ejemplo: documentos de identidad o formularios de admisión de atención médica con diseños complejos.
Mejoras
La parte de digitalización de tus flujos de trabajo de procesamiento de documentos ahora puede reconocer y devolver datos de documentos que contienen valores que están en un círculo, subrayados o tachados.Corrección de errores
- Los datos de ciertas tablas no aparecían en archivos PDF a pesar de la digitalización exitosa con la actividad Digitalizar documentos.
- Al digitalizar archivos PDF, faltaban firmas.
- En ocasiones, el proceso de extracción identificaba erróneamente el estado de los campos de tipo Dirección debido a problemas de análisis de direcciones.
- La actividad Digitalizar documento devolvería texto de un documento PDF, incluso cuando el texto estuviera oculto utilizando lectores de PDF.
- Los cuadros de texto de un documento no se digitalizaban, por lo que no se mostraban en el Document Manager.
- Cierto texto no se extraía durante el proceso de extracción del documento debido a problemas relacionados con la sangría y el procesamiento del ángulo de los documentos girados.
- Después de migrar un proyecto a la compatibilidad de Windows, las ejecuciones fallaban con el siguiente error: "Trabajo detenido con un código de salida inesperado".
Fecha de lanzamiento: 26 de noviembre de 2024
Mejoras
Se actualizó el texto de explicación en el Editor de plantillas del Extractor de Formularios para reflejar el proceso de definición de anclajes de campo.
Corrección de errores
- Los datos de ciertas tablas no aparecían en archivos PDF a pesar de la digitalización exitosa con la actividad Digitalizar documentos.
- Se resolvió un problema por el que el texto mostrado en el documento PDF generado era impreciso.
Fecha de lanzamiento: 22 de octubre de 2024
Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.
Fecha de lanzamiento: 21 de octubre de 2024
Corrección de errores
Esta versión resuelve las secciones Desconocido en el panel de resumen del consumo de unidades de IA que fueron causadas por datos faltantes.
Fecha de lanzamiento: 14 de octubre de 2024
Corrección de errores
Esta versión resuelve las secciones Desconocido en el panel de resumen del consumo de unidades de IA que fueron causadas por datos faltantes.
Fecha de lanzamiento: 3 de octubre de 2024
Novedades
Soporte para actividades de una configuración local
You can now use the following activities within the Classify Document Scope and Data Extraction Scope, even if the robot is connected to a local Orchestrator:
- Clasificador generativo
- Extractor generativo
- Clasificador de proyectos de Document Understanding
- Extractor de proyectos de Document Understanding
Para la actividad Ámbito de extracción de datos, en concreto, hemos hecho posible utilizar características de validación automática de una organización o tenant diferente.
Hemos añadido las propiedades RuntimeTenantURL y RuntimeCredentialsAsset a las actividades anteriores. Con estas propiedades, ahora puedes utilizar directamente las credenciales de aplicaciones externas, almacenadas en Orchestrator, para acceder a los recursos de Document Understanding en tiempo de ejecución. Para lograr esto, asegúrate de que tu tenant seleccionado tenga Document Understanding habilitado y unidades de IA asignadas.
Además, en el asistente Obtener capacidades de las actividades Clasificador de proyectos de Document Understanding y Extractor de proyectos de Document Understanding, hemos incluido propiedades como App Id, App Secret y TenantUrl.Estas propiedades facilitan el acceso a recursos de diferentes organizaciones y tenants durante la fase de diseño.
Soporte de IntelligentOCR para proyectos modernos
IntelligentOCR.Activities ahora admite el consumo de proyectos modernos de Document Understanding, a través de un nuevo conjunto de actividades dirigidas al uso de proyectos modernos. Ahora puedes utilizar las siguientes actividades para consumir tus proyectos y versiones modernas de Document Understanding:
- Document Understanding Project Classifier, used within a Classify Document Scope activity.
- Document Understanding Project Extractor within a Data Extraction Scope activity.
OCR de idiomas ampliados
Enhance the capability of your projects to process documents by using the UiPath Extended Languages OCR which is now generally available (GA).
Corrección de errores
- Se ha resuelto un problema por el que se encontraba el error "La longitud del texto es cero" cuando tanto el Clasificador basado en teclado como el Clasificador inteligente de teclado se habilitaban para el mismo tipo de documento.
- El extractor ML devolvía valores vacíos, lo que provocaba que las tareas de validación fallaran debido a las propiedades de valor nulo.
- Los valores de campo añadidos manualmente en la Estación de Validación dentro de Action Center no se formateaban según la taxonomía, lo que provocaba que los resultados exportados mostraran datos incorrectos.
- Se ha resuelto el problema que le impedía marcar tablas dentro de los archivos de imagen en la estación de validación.
Próximas obsolescencias
The UiPath Chinese, Japanese, Korean OCR will be deprecated starting with January 2025. We recommend using the UiPath Extended Languages OCR instead. Check the deprecation timeline for more information about upcoming deprecations and removals.
Fecha de publicación: 13 de agosto de 2024
Hemos actualizado algunas dependencias internas para mejorar el rendimiento.
Fecha de publicación: 31 de julio de 2024
Corrección de errores
- Al intentar digitalizar un determinado contenido de archivo, se producía una excepción "System.InvalidOperation" junto con un mensaje de "Fullness" durante la actividad Digitalizar documento.
- Al utilizar las actividades Clasificador generativo y Extractor generativo, introducir una solicitud que comenzaba o terminaba con espacios en blanco provocaba el error "KeyNotFoundException" con el mensaje "La clave dada no estaba presente en el diccionario".
Fecha de lanzamiento: 29 de julio de 2024
Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.
Fecha de lanzamiento: 29 de julio de 2024
Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.
Fecha de publicación: 20 de junio de 2024
Trabajamos constantemente para mejorar su experiencia de UiPath Document Understanding. Aunque no hay cambios significativos importantes con esta versión, nos aseguramos de aportar mejoras secundarias y correcciones de accesibilidad en nuestro producto.
Fecha de publicación: 5 de junio de 2024
Hemos mejorado la estabilidad del producto actualizando nuestras dependencias comunes a las versiones más recientes. Esta actualización es automática y no requiere ninguna acción por tu parte.
Fecha de publicación: 5 de junio de 2024
Corrección de errores
Crear acción de clasificación de documentos arrojaba un error si no se configuraba previamente una URL prefirmada.
Fecha de publicación: 27 de mayo de 2024
Corrección de errores
- Se resolvió un problema por el que se producía el error "La longitud del texto es cero" cuando tanto el Clasificador basado en teclado como el Clasificador inteligente de teclado estaban habilitados para el mismo tipo de documento.
- El extractor ML devolvía valores vacíos, lo que provocaba que las tareas de validación fallaran debido a las propiedades de valor nulo.
Fecha de lanzamiento: 29 de abril de 2024
Estas notas de la versión contienen todas las actualizaciones realizadas entre noviembre de 2023 y marzo de 2024.
Novedades
Notas del validador
Ahora puedes habilitar las notas del validador para cada campo en el Gestor de taxonomía. Cuando está habilitado, puedes establecer notas en estos campos, y se muestran al validador humano. Si las notas se establecen como editables, el validador puede editarlas y comunicar información a la automatización, a través de una nueva propiedad de objeto ExtractionResult .
Validación generativa para el ámbito de extracción de datos
You can use Generative Validation for the Data Extraction Scope activity to adjust confidence using generative extraction cross-checking. Check out the ApplyAutoValidation and AutoValidationConfidenceThreshold properties in the Data Extraction Scope activity.
Mejoras
- La instalación del paquete UiPath.IntelligentOCR.Activities instala automáticamente el paquete UiPath.DocumentUnderstanding.ML.Activities . No es necesario instalarlo por separado.
Corrección de errores
- Se ha solucionado un problema por el que la fuente japonesa no se reconocía al convertir a JPG.
- Se ha corregido un problema por el que el orden de los números en hebreo se invierte en la estación de validación.
- Se ha corregido un problema relacionado con la extracción de valores de texto bidireccionales (de izquierda a derecha y de derecha a izquierda), que provocaba un orden incorrecto de los símbolos de puntuación.
Problemas conocidos
Existe un problema conocido al utilizar la versión 2022.10.2 de la plantilla de proceso de Document Understanding dentro de Studio 2023.4.4 en un proyecto de Windows. Al abrir el Gestor de taxonomía se produce un error que indica que debes instalar los marcos .NET que faltan. Independientemente de si eliges instalar .NET o no, sigue otro mensaje de error: "La comunicación entre UiPath Studio y Taxonomy Manager finalizó inesperadamente".
Solución alternativa: instala manualmente .NET 6.0 Runtime.
Fecha de publicación: 24 de octubre de 2023
Nuevas funciones y mejoras
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Extractor de forma
- Clasificador inteligente de palabra clave
The Digitize Document activity can now detect native PDF radio buttons.
The content type detection capabilities of the Digitize Document is improved.
El Gestor de taxonomía ahora permite la definición de varias expresiones matemáticas en las reglas empresariales.
Fecha de lanzamiento: 19 de septiembre de 2023
You are not authorized
al reanudar un trabajo una vez finalizada la validación de documentos desde Action Center.
Fecha de lanzamiento: 28 de agosto de 2023
Hemos corregido un error que ralentizaba la Estación de validación cuando los documentos contenían tablas grandes.
Fecha de lanzamiento: 8 de junio de 2023
Hemos corregido un error que provocaba inconsistencias en los valores formateados cuando la cantidad era negativa.
Fecha de lanzamiento: 7 de junio de 2023
Hay una nueva opción disponible al usar la actividad Extractor de formularios, Enviar documentos para mejorar el algoritmo, que permite habilitar o deshabilitar la opción antes de ejecutar el flujo de trabajo. El valor predeterminado está habilitado.
Hemos realizado correcciones de errores menores y correcciones de accesibilidad en todo el paquete UiPath.IntelligentOCR.Activities.
Fecha de lanzamiento: 19 de septiembre de 2023
You are not authorized
al reanudar un trabajo una vez finalizada la validación de documentos desde Action Center.
Fecha de lanzamiento: 7 de junio de 2023
Trabajamos constantemente para mejorar su experiencia de UiPath Document Understanding. Aunque no hay cambios significativos importantes con esta versión, nos aseguramos de aportar mejoras secundarias y correcciones de accesibilidad en nuestro producto.
Fecha de lanzamiento: 2 de mayo de 2023
Corrección de errores
Hemos corregido un error que provocaba que la actividad Ámbito de extracción de datos se bloqueara cuando la extracción se completaba en todos los documentos secundarios menos en el primero. Esto sucedía cuando se usaba un clasificador para realizar la división de documentos y se devolvían varios resultados de clasificación desde Clasificar ámbito del documento.
Fecha de lanzamiento: 26 de abril de 2023
Nuevas funciones y mejoras
- UiPath Document OCR es el nuevo motor de OCR predeterminado para las siguientes actividades: Clasificador inteligente de palabras clave, Entrenador del clasificador inteligente de palabras clave y Extractor de formularios.
- Hemos añadido una función de reintento a las actividades Esperar Actionsde validación de documentos y Esperar Actionsde clasificación de documentos . Puede usar la nueva opción Reintentar y establecerla como Habilitado / Deshabilitado, con el valor predeterminado de Habilitado. Si está habilitado, las llamadas HTTP se volverán a intentar en caso de error.
- El paquete UiPath.IntelligentOCR.Activities ahora se puede usar con idiomas de derecha a izquierda.
- La precisión de la extracción de la actividad Extractor de formularios se ha mejorado al incluir la información de coincidencia de página en el algoritmo de extracción.
- Hemos actualizado el diseño de las reglas de campo que se pueden establecer en el Gestor de taxonomía.
- Ahora puede aplicar expresiones matemáticas en reglas de campo usando el asistente del Gestor de taxonomía de la actividad Cargar taxonomía.
- Se ha actualizado el asistente de Estación de validación, lo que le permite ver las reglas aplicadas a los campos. Además, cuando un campo se actualiza manualmente, la regla del campo también se actualiza automáticamente.
- La actividad Digitalizar documento se ha mejorado y ahora consume menos memoria del sistema.
- Los widgets de sello ahora están digitalizados en PDF nativos.
- Se ha mejorado la compatibilidad de archivos PDF para la actividad Digitalizar documento.
Errata de septiembre de 2023: las características avanzadas de división están disponibles para la actividad Clasificador de palabras clave inteligente.
Corrección de errores
- Hemos actualizado las dependencias del paquete y hemos corregido el error de Método no encontrado que se producía cuando se añadía una actividad de Invocar código al flujo de trabajo.
- Hemos corregido un error que impedía rellenar automáticamente la clave de API cuando tu token de autenticación para la instancia de Orchestrator utilizada había caducado. El error se ha producido tanto en UiPath Document OCR como en OCR para los campos de clave API en chino, japonés y coreano .
Cronología de la obsolescencia
Te recomendamos comprobar periódicamente la fecha de caducidad para ver las actualizaciones relativas a las características que quedarán obsoletas y serán eliminadas.
Fecha de lanzamiento: 27 de marzo de 2023
Nuevas funciones y mejoras
Trabajamos constantemente para mejorar el paquete UiPath.IntelligentOCR.Activities. Aunque no hay cambios significativos importantes con esta versión de parche, nos aseguramos de aportar mejoras menores y correcciones de accesibilidad en nuestro producto.
Fecha de publicación: 15 de diciembre de 2022
Nuevas funciones y mejoras
- La clave de la API de Document Understanding ahora se rellena previamente para las siguientes actividades: OCR de documentos de UiPath, OCR para chino, japonés y coreano, extractor de aprendizaje automático, clasificador de aprendizaje automático y gestión de plantillas del extractor de formularios.
- La interfaz de usuario de Studio ya está disponible en chino tradicional.
- Ahora puedes beneficiarte de que el campo Clave de API se rellene previamente para las siguientes actividades incluidas en el paquete UiPath.IntelligentOCR.Activities: Clasificador inteligente de palabras clave y Extractor de formularios.
- El menú de atajos de teclado ahora incluye nuevas teclas de acceso rápido, agregadas en una sección separada de Accesibilidad. Están disponibles para las actividades Presentar estación de validación y Presentar estación de clasificación.
Corrección de errores
Se ha corregido un error que impedía el rellenado automático de la clave de API cuando su token de autenticación para la instancia de Orchestrator utilizada había caducado. El error se ha producido tanto en UiPath Document OCR como en OCR para los campos de clave API en chino, japonés y coreano .
Fecha de lanzamiento: 24 de octubre de 2022
Nuevas funciones y mejoras
- Hay nuevos objetos de acción disponibles para las actividades Esperar acción de clasificación de documento y Reanudar y Esperar acción de validación de documento .
- La actividad Digitalizar documento se ha actualizado y ahora viene con un motor de OCR preseleccionado predeterminado, el motor de OCR de UiPath Document . Como consecuencia de este cambio, el paquete UiPath.OCR.Activities se ha convertido en una dependencia del paquete UiPath.IntelligentOCR.Activities .
- La actividad Digitalizar documento recibió un nuevo parámetro,
Detect Checkboxes
, que habilita la detección de casilla de verificación mientras se digitaliza el documento. - El nivel de confianza de OCR se puede actualizar individualmente para un campo seleccionado en la Estación de validación.
- Se ha actualizado el diseño del filtro de confianza y se han añadido puntuaciones de confianza a nivel de tabla, para cada entrada, tanto para el OCR como para la extracción. Ahora puede comprobar el nivel de confianza original de un campo que se valida manualmente. Ambos valores están disponibles haciendo clic en el nivel de confianza mostrado.
- Se han realizado actualizaciones en el asistente de la Estación de validación . Ahora puede establecer un umbral para los niveles de confianza y ordenarlos en función del límite establecido.
- Se ha actualizado la interfaz del asistente del Gestor de taxonomía , lo que lo hace aún más fácil de usar. Entre las nuevas características se encuentra una opción adicional de Eliminar para todos los grupos, campos, categorías o la opción Alternar atajos de teclado .
- La detección de casillas de verificación ahora se aplica en páginas PDF nativas que no tienen caracteres o controles de casillas de verificación nativos integrados.
- Las capacidades de procesamiento de PDF han recibido una actualización importante, incluida la capacidad de procesar texto basado en vectores, la capacidad de ignorar objetos de texto invisibles, las mejoras en la detección de palabras, las mejoras en el procesamiento de logotipos, las correcciones de problemas de duplicación de caracteres y otras mejoras.
- La extracción de texto de archivos PDF se ha actualizado, lo que ha permitido un proceso de extracción optimizado, en el que tanto el texto nativo como el escaneado se recuperan al mismo tiempo, y el OCR se aplica solo a las imágenes identificadas en el archivo PDF. Esta mejora solo está disponible cuando la opción AplicarOCROnPDF está establecida en Automático.
- La plantilla de Document Understanding Process Studio se ha actualizado a una nueva versión. El paquete UiPath.IntelligentOCR.Activities es una dependencia para esta plantilla.
Corrección de errores
- Se ha corregido un error que provocaba errores de extracción al utilizar el digitalizador mediante la actualización de la biblioteca de PDF y el uso de funciones híbridas de OCR.
- Se ha corregido un error que ocurría en la actividad Digitalizar documento que provocaba la extracción de casillas de verificación en algunos PDF, incluso cuando la opción
DetectCheckboxes
estaba establecida en Falso. - Se ha corregido un error que ocurría en la actividad Clasificar ámbito de documento que arrojaba un error vacío para el parámetro
documentText
cuando se usaban dos clasificadores en el ámbito y procesando un determinado documento. - Cuando se validaba manualmente un campo de la estación de validación, el nivel de confianza no se actualizaba al 100%. El error se corrigió y ahora el porcentaje del nivel de confianza se actualiza automáticamente cuando el usuario valida un campo manualmente.
- Se ha corregido un error que se producía en el asistente de Estación de clasificación y el Gestor de taxonomía cuando el cursor del ratón se movía a la sección Vista de documento. Ahora todo funciona según lo esperado.
- Se produjo un error cuando se usó la Estación de validación en la vista de texto con documentos que incluían caracteres especiales. El error se solucionó y ahora puede ver los documentos con caracteres especiales también en la vista de texto.
8 de diciembre de 2022
Problemas conocidos
El paquete UiPath.IntelligentOCR.Activities , v6.5.0, no se puede ejecutar con versiones de Studio anteriores a 2021.10.
Fecha de publicación: 9 de mayo de 2022
Nuevas funciones y mejoras
- Hemos trabajado duro para dar una nueva cara a algunos de nuestros asistentes; por tanto, la Estación de validación, la Estaciónde clasificacióny el Gestor de taxonomía ahora tienen una interfaz nueva que es muy fácil de usar y presenta múltiples funcionalidades nuevas.
- Algunas de las características que vale la pena mencionar de la Estación de validación son las puntuaciones de confianza que se muestran para cada campo extraído. Pueden ordenarse por OCR o por extractor y mostrarle exactamente la puntuación de confianza para cada campo extraído. La puntuación de confianza debe utilizarse solo como guía. Siempre puedes mejorar esa puntuación validando los datos manualmente.
- El asistente Estación de validación también tiene un encabezado rediseñado en el visor de PDF desde donde puedes elegir deslizar la vista del documento de izquierda a derecha, para ocultar los tokens extraídos para una vista limpia del documento o visualizar los accesos directos de teclado. No dudes más y pruébalo.
- El asistente Estación de clasificación se presenta con el mismo encabezado rediseñado en el visor de PDF que su par, la Estación de validación. Aquí, también puedes elegir mostrar el documento en el lado izquierdo o derecho de la pantalla, o puedes comprobar los accesos directos de teclado disponibles. La opción Rotar también está disponible en el nuevo encabezado, lo que hace que la manipulación de documentos sea más fácil que nunca.
- El asistente del Gestor de taxonomía tiene, entre otras mejoras, una nueva y particularmente útil: una opción Eliminar disponible en el encabezado del tipo de documento que también permite una eliminación masiva.
- El paquete UiPath.IntelligentOCR.Activities se ha actualizado a .NET5 Portable, lo que le permite ejecutarlos en robots Linux.
- Se ha optimizado el tamaño de MSI de UiPath Studio y el paquete UiPath.IntelligentOCR.Activities ya no es un paquete principal de MSI de UiPath, sino que es opcional. Todas las funcionalidades siguen siendo las mismas. El único cambio es que debe instalar manualmente el paquete en UiPath Studio.
- Se han actualizado la actividad Digitalizar documento y la actividad Clasificador inteligente de palabras clave y se ha sustituido la opción ForzarAplicación de OCR por la opción AplicarOcrOnPdf . Aplicar OCR en PDF tiene tres opciones disponibles en la lista desplegable: Verdadero, Falsoy Automático. Si se establece en Verdadero, el OCR se aplica a todas las páginas PDF del documento; si se establece en Falso, solo se extrae el texto mecanografiado digitalmente. El valor predeterminado es Automático, y determina si el documento requiere aplicar el algoritmo OCR en función del documento de entrada.
- En el asistente de Estación de clasificación , el valor de los grupos No clasificados ahora se establece como N / A.
- La obsolescencia de la actividad Extractor inteligente de formularios está prevista para octubre de 2022. Se recomienda utilizar la actividad Extractor de formularios .
- La actividad Extractor de formularios ahora puede procesar documentos con firmas detectadas.
Corrección de errores
- Se ha corregido un error que se producía en el asistente de la Estación de validación. Algunas fuentes asiáticas no se mostraban correctamente en el visor de PDF de la estación de validación.
- Se ha corregido un error que se producía al usar la actividad Digitalizar documento con UiPath Studio v19.10 y v20.10. Se produjo un error al intentar procesar los archivos
.tiff
. Ahora todo funciona según lo esperado. - Se ha corregido un error que se producía en la Estación de validación al usar la tecla de atajo TAB. En lugar de guardar los cambios, la tecla TAB revertía el campo al valor anterior. Ahora todo funciona según lo esperado.
- Se ha corregido un error que ocurría en la actividad Extractor de formularios . Se mostraba un mensaje de error incorrecto al importar una plantilla.
Problemas conocidos
Si utilizas Intel Xe GPU y el Gestor de taxonomía, la Estación de validación o Estación de clasificación no se muestra correctamente, te recomendamos actualizar el controlador gráfico a la última versión. Para obtener más información, consulta Soporte de Intel.Fecha de publicación: 19 de octubre de 2021
Mejoras
- El Gestor de taxonomía se ha revisado por completo, con una interfaz de usuario y una experiencia de usuario mejoradas. Ahora puede agregar tipos de documentos sin grupo o categoría, configurar colores y teclas de acceso rápido para campos, y más. Consulte la documentación para una descripción completa.
- El paquete UiPath.IntelligentOCR.Activities se ha actualizado a .NET5. Aunque ambas versiones de .NET siguen siendo compatibles, los proyectos .NET5 solo pueden funcionar en arquitecturas de 64 bits.
- El proceso de digitalización se ha mejorado para todo el marco a través de Document Understanding y Data Manager.
- Se han realizado mejoras para optimizar los resultados de OCR en documentos escaneados. Se obtienen los mejores resultados manteniendo el ángulo de inclinación entre +/- 20 grados.
- Se han mejorado las dimensiones de procesamiento de imágenes para obtener mejores resultados. Para que una imagen se digitalice / procese con éxito, sus dimensiones de ancho y alto deben estar entre 50 y 10 000 píxeles. Cualquier imagen por debajo o por encima de este rango debe ser rechazada, con un mensaje de excepción. Una imagen validada con las dimensiones mencionadas anteriormente y con un tamaño total superior a 14 MP se reducirá a 14 MP, manteniendo la relación de aspecto (relación ancho / alto).
- Se ha mejorado el sistema de mensajes de error de la Estación de validación y ahora, si el usuario rechaza un documento, se lanza una excepción de tipo
DocumentRejectedByUserException
y se detiene el proceso. - Se mejoró el tiempo de carga de la estación de validación para tipos de documentos con grandes taxonomías.
- Para las partes derivadas en la Estación de validación, los números con más de dos decimales ya no se redondean.
- Debido a las mejoras en los algoritmos de procesamiento de imágenes, pueden aparecer cambios en la digitalización de ciertos documentos.
- Se ha añadido una nueva casilla de verificación al asistente Gestor de plantillas, lo que te permite elegir si los sinónimos añadidos distinguen entre mayúsculas y minúsculas o no.
- Se ha actualizado el diseño del asistente del Gestor de plantillas al que se puede acceder desde las actividades Extractor inteligente de formularios y Extractor de formularios .
- Si experimenta tiempos de espera debido al largo tiempo de procesamiento, ahora puede usar el parámetro Tiempo de espera recién agregado para el Extractor de formularios y el Extractor inteligente de formularios para aumentar el tiempo de espera de la llamada de servicio.
- Si un campo se marca en las casillas Firma y Escrito a mano en el asistente del Administrador de plantillas de la actividad Extractor inteligente de formularios , aparece un mensaje emergente que le informa de que el campo solo se puede agregar en un cuadro, no en ambos.
- El asistente disponible para la actividad Clasificador inteligente de palabras clave se ha actualizado, lo que significa que al hacer clic en el botón Aceptar de los mensajes exportados ahora el usuario vuelve al asistente en lugar de cerrar el asistente.
- Las actividades Crear acción de validación de documento y Presentar estación de validación recibieron un nuevo parámetro, ShowOnlyRelevantePageRange. Esto te permite configurar la actividad para que solo muestre el rango de páginas capturado en la parte de clasificación del resultado de la extracción.
- Mejoras de rendimiento y memoria en la actividad Digitalizar documento .
- La referencia CefSharp se actualizó a la versión 92.0.260.
Corrección de errores
- Se ha corregido un error que se producía cuando el OCR se ejecutaba en diferentes formatos de región del sistema operativo. Ahora, el OCR se ejecuta según lo esperado y todos los resultados se generan correctamente, independientemente del formato de región del sistema operativo.
- Se corrigió un error en la actividad Exportar resultados de extracción que eliminaba la tabla extraída cuando un campo se marcaba como escrito a mano. Ahora, todo el resultado de la extracción se exporta como se esperaba.
- Se ha solucionado un problema relacionado con la estación de validación que provocaba un formato numérico inesperado al leer el valor de las partes derivadas.
- Se ha corregido un error en la actividad Esperar a la acción de validación que devolvía un error cuando el parámetro Resultado de extracción automática se establecía como vacío. Ahora la actividad se ejecuta como se esperaba, sin errores.
- Se ha solucionado un problema que provocaba un error en tiempo de ejecución cuando no se mostraban resultados de extracción en la actividad Mostrar estación de validación .
- Se ha solucionado un problema en la actividad Digitalizar documento que provocaba que la actividad se bloqueara cuando el parámetro ForzarAplicaciónOCR se establecía en Falso.
- Se ha solucionado un problema en el asistente del Gestor de plantillas que provocaba que no se extrajesen datos cuando se utilizaba la selección de tabla con el Extractor de formularios.
- Se ha corregido un problema que provocaba que no se extrajeran partes derivadas para un campo de fecha al procesar un documento específico.
- Se ha solucionado un problema en el asistente del Administrador de plantillas que provocaba que los anclajes no se resaltaran después de marcar una tabla.
- Se ha solucionado un problema que provocaba que la actividad de ámbito de extracción de datos produjese un error al indicar que los campos de la configuración de los extractores no se podían encontrar en la taxonomía, aunque los extractores se eliminaban del ámbito.
- Se ha solucionado un problema que provocaba que el asistente del Administrador de plantillas mostrara un error al intentar guardar una plantilla con ciertas palabras añadidas como prueba de página.
- Se ha solucionado un problema que impedía mostrar una Estación de validación vacía con procesamiento manual completo para la entrada de datos cuando el parámetro ResultadosDeExtracciónAutomáticos era nulo.
- Se ha corregido un error que ocurría cuando se incluían caracteres especiales en el archivo o nombre del depósito para cualquiera de las siguientes actividades: Crear acción de clasificación de documento, Esperar la acción de clasificación de documento, Crear acción de validación de documento, Esperar la acción de validación de documento. Ahora, todos los caracteres especiales de los nombres de archivos / depósitos están codificados como se esperaba.
- Se ha solucionado un problema que provocaba que no se extrajesen los campos de la firma y los escritos a mano debido al contraste de fondo. Ahora todos los campos se extraen correctamente, sin importar el color de fondo.
- Se ha corregido un error que provocaba que el motor OCR devolviera un error en ciertos sistemas con espacios abiertos.
- Se ha corregido un error que fusionaba el contenido extraído cuando se usaba la actividad Digitalizar documento con el motor OCR de documentos de UiPath . Ahora, cada elemento se extrae por separado.
Problemas conocidos
- Si desea utilizar cualquier actividad de OCR de este paquete en Studio v2019.10, instale el paquete UiPath.CoreIPC , versión 2.0.1 o superior.
- Si instalas el paquete UiPath.IntelligentOCR.Activities v5.0.0 en una máquina que utiliza Windows N/KN como sistema operativo, también se requiere el paquete Características multimedia. Consulta Lista de paquetes de características multimedia para ediciones de Windows N para obtener instrucciones de instalación para el paquete de características multimedia.
Fecha de publicación: 28 de mayo de 2021
Mejoras
Se mejoró el tiempo de carga de la estación de validación para tipos de documentos con grandes taxonomías.
Fecha de publicación: 16 de abril de 2021
Mejoras
Si experimenta tiempos de espera debido al largo tiempo de procesamiento, ahora puede usar el parámetro Tiempo de espera recién agregado para el Extractor de formularios y el Extractor inteligente de formularios para aumentar el tiempo de espera de la llamada de servicio.
Fecha de publicación: 29 de marzo de 2021
Nuevas características y mejoras
- Se han ampliado las capacidades del Extractor de formularios y el Extractor inteligente de formularios añadiendo reglas de extracción basadas en anclajes a nivel de campo. Además de los anclajes a nivel de página, ahora se pueden definir anclajes a nivel de campo en el Editor de plantillas , una nueva opción para definir los límites de un área personalizada de la que se extraerán los datos. A diferencia de las configuraciones a nivel de página, que definen las posiciones de los datos con respecto a todo el contenido de la página, las configuraciones basadas en anclajes ahora permiten la extracción de datos de destino en función de configuraciones a nivel de campo, lo que permite una mayor flexibilidad.
- Mejoras de rendimiento en la estación de validación.
- Se actualizó el sistema de diseño de Estación de validación y Estación de clasificación para una mejor experiencia de usuario.
- La Estación de validación, la Estaciónde clasificacióny el Administrador de plantillas ahora tienen un botón de tres estados, en el lado de la Vista del documento, que permite a los usuarios elegir entre diferentes modos de interacción del documento: Tokens (selecciones de palabras), Área personalizada (selección de área) y Opción en la selección (los usuarios pueden elegir entre tokens y área personalizada en cada selección).
- Las interfaces de usuario (Estación de validación, Estaciónde clasificacióny Administrador de plantillas)se han mejorado con un nuevo modo de selección en la vista de texto, que ahora permite a los usuarios realizar selecciones de la versión de texto de un documento de la misma manera que interactúan con la versión original. También se agregó una nueva tecla de acceso rápido, d + s, para ayudar a cambiar entre los modos de vista de documento original y texto.
- La Estación de validación muestra ahora un "recorte" del documento original, cuando asigna un valor a un campo de datos, bajo el valor de texto informado seleccionado. Esto ayuda a localizar y verificar un valor de campo específico con el área de valor en el documento.
- Se ha cambiado el cálculo de confianza para que el clasificador inteligente de palabras clave sea escalable con la longitud de los vectores de palabras.
- Se ha añadido la casilla de verificación IncluirConfianzaDeOCR al panel de propiedades de la actividad Exportar resultados de extracción . Si se selecciona, la información exportada también contendrá la confianza de OCR para cada valor.
- Algoritmos mejorados de procesamiento de letras y palabras para evitar informar de caracteres o palabras duplicados en ciertas situaciones.
- Clasificar ámbito de documento y Entrenar el ámbito de los clasificadores ahora admiten las capacidades del clasificador.
- Clasificar ámbito de documento se ha optimizado para realizar llamadas secuenciales a los clasificadores en su ámbito, con solo los rangos de páginas que no están clasificados por un extractor anterior.
Corrección de errores
- Se ha solucionado un problema que provocaba un error de tiempo de ejecución en casos específicos cuando una actividad de Extractor de formularios y una actividad de Extractor inteligente de formularios estaban en el mismo ámbito de extracción de datos.
- Se ha solucionado un problema que impedía que se produjeran errores del clasificador en casos específicos, pero la clasificación fallaba silenciosamente.
- Se ha solucionado un problema que provocaba que no se extrajesen las partes derivadas de un campo numérico al procesar un documento específico.
- Se ha solucionado un problema en Digitalizar documentoque provocaba que la actividad procesara las páginas del documento incluso después de informar de una excepción, aumentando así el tiempo de ejecución general en los casos de fallo.
- Se corrigió un error que no permitía la configuración correcta de las expresiones Regex en el extractor basado en Regex, en proyectos C # y otras situaciones muy específicas.
- Se ha solucionado un problema de rendimiento que aparecía en la Estación de validación y el Editor de plantillascuando un tipo de documento contenía más de 200 campos.
- Se ha corregido un error por el que, en determinadas situaciones, los números se fusionaban en un solo valor numérico informado.
- Se ha solucionado un problema por el que, en determinadas situaciones, la actividad Esperar la acción de validación de documentos y Reanudar generaba una excepción al comunicarse con depósitos de almacenamiento.
Problemas conocidos
Las actividades Crear clasificación de documentos, Crear acción de validación de documentos y Esperar a la clasificación de documentos y reanudar ,Esperar a la validación de documentos y reanudar no funcionan con depósitos de almacenamiento en los que se ha habilitado el acceso a datos a través de Orchestrator.Fecha de publicación: 28 de mayo de 2021
Mejoras
Se mejoró el tiempo de carga de la estación de validación para tipos de documentos con grandes taxonomías.
Fecha de publicación: 3 de febrero de 2021
Mejoras
Mejora el rendimiento de la Estación de validación.
Fecha de lanzamiento: 11 de enero de 2021
Mejoras
Mejora de la carga de archivos desde las acciones Crear validación de documentos y Crear clasificación de documentos en el bucket de almacenamiento alojado en AWS.
Fecha de publicación: 12 de noviembre de 2020
Nuevas características y mejoras
- Referencia de CefSharp actualizada a la versión 84.4.10.
- Puntos finales actualizados de la siguiente manera:
- Extractor de formularios - de
https://formextractor.uipath.com
ahttps://du.uipath.com/svc/formextractor
- Extractor inteligente de formularios - de
https://intelligentforms.uipath.com
ahttps://du.uipath.com/svc/intelligentforms
- Clasificador inteligente de palabras clave : de
https://intelligentkeywords.uipath.com
ahttps://du.uipath.com/svc/intelligentkeywords
- Extractor de formularios - de
- Se realizaron mejoras en la estación de validación en modo de tabla de puntuación.
Corrección de errores
Se ha solucionado un problema de la acción de clasificación de documentos de clasificación relacionado con la caducidad del token al portador.Fecha de publicación: 20 de octubre de 2020
Mejoras
Registro de errores más detallado para el Extractor de formularios, el Extractor inteligente de formularios y el Clasificador inteligente de palabras clave.
Corrección de errores
- Análisis de direcciones mejorado.
- Se ha solucionado un problema por el que las actividades Extractor de formularios, Extractor inteligentede formularios y Clasificador inteligente de palabras clave no podían utilizar todas las habilidades.
Fecha de lanzamiento: 5 de octubre de 2020
Nuevas características y mejoras
Nuevas actividades
Las siguientes actividades se han incluido en el paquete:
- Mostrar estación de clasificación : diseñada para clasificar y separar archivos según el tipo de documento.
- Crear acción de clasificación de documentos y Esperar la clasificación y reanudación de documentos : diseñado para la integración con Orchestrator.
- Clasificador inteligente de palabras clave y Entrenador del clasificador inteligente de palabras clave: diseñados para clasificar, dividir y entrenar paquetes de documentos en tipos de documentos individuales.
Estación de validación
Para identificar fácilmente la información en la Estación de Validación, se agregaron códigos de colores a las tarjetas de campo y tokens o áreas personalizadas. Cada tarjeta de campo tiene un código de color predeterminado, mientras que los tokens o áreas personalizadas obtienen el mismo código de color que la tarjeta de campo a la que están asignadas.
Se han agregado nuevos atajos a la Estación de Validación que permiten al usuario mover una línea seleccionada de una tabla hacia arriba, abajo, izquierda o derecha. Además, cuando se realizan selecciones en la Estación de validación, estas se pueden asignar a un campo específico utilizando atajos a nivel de campo. Cada tarjeta de campo tiene una clave asociada. Cuando no se realiza ninguna selección, puede usar atajos a nivel de campo para pasar de una tarjeta de campo a otra.
Para los campos de la tabla de Estación de validación , se agregó una marca de verificación en el nivel de fila. Ahora puede verificar todos los campos de una fila seleccionando la marca de verificación o se verificará automáticamente cuando visite todos los campos.
Se han actualizado los tokens de la estación de validación . Por lo tanto, los tokens resaltados tienen un borde inferior rojo y los tokens seleccionados tienen un borde de guiones.
Los valores de campo sin referencia ahora son compatibles con la Estación de validación. Los usuarios pueden asignar valores a campos que no tienen una referencia en el documento. Para hacerlo, mientras el usuario crea un campo en el Gestor de taxonomía, la casilla de verificación Requiere referencia debe estar desmarcada.
Estación de clasificación
Se crearon nuevos atajos para la Estación de clasificación que permiten al usuario navegar por los tipos de documentos; añadir, cambiar, eliminar o resaltar una referencia; mover todas las páginas hacia arriba o hacia abajo; dividir después de la página seleccionada; descartar los cambios; guardar informar como excepción.
Además de usar el menú de tipo de documento, ahora también se puede eliminar una referencia a nivel de página al pasar el cursor sobre una página y hacer clic en el icono azul en la esquina inferior derecha. El icono también permite resaltar la referencia.
Visor de PDF en la estación de clasificación y la estación de validación
El botón Girar se agregó al visor de PDF. Al hacer clic en el botón, la página del documento actual girará en el sentido de las manecillas del reloj.
El modo de selección está habilitado por defecto en el Visor de PDF.
Otras actividades
Las actividades Extractor inteligente de formularios y Extractor de formularios ahora pueden incorporar plantillas importadas que tienen el mismo nombre pero un contenido diferente a las que ya están disponibles. Se analiza cada plantilla y se muestra un mensaje de advertencia para cada caso.
La propiedad PrioridadDeAcción de la actividad Crear acción de validación de documento ahora admite expresiones y variables.
Los términos RutaDeCarpetaDeDepósito y RutaDeCarpetaDeDirectorio se cambiaron a RutaDeDirectorioDeDepósito y RutaDeDirectorioDeDescarga para la actividad Crear acción de validación de documentos , respectivamente La razón es para separar claramente el concepto de "Carpeta" de Orchestrator.
Fecha de publicación: 24 de agosto de 2020
Corrección de errores
- Se ha solucionado un problema que, en algunos casos, devolvía un mensaje de error
407ProxyAuthenticationRequired
para las solicitudes de autenticación de Kerberos o NTLM. Esto se aplica al Extractor de formularios, el Extractor inteligente de formularios y el Clasificador inteligente de palabras clave. - Se ha solucionado un problema que provocaba que el Extractor inteligente de formularios no mostrara correctamente los errores de tiempo de espera.
- Se agregaron las traducción que faltaban para ciertas cadenas de la estación de validación .
- Se ha solucionado un problema que provocaba que el ámbito de extracción de datos arrojase un error al anular la selección de un campo de la tabla.
Fecha de lanzamiento: 24 de junio de 2020
Corrección de errores
- Se ha solucionado un problema que provocaba problemas de sincronización entre la ventana de configuración y el panel de propiedades para la acción Esperar la validación del documento y la actividad Reanudar .
- Se ha solucionado un problema por el que, en algunas situaciones, los campos de la tabla se guardaban por error como multivalores en la taxonomía.
Fecha de publicación: 2 de junio de 2020
Mejoras
El paquete UiPath.IntelligentOCR.Activities se actualizó para hacer referencia a la biblioteca más reciente de Uipath Vision.
Fecha de Lanzamiento: 4 de mayo de 2020
Nuevas características y mejoras
- Esta versión ofrece muchas actividades nuevas e interesantes, como Crear acción de validación de documentoy Esperar la acción de validación de documento y reanudar , que se pueden usar para crear, suspender y reanudar los flujos de trabajo de orquestación en UiPath Action Center.
- Dos nuevos extractores están aquí para ayudarle. Puede encontrarlos con el nombre de Extractor de formularios y Extractor inteligente de formularios. Ambas actividades pueden extraer información de documentos de formularios fijos basados en plantillas predefinidas, con la diferencia de que el Extractor inteligente de formularios también se puede configurar para interpretar campos firmados o escritos a mano. Puedes extraer información de cualquier tipo de campo, incluidas las tablas, y crear reglas de extracción de tablas personalizadas mediante el asistente del Gestor de plantillas .
- Mientras se usa la actividad Extractor inteligente de formularios , si se ha superado el número de campos escritos a mano, se muestra una advertencia directamente en el flujo de trabajo. Esto no impide que el usuario ejecute el flujo de trabajo.
- La actividad Extractor basado en expresiones regulares recibió una nueva opción denominada
UseVisualAlignment
que se puede usar para diseños complejos en los que es más fácil para los usuarios escribir expresiones regulares basadas en cómo se organizan visualmente las palabras en líneas, ignorando cualquier oración, párrafo o grupo de diseño de lo contrario identificado en el documento. - Puede definir una expresión regular para identificar el área de la tabla, una expresión regular para identificar una fila de la tabla en esa área y expresiones regulares para identificar columnas específicas en las filas de la tabla.
- Presentar estación de validación y su asistente incluyen muchas funciones nuevas y mejoradas.
- El asistente de Estación de validación tiene ahora un nuevo botón llamado Descartar cambios. Puede usarla para confirmar o descartar cualquier cambio realizado en la Estación de validación. La función se puede utilizar en cada tipo de documento individualmente.
- El asistente también tiene una nueva opción llamada Mostrar sugerencias que te permite seleccionar un valor de varios candidatos si los extractores utilizados informan de múltiples valores posibles.
- La lista de accesos directos disponibles en la Estación de validación se ha mejorado con uno nuevo,
f+a
, que le permite añadir un nuevo valor en un campo de varios valores. - Se han realizado mejoras en la actividad Digitalizar documento que ahora puede identificar mejor las casillas de verificación en un documento.
- La actividad Digitalizar documento también tiene una nueva opción llamada ForceApplyOCR. Cuando se selecciona, aplica el motor OCR a todas las páginas del documento, incluido el PDF nativo.
- La actividad Ámbito de extracción de datos ahora puede leer automáticamente las capacidades del extractor (taxonomías internas) si el extractor las declara. Esto simplifica el paso de configuración al exponer los campos conocidos del extractor. El extractor con aprendizaje automático ahora admite esta nueva funcionalidad, lo que la hace muy fácil de usar y configurar.
- La actividad Exportar resultados de extracción ha recibido una nueva opción denominada IncluirConfianza. Si se selecciona, se proporciona el nivel de confianza.
- Los asistentes de extracción y configuración ahora admiten la selección de campos en masa para tipos de documentos y campos de tablas.
Fecha de lanzamiento: 14 de enero de 2020
Corrección de errores
- Se ha solucionado un problema que provocaba que el asistente de la Estación de validación mostrara incorrectamente las preferencias de la tabla cuando se usaba la opción Extraer nueva tabla .
- Se ha solucionado un problema que devolvía un error cuando el asistente de la estación de validación se ejecutaba con la actividad de aviso encadenada antes o después. Ahora la actividad se ejecuta como se esperaba.
- Se ha solucionado un problema que provocaba que la actividad Ámbito de extracción de datos arrojase un error cuando se ejecutaba con una cultura de máquina personalizada y la opción FormatearValoresSiPosible seleccionada. Ahora la actividad se ejecuta como se esperaba.
- Se ha solucionado un problema que provocaba algunos problemas de rendimiento cuando se seleccionaban grandes cantidades de texto en la opción Vista de texto del asistente de Estación de validación . Ahora, la opción Vista de texto muestra el texto como se esperaba.
- Se ha solucionado un problema que provocaba que la actividad Ámbito de extracción arroje un error cuando se ejecutaba con un extractor sin una taxonomía interna establecida y se añadía un nuevo campo a la taxonomía del proyecto. Ahora la actividad se ejecuta como se esperaba.
- En ciertas máquinas, los documentos girados no se mostraban correctamente al usar la Estación de validación.
Fecha de lanzamiento: 6 de diciembre de 2019
Cambios de última hora
- Se produjeron actualizaciones importantes para el paquete UiPath.IntelligentOCR.Activities. Todas las actividades utilizadas para trabajar con las familias de productos FineReader y FlexiCapture Abbyy se han trasladado a un paquete independiente denominado UiPath.Abbyy.Activities. Esto ha llevado a un cambio disruptivo para el paquete UiPath.IntelligentOCR.Activities, que provocó que la versión se saltara desde v3.1.0 a v4.0.0. La siguiente lista muestra las actividades que se movieron desde el paquete UiPath.IntelligentOCR.Activities al UiPath.Abbyy.Activities:
Problemas conocidos
- El paquete UiPath.Abbyy.Activities no se puede utilizar con versiones anteriores a la v19.11 para el paquete UiPath.UIAutomation.Activities e inferiores a la v4.0.0 para el paquete UiPath.IntelligentOCR.Activities .
- Si después de actualizar un flujo de trabajo a los nuevos UiPath.IntelligentOCR.Activities v4.0.0 y UiPath.Abbyy.Activities v1.0.0 encuentra errores de validación en tiempo de ejecución, fuerza un nuevo guardado en el archivo
.xaml
haciendo un pequeño cambio y luego revirtiendo que Esto puede ocurrir para flujos de trabajo que utilizan actividades FlexiCapture. - Los flujos de trabajo creados o actualizados a UiPath.IntelligentOCR.Activities v4.0.0 no se pueden degradar a una versión inferior de UiPath.IntelligentOCR.Activities .
Corrección de errores
Se lanzaba una excepción cuando la actividad Digitalizar documento se utilizaba junto con el OCR de OmniPage para documentos con caracteres especiales incluidos en el paquete del motor ampliado. El problema se solucionó y ahora la actividad se ejecuta como se esperaba.Fecha de lanzamiento: 25 de noviembre de 2019
Mejoras
Se realizaron mejoras de rendimiento para el procesamiento de archivos dentro del marco de procesamiento de documentos, para el paquete UiPath.IntelligentOCR.Activities .
Fecha de lanzamiento: 25 de noviembre de 2019
Mejoras
Se realizaron mejoras de rendimiento para el procesamiento de archivos dentro del marco de procesamiento de documentos, para el paquete UiPath.IntelligentOCR.Activities .
Fecha de lanzamiento: 8 de noviembre de 2019
Nuevas características y mejoras
- Está disponible una nueva actividad destinada a ayudarte a organizar y gestionar mejor tus clasificadores entrenables: Entrenador de clasificadores basados en palabras clave. Esta actividad solo se puede utilizar junto con la actividad Entrenar el ámbito de los clasificadores .
- El asistente de la Estación de validación ha recibido una actualización importante y ahora está disponible para explorar su máximo potencial. Este asistente solo está disponible cuando la actividad Presentar estación de validación se utiliza en un flujo de trabajo. Puede usar la versión actualizada para beneficiarse de una nueva interfaz fácil de usar, navegar por el documento mientras usa los atajos de teclado o seleccionar una o varias palabras o un área personalizada. Puede marcar fácilmente un campo como ausente, extraer nuevos datos, editar una tabla o extraer una nueva tabla. Puede hacer todas estas cosas maravillosas con el asistente de la Estación de validación utilizando un tema oscuro.
- Una de las mejoras incluidas en esta versión es que la actividad del clasificador basado en palabras clave recibió un nuevo parámetro llamado LearningData. Además de especificar dónde se encuentran los datos del archivo de aprendizaje, ahora también puedes usar la cadena que contiene los datos del clasificador serializado. Esta actividad se mejoró con un asistente llamado Gestionar aprendizaje del clasificador basado en palabras clave que puede utilizarse para configurar y gestionar las palabras clave utilizadas para identificar tipos de documentos específicos.
- Tanto las actividades del Clasificador basado en palabras clave como el Entrenador del Clasificador basado en palabras clave ahora pueden administrar varias palabras clave. Una vez seleccionados los conjuntos de palabras clave, la extracción se basa en una coincidencia completa de las palabras seleccionadas.
- Otra gran mejora es que la salida
DocumentObjectModel
, incluida en la actividad Digitalizar documento , ahora admite políticas de palabras, además de cuadros horizontales de palabras. - El asistente del Gestor de taxonomía recibió una nueva barra de desplazamiento que incorpora todos los elementos de la IU y proporciona una mejor experiencia de usuario.
- Las actividadesÁmbito de extracción de datos, Entrenar el alcance de los extractores, Entrenar el alcance del clasificadory Clasificar ámbito de documento ahora organizan sus extractores y clasificadores en orden horizontal, reemplazando el orden vertical anterior.
- La actividad Extractor basado en expresiones regulares se ha mejorado y ahora puede procesar y devolver valores múltiples. La salida solo es visible cuando la actividad se usa junto con la Estación de validación.
- Cuatro nuevos idiomas, turco (TR), portugués (PT), español (ES) y Spanish-México (ES-MX) están disponibles para el paquete UiPath.IntelligentOCR.Activities.
Problemas conocidos
.xaml
. Si no hay archivos abiertos al acceder al Gestor de taxonomía, se mostrará una ventana de grabación y el Gestor de taxonomía solo se mostrará después de cerrar la ventana de grabación.
Corrección de errores
- An exception was thrown when using the Data Extraction Scope activity together with a Try Catch activity. The issue was fixed and now the activity is executed as expected.
- Cuando un campo booleano se estableció en No en la Estación de validación, el archivo de salida debería haber mostrado el resultado como No , pero en su lugar lo muestra como ausente. El problema se solucionó y ahora el archivo de salida muestra el resultado correcto.
- Se ha corregido el análisis de números incorrecto que se producía cuando el ámbito de extracción de datos intentaba analizar los números en los documentos utilizando un formato de número diferente al de la cultura del documento.
- Cuando se utilizan varias Estaciones de validación, el orden de las partes derivadas no se respeta en los resultados validados. El problema se solucionó y ahora los resultados muestran las partes derivadas en el mismo orden en que se introdujeron.
- Las diferencias entre los cuadros con la selección personalizada se producían cuando los resultados de una estación de validación se ejecutaban a través de una segunda estación de validación. El problema se solucionó y ahora no hay diferencias entre los cuadros con selección personalizada.
- Cuando la actividad Digitalizar documento se usaba junto con el motor de OCR de Computer Vision de Microsoft Azure , la rotación no funcionaba cuando el parámetro Reconocimiento de escritura manual se establecía como Verdadero. El problema se solucionó y ahora la información se procesa correctamente.
- Al usar la actividad Digitalizar documento , se produjo un error al intentar procesar imágenes con mucho texto. El error se ha solucionado mejorando el proceso de escalado.
- Se ha solucionado un problema que se producía al intentar entrenar la actividad del clasificador basado en palabras clave en el ámbito del entrenamiento y la extracción se ejecutaba sin una referencia de clasificación. El problema se solucionó y ahora el hecho de que no haya información de aprendizaje solo se registra, no se arroja como un error.
- Se produjo un error al usar la actividad Extractor de FlexiCapture y se le dio el mismo nombre tanto a una columna de la tabla como a un campo. El problema se solucionó y el archivo
.fcdot
ahora se procesa como se esperaba.
- v6.26.0
- Novedades
- Mejoras
- Corrección de errores
- v6.24.0
- Habilitar los controles de derecha a izquierda en la Estación de validación
- Validación mejorada con Estación de validación compacta
- Validar documentos en Action Center utilizando las aplicaciones de UiPath®
- Usar etiquetas y versiones para proyectos modernos de Document Understanding
- Capacidades de extracción mejoradas utilizando nuevos extractores generativos
- Mejoras
- Corrección de errores
- v6.22.1
- Mejoras
- Corrección de errores
- v.6.9.8
- v6.14.3
- Corrección de errores
- v6.19.7
- Corrección de errores
- v6.22.0
- Novedades
- Soporte para actividades de una configuración local
- Soporte de IntelligentOCR para proyectos modernos
- OCR de idiomas ampliados
- Corrección de errores
- Próximas obsolescencias
- v6.19.6
- v6.19.5
- Corrección de errores
- v6.0.2
- v6.5.4
- v6.19.3
- v6.14.2
- v6.19.2
- Corrección de errores
- v6.19.1
- Corrección de errores
- v6.19.0
- Novedades
- Mejoras
- Corrección de errores
- Problemas conocidos
- v6.14.1
- Nuevas funciones y mejoras
- v6.9.5
- v6.9.4
- v6.9.3
- v6.9.2
- v6.5.3
- v6.5.2
- v6.9.1
- Corrección de errores
- v6.9.0
- Nuevas funciones y mejoras
- Corrección de errores
- Cronología de la obsolescencia
- v6.5.1
- Nuevas funciones y mejoras
- v6.6.0
- Nuevas funciones y mejoras
- Corrección de errores
- v6.5.0
- Nuevas funciones y mejoras
- Corrección de errores
- 8 de diciembre de 2022
- v6.0.1
- Nuevas funciones y mejoras
- Corrección de errores
- Problemas conocidos
- v5.0.2
- Mejoras
- Corrección de errores
- Problemas conocidos
- v4.13.2
- Mejoras
- v4.13.1
- Mejoras
- v4.13.0
- Nuevas características y mejoras
- Corrección de errores
- Problemas conocidos
- versión 4.10.5
- Mejoras
- v4.10.4
- Mejoras
- v4.10.3
- Mejoras
- v4.10.2
- Nuevas características y mejoras
- Corrección de errores
- v4.10.1
- Mejoras
- Corrección de errores
- v4.10.0
- Nuevas características y mejoras
- v4.5.2
- Corrección de errores
- v4.5.1
- Corrección de errores
- v1.3.2
- Mejoras
- v4.5.0
- Nuevas características y mejoras
- v4.0.1
- Corrección de errores
- v4.0.0
- Cambios de última hora
- Problemas conocidos
- Corrección de errores
- v2.0.2
- Mejoras
- v1.3.1
- Mejoras
- v3.1.0
- Nuevas características y mejoras
- Problemas conocidos
- Corrección de errores