activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática.
UiPath logo, featuring letters U and I in white
Actividades de Document Understanding
Last updated 21 de nov. de 2024

Acerca del paquete de actividades IntelligentOCR

UiPath.IntelligentOCR.Activities contiene la infraestructura para habilitar los flujos de procesamiento de documentos utilizando un enfoque completo, abierto y extensible.

Reemplazar versiones eliminadas

La siguiente tabla muestra las versiones del paquete que se eliminaron y la versión recomendada que se utilizará, en su lugar.

Tabla 1. Las versiones eliminadas y sus reemplazos recomendados
 

Versión recomendada

4.3.0 vista previa | 4.4.0 vista previa

4.5.2

2.1.0 | 2.2.0 | 2.3.0

4.0.1

1.4.0 | 1.5.0 | 1.6.0 | 1.6.1 | 2.0.0 | 2.0.1

2.0.2

1.2.0 | 1.2.1 | 1.3.0

1.3.2

Importante

  • A partir de la versión v6.19.0 , al instalar el paquete UiPath.IntelligentOCR.Activities en un proyecto, el paquete UiPath.DocumentUnderstanding.ML.Activities también se instala automáticamente y no es necesario instalarlo por separado.
  • Si utilizas UiPath® Studio 2023.4.4 o anterior, asegúrate de instalar la última versión de Windows .NET 6.0 Desktop Runtime.

Compatibilidad de versiones

Actualizar UiPath.IntelligentOCR.Activities también requiere una actualización para el paquete UiPath.UIAutomation.Activities y para el paquete UiPath.OCR.Activities si está incluido en el proyecto.

UiPath.IntelligentOCR.Activities y UiPath.DocumentUnderstanding.Activities no deben utilizarse juntos en el mismo proyecto. El paquete UiPath.IntelligentOCR.Activities debe utilizarse para los flujos de trabajo de Windows (o Legacy), mientras que el paquete UiPath.DocumentUnderstanding.Activities debe utilizarse para los flujos de trabajo multiplataforma.

Formatos compatibles

El paquete de actividades de IntelligentOCR puede admitir cualquiera de los siguientes tipos de archivos: .png, .gif, .jpe, .jpg, .jpeg, .tiff, .tif, .bmp y .pdf.

Compatibilidad con el lenguaje de proyecto C#

A partir de la versión 4.10.0, este paquete de actividades está validado para su uso en proyectos C #.

Funcionalidades

Esta sección muestra las múltiples funcionalidades del paquete Intelligent.OCR.

Digitalizar documentos

Puede hacerlo utilizando la actividad Digitalizar documento . Esto recupera el texto de cualquier PDF o imagen, usando, solo si es necesario, el motor OCR de tu elección.

A medida que los documentos se procesan uno por uno, pasan por el proceso de digitalización. La diferencia con los documentos no digitales (escaneados) es que debe aplicar el motor de OCR de su elección. Los resultados de este paso son el Modelo de objeto de documento y una variable de cadena que contiene todo el texto del documento y se transmiten a los siguientes pasos.

Clasificar documentos

Puede hacerlo utilizando la actividad Clasificar documento . Esto permite identificar qué tipo de documento es un archivo utilizando cualquier algoritmo de clasificación.

Después de la digitalización, el documento se clasifica. Si trabajas con varios tipos de documentos en el mismo proyecto, para extraer los datos correctamente necesitarás saber con qué tipo de documento estás trabajando. Lo importante es que puede usar múltiples clasificadores en el mismo ámbito, puede configurar los clasificadores y, más adelante en el marco, entrenarlos. Los resultados de la clasificación ayudan a aplicar la estrategia correcta en la extracción.

La siguiente lista muestra los clasificadores disponibles:

Validar la clasificación automática

Puede hacerlo mediante la actividad Attended estación de clasificación a la que se ha asistido, que presenta una interfaz de usuario específica de procesamiento de documentos para validar y corregir las salidas de clasificación automáticas.

Especialmente para los casos en los que se requiere la división de archivos, se recomienda encarecidamente utilizar el paso de validación de la clasificación humana para garantizar que el procesamiento posterior para la extracción de datos funciona correctamente.

Una alternativa a la actividad atendida está disponible mediante el uso de flujos de trabajo de larga duración, que están diseñados para habilitar de forma óptima la colaboración humano-robot. Las actividades Crear acción de clasificación de documentos y Esperar la acción de clasificación de documentos y reanudar habilitan este escenario.

Entrenar a los clasificadores

Puede hacerlo mediante la actividad Entrenar el ámbito de los clasificadores . Esto permite cerrar el bucle de retroalimentación a cualquier algoritmo de clasificación capaz de aprender. Arrastre y suelte sus entrenadores de clasificadores dentro de esta actividad de Ámbito y habilítelos usando el asistente Configurar clasificadores para asegurarse de que sus clasificadores utilicen la información validada por humanos a través de la Estación de clasificación o la Estación de validación para mejorar su propio rendimiento.

La clasificación es tan eficiente como los clasificadores utilizados. Si un documento no se ha clasificado correctamente, los clasificadores activos lo desconocen. El marco proporciona la oportunidad de entrenar a los clasificadores para mejorar el reconocimiento de las clases de documentos.

La siguiente es una lista de los entrenadores de clasificadores disponibles:

Extraer datos de documentos

Puede hacerlo mediante la actividad Ámbito de extracción de datos . Esto permite el uso de cualquier algoritmo de extracción de datos para identificar diferentes campos en un documento clasificado.

La extracción consiste en obtener solo los datos que le interesan de un tipo de documento determinado. Por ejemplo, extraer datos específicos de un documento de 5 páginas es bastante problemático si se quiere manipular cadenas. En este marco, puedes utilizar diferentes extractores, para las diferentes estructuras de documentos, en el mismo ámbito de extracción de datos. Los resultados de la extracción se pasan posteriormente para su validación.

La siguiente es una lista de extractores disponibles:

Validar los resultados de la extracción automática de datos

Puede hacerlo mediante la actividad Presentar estación de validación Attended , que presenta una interfaz de usuario específica de procesamiento de documentos para la validación y corrección de datos.

  • Los datos extraídos pueden ser validados por un usuario humano a través de la Estación de Validación. Una práctica recomendada es crear una lógica en torno a la decisión de añadir o no un paso de validación humana, con reglas dependiendo del caso de uso específico que se vaya a implementar. Los resultados de la validación pueden exportarse y utilizarse en otras actividades de automatización.
  • También puedes habilitar la validación humana a través de flujos de trabajo de larga duración, optimizando la colaboración humano-robot, utilizando las actividades Crear acción de validación de documentos y Esperar a la acción de validación de documentos y reanudar.

Extractores de trenes

Puede hacerlo mediante la actividad Entrenar el ámbito de los extractores . Esto permite cerrar el bucle de retroalimentación a cualquier algoritmo de extracción de datos capaz de aprender. Arrastre y suelte los entrenadores de extractores dentro de esta actividad de Ámbito y habilítelos usando el asistente Configurar extractores para asegurarse de que sus extractores utilicen la información validada por humanos a través de la Estación de validación para mejorar su propio rendimiento.

La extracción es eficiente como lo son los extractores. Si los valores de campo no se extrajeron correctamente, significa que los extractores activos los desconocían. El marco proporciona la oportunidad de entrenar a los extractores para mejorar el reconocimiento de los valores de campo.

El Entrenador de extractor con aprendizaje automático cierra el bucle de retroalimentación para la extracción de datos basada en ML, al recopilar los datos necesarios para reentrenar un modelo de aprendizaje automático alojado en AI Center. Esta actividad es complementaria del Extractor con aprendizaje automático y forma parte del paquete UiPath.DocumentUnderstanding.ML.Activities .

Exportar la información extraída

Puede hacerlo utilizando la actividad Exportar resultados de extracción . Esto le permite exportar la estructura compleja de los datos extraídos a un DataSet simple (colección de DataTables).

Una vez que tenga su información validada, puede usarla tal como está o guardarla en un formato de tabla de datos que se puede convertir muy fácilmente en un archivo de Excel.

El paquete UiPath.IntelligentOCR.Activities es compatible con cualquier clasificación personalizada o actividad de extracción de datos que se cree en función del paquete público UiPath.DocumentProcessing.Contracts . Ofrece total flexibilidad para crear tu propio algoritmo específico para tu caso de uso, además de integrarlo con cualquier solución de terceros para la clasificación de documentos y la extracción de datos.

Las siguientes versiones del paquete se han eliminado de la transmisión oficial. Si tiene algún problema, póngase en contacto con nuestros equipos de soporte.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.