Extracción y Procesamiento Inteligentes (IXP): consumir modelos a través de un flujo de trabajo

ixp

latest

false

Guía del usuario de Documentos complejos y no estructurados

Información general
Creación de modelos
Validación del modelo
Implementación del modelo
Consumir modelos
- Consumir modelos a través de un flujo de trabajo
- Consumir modelos a través de la API de Document Understanding
API
- Eventos de auditoría de API
Preguntas frecuentes
- Preguntas frecuentes

Importante :

La localización de contenidos recién publicados puede tardar entre una y dos semanas en estar disponible.

Consumir modelos a través de un flujo de trabajo

Puedes consumir las predicciones de una versión publicada del modelo de documentos complejos y no estructurados creando un flujo de trabajo en UiPath Studio.

Información general

Crear un flujo de trabajo de documentos complejos y no estructurados de Extracción y Procesamiento Inteligentes (IXP) generalmente implica los siguientes pasos:

Instalación del paquete
Definición de taxonomía
Digitalización de documentos
Clasificación de documentos
Extracción de documentos
Validación del documento

Nota:

El paso de definición de taxonomía solo se aplica a los proyectos de Windows, no a los multiplataforma. Si quieres saber en qué se diferencian los tipos de proyectos, consulta las siguientes secciones.

Requisitos previos

Debes tener un modelo publicado en un proyecto de Documentos complejos y no estructurados.

Al empezar a crear tu flujo de trabajo de Studio, debes decidir qué tipo de proyecto quieres ejecutar: Windows o multiplataforma. Cada tipo de proyecto necesita paquetes diferentes.

Independientemente del tipo de proyecto que elijas, puedes instalar los paquetes:

Automáticamente: utiliza la plantilla de proceso de Document Understanding.Para obtener más información sobre cómo buscar e instalar plantillas en Studio, consulta Plantillas de proyecto.
Manualmente: para obtener más detalles, consulta Instalar paquetes.Si eliges instalar manualmente los paquetes, asegúrate de instalar las siguientes versiones o más recientes, en función del tipo de proyecto:

Ventanas

UiPath.IntelligentOCR.Activities 6.22.0
UiPath.System.Activities 24.10.6

Multiplataforma

UiPath.DocumentUnderstanding.Activities 2.12.0
UiPath.System.Activities 24.10.6

Nota:

El paquete IntelligentOCR es compatible con los proyectos de Windows, no con los multiplataforma.
Puedes crear flujos de trabajo multiplataforma y utilizar otras plantillas en Studio Web.

Crear un flujo de trabajo de IXP para proyectos de Windows

Las secciones que siguen contienen los pasos que debes aplicar si eliges no utilizar una de las plantillas de Studio y comienzas desde cero.

Para crear un flujo de trabajo de IXP para proyectos de Windows, haz lo siguiente:

Nota:

Los nombres de variables utilizados en las siguientes secciones son solo ejemplos. Puedes nombrar tus variables según tus propias convenciones.

1. Instalar los paquetes

Asegúrate de instalar los paquetes mencionados en la sección Requisitos previos.

2. Definir la taxonomía

Crea un proceso básico en Studio Desktop.
Cuando configures tu proceso, selecciona en el campo Compatibilidad el tipo de flujo de trabajo que quieres crear: Windows o multiplataforma. Para obtener más información, consulta Acerca de los proyectos de automatización.
Abre el Gestor de taxonomía desde la pestaña Diseño y configura los campos de tu tabla de la siguiente manera:
- Crea un campo de tabla para cada grupo de campos en la taxonomía de tu proyecto de Extracción y Procesamiento Inteligentes (IXP).
- Añade una columna en el campo de la tabla respectiva para cada campo definido en el grupo de campos.
Nota:
Gestor de taxonomía:
- admite la creación de tablas y campos. Al crear flujos de trabajo de Documentos complejos y no estrucutrados de Extracción y Procesamiento Inteligentes (IXP) te recomendamos que crees campos de tabla en lugar de solamente campos.
- solo está disponible cuando está instalado el paquete IntelligentOCR. Esto significa que solo está disponible en proyectos de Windows, y no en los multiplataforma.
A continuación, debes disponer de una ubicación en la que puedas leer documentos. Por ejemplo, en la carpeta del proyecto, crea una nueva carpeta llamada documentos y añade algunos archivos.
En la Secuencia, añade una actividad Asignar para especificar de dónde quieres leer los documentos. Configura los siguientes campos:
- Guardar en: crea y añade una variable de tipo System.String[]. En este ejemplo, la variable se llama docs.
- Valor para guardar: añade Directory.GetFiles("./documents").
Añade una actividad Cargar taxonomía para almacenar la taxonomía configurada en una variable para hacer referencia a ella en el resto de la automatización. Crea y añade una variable de tipo Taxonomía de documento.En este ejemplo, la variable se llama taxo.

Nota:
Debes asignar la variable a la salida de la actividad.

3. Digitalizar un documento

Añade una actividad Para cada para recorrer cada documento. Para la entrada, añade la variable doc que creaste previamente.
Arrastra y suelta la siguiente actividad dentro de Para cada:
- Digitalizar documento: te permite leer los documentos que proporcionaste y obtener la salida del Modelo de Objecto de Documento (DOM). Configura los siguientes campos:
  - Ruta del documento: añade la variable doc. Puedes encontrar la variable en el nombre del elemento que configuraste en la actividad Para cada. En este ejemplo, el nombre del elemento es doc y representa la ruta del archivo del documento que quieres digitalizar.
  - Texto del documento: crea y añade la variable de texto.
  - Modelo de Objeto de Documento (DOM): crea y añade la variable dom.

4. Clasificar un documento

En la misma actividad Para cada, después de Digitalizar documento, arrastra y suelta la siguiente actividad:

Clasificar ámbito de documento: te permite clasificar el documento que se procesa en uno de los tipos de documento definidos en tu taxonomía. Para las entradas, añade lo siguiente:
- Ruta de documento: añade la variable doc.
- Texto del Documento: añade la variable de texto.
- Documento Object Model (DOM): añade la variable dom.
- Taxonomía: añade la variable taxo. Para las salidas, añade lo siguiente:
- Resultados de la clasificación: crea y añade una nueva variable ResultadosDeClasificación.

En el Ámbito Clasificar documento, añade la actividad Clasificador generativo para clasificar documentos utilizando modelos generativos. Configura la actividad de la siguiente manera:

Select **Manage Field Details**.
In the **Document Type** column, select a document type.
In the **Field Details** column, add an optional value to define additional details about the document type. This can be a short description of the document type. The maximum number of characters allowed is 1000.
Select **Save**.
Select **Manage Field Details**.
In the **Document Type** column, select a document type.
In the **Field Details** column, add an optional value to define additional details about the document type. This can be a short description of the document type. The maximum number of characters allowed is 1000.
Select **Save**.

Nota:

Una actividad de clasificación es opcional si solo tienes un tipo de documento en tu taxonomía. Puedes copiar el ID del tipo de documento y utilizarlo como entrada para la actividad Ámbito de extracción de datos.

5. Extraer detalles de un documento

Arrastra y suelta la siguiente actividad dentro de Para cada:
- Ámbito de extracción de datos: te permite configurar actividades del extractor. Para las entradas, añade lo siguiente:
  - Ruta de documento: añade la variable doc.
  - Texto de documento: añade la variable de texto.
  - Modelo de objeto de documento (DOM): añade la variable dom.
  - Taxonomía: añade la variable taxo.
  - Resultado de clasificación: añade la variable ResultadosDeClasificación. Para la salida, añade lo siguiente:
  - Resultados de extracción: crea y añade una nueva variable ResultadosDeExtracción.
Dentro del Ámbito de extracción de datos, añade la actividad Extractor de proyecto de Document Understanding para extraer los datos del documento.

Al añadir la actividad de extractor de Proyecto dentro del ámbito, debería abrirse automáticamente la ventana de configuración Capacidades.

Si el proyecto publicado está alojado en una organización o tenant diferente, o se utiliza en una configuración híbrida, añade los Detalles requeridos en Obtener capacidades de la siguiente manera:
- Crea una aplicación externa en la página de administración de Automation Cloud. Para obtener más información, consulta Añadir una aplicación externa.
- Copia el ID de la aplicación y el Secreto de la aplicación, donde el secreto de la aplicación es la contraseña.
- Crea una credencial de activo de Orchestrator.
- En la ventana Obtener capacidades, añade las credenciales, el ID de aplicación y el secreto.
- Configura el resto de los campos como se describe en Extractor de proyecto de Document Understanding.
  
  Nota:
  Al copiar la URL del tenant, asegúrate de que incluya los nombres de la organización y del tenant.Por ejemplo, https://staging.uipath.com/communicationsminingteam/IXPTesting, donde communicationsminingteam es la Organización y IXPTesting es el tenant.
- En la actividad Extractor de Proyecto de Document Understanding, añade la Ruta del activo como Entrada en la propiedad Activo de credenciales de Runtime de la actividad Extractor de Proyecto de Document Understanding.La ruta debe estar en forma de <OrchestratorFolderName>/<AssetName>.
Si el flujo de trabajo se ejecuta en la misma organización y tenant donde se publicó el proyecto, selecciona el proyecto publicado en la actividad Extractor de proyecto de Document Understanding.

Nota:
El modelo publicado aparece en las opciones desplegables si Studio está conectado a la misma organización o tenant en el que se publicó el modelo. Si el modelo no aparece, puede deberse a estar publicado en una organización o tenant diferente. En este caso, aplica las instrucciones de la siguiente sección, Consumir predicciones de proyectos multiorganizacionales, multitenant o híbridos.
Selecciona Configurar extractores y utiliza el asistente para asignar tus campos de taxonomía a los campos definidos en el proyecto de Documentos complejos y no estructurados. Figura 1. El asistente de configuración de extractores de Studio

6. Validar un documento

Opcionalmente, puedes configurar criterios de decisión para determinar si se requiere la validación humana para la salida de la clasificación. Esto se puede hacer utilizando reglas empresariales personalizadas o la lógica de posprocesamiento. También puedes utilizar criterios de decisión personalizados en un flujo de trabajo para desencadenar la validación o configurar umbrales de confianza en el nivel de campo. Este criterio de decisión depende de los requisitos del proceso empresarial y de la tolerancia de tu caso de uso para falsos positivos, es decir, resultados que omiten la validación humana pero que se han extraído incorrectamente. Basándote en estas reglas, puedes controlar si un documento se valida automáticamente o se encamina a validación humana. Para obtener más detalles, consulta la sección Configuración de validación en Establecer la estructura.

Añade la actividad Presentar estación de validación para validar en la estación de validación. La salida ResultadosDeExtracción de la actividad Ámbito de extracción de datos será la entrada de la actividad Presentar estación de validación.Para la entrada, añade la variable ResultadosDeExtracción.Para la salida, crea y añade una nueva variable ResultadosDeExtracciónValidados.
Para las entradas, añade lo siguiente:
- Ruta de documento: añade la variable doc.
- Texto de documento: añade la variable de texto.
- Modelo de objeto de documento (DOM): añade la variable dom.
- Taxonomía: añade la variable taxo.
- Resultados de extracción automáticos: añade la variable ResultadosDeExtracción.
Para la salida, añade lo siguiente:
- Resultados de extracción validados: crea y añade una nueva variable ResultadosDeExtracciónValidados.

En este paso de validación, también puedes utilizar otras actividades además de Estación de validación actual.Por ejemplo:

Crea artefactos de validación o Crea tarea de aplicación cuando tengas Apps que utilicen el componente Validación de contenido.
Crea acción de validación de documento o Crea acción de validación de documento y reanudar cuando quieras enviar la Estación de validación a Action Center.

Para obtener más detalles sobre la validación, consulta los siguientes recursos:

Estación de validación
Apps
- Validar documentos con acciones de la aplicación

Desencadenar la validación humana

La validación humana de la salida de la clasificación se activa aplicando la lógica de decisión después del paso de clasificación, antes de que el flujo de trabajo proceda a la extracción. La decisión no es automática de forma predeterminada: se controla explícitamente a través de umbrales de confianza y reglas empresariales definidas en el flujo de trabajo.

La siguiente lista muestra cómo se puede activar la validación humana:

Evaluación de confianza de la clasificación Cada resultado de clasificación incluye puntuaciones de confianza que indican cómo de seguro seguro está el modelo respecto al tipo de documento predicho. Estas puntuaciones se evalúan en el flujo de trabajo para determinar si la clasificación es fiable.
Umbrales de confianza Puedes definir un umbral de confianza mínimo para la clasificación. Si la puntuación de confianza para el tipo de documento predicho cae por debajo de este umbral, la clasificación se considera incierta y el documento se marca para validación humana.
Reglas empresariales y lógica condicional Además de los umbrales de confianza, puedes aplicar reglas empresariales personalizadas, como:
- Tipos de documentos específicos que siempre requieren revisión manual.
- Desajustes entre los tipos de documentos esperados y los previstos.
- Reglas basadas en cómo se procesará el documento más tarde. Por ejemplo, documentos que deben verificarse antes de la extracción o aprobación.
Desencadenar el paso de validación Cuando se cumplen los criterios definidos, el flujo de trabajo enruta el documento a un paso de validación humana invocando uno de los mecanismos de validación:
- Presentar Estación de validación para la validación en el robot.
- Crear Tarea de validación para la validación basada en Action Center.
- Crear artefactos de validación de documentos para la validación en Apps.
Confirmación o corrección humanaDurante la validación, el revisor humano confirma o corrige el tipo de documento. El resultado de la clasificación validado se utiliza en los pasos posteriores, como la extracción de datos, garantizando que el procesamiento posterior se base en un tipo de documento aprobado. Para concluir, la validación humana de la clasificación se activa mediante reglas controladas por el flujo de trabajo, normalmente basadas en puntuaciones de confianza y lógica empresarial, que determinan cuándo un resultado de clasificación requiere revisión manual antes de que el proceso continúe.

Interpretar los resultados de la Estación de validación que vienen de modelos de IXP

Cuando se usan flujos de trabajo que utilizan modelos para documentos complejos y no estructurados de IXP, la Estación de validación es una interfaz crucial para revisar, confirmar y refinar los datos extraídos. La Estación de validación muestra cómo el modelo interpretó el documento, para que conozcas la precisión de la extracción, identifiques áreas dudosas y hagas las correcciones necesarias.

En la Estación de validación, el tipo de documento y sus campos correspondientes se muestran junto con los valores extraídos y los indicadores de confianza. Para obtener más información sobre el proceso de validación, consulta los siguientes recursos:

Comparación de los flujos de trabajo de los proyectos de Windows y multiplataforma

La siguiente tabla muestra una comparación de los flujos de trabajo de IXP para los proyectos de Windows y multiplataforma:

	Ventanas	Multiplataforma
Paquetes necesarios	OCRInteligente	Document Understanding
Definir la taxonomía	La opción Gestor de taxonomía te permite definir la lista de campos que se mostrarán en la Estación de validación o se incluirán en el objeto de resultados de extracción. Nota: Gestor de taxonomía solo está disponible cuando el paquete OCR inteligente está instalado.	El paquete Document Understanding lee y muestra automáticamente los campos definidos en el esquema del modelo de Extracción y Procesamiento Inteligentes (IXP). Estos campos no se configuran a través del flujo de trabajo.

¿Te ha resultado útil esta página?

AnteriorCLI

Sig.Consumir modelos a través de la API de Document Understanding

Información general​

Requisitos previos​

Ventanas​

Multiplataforma​

Crear un flujo de trabajo de IXP para proyectos de Windows​

1. Instalar los paquetes​

2. Definir la taxonomía​

3. Digitalizar un documento​

4. Clasificar un documento​

5. Extraer detalles de un documento​

6. Validar un documento​

Desencadenar la validación humana​

Interpretar los resultados de la Estación de validación que vienen de modelos de IXP​

Comparación de los flujos de trabajo de los proyectos de Windows y multiplataforma​

¿Te ha resultado útil esta página?

Información general

Requisitos previos

Ventanas

Multiplataforma

Crear un flujo de trabajo de IXP para proyectos de Windows

1. Instalar los paquetes

2. Definir la taxonomía

3. Digitalizar un documento

4. Clasificar un documento

5. Extraer detalles de un documento

6. Validar un documento

Desencadenar la validación humana

Interpretar los resultados de la Estación de validación que vienen de modelos de IXP

Comparación de los flujos de trabajo de los proyectos de Windows y multiplataforma