activities
latest
false
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática. Los paquetes de conectores disponibles en Integration Service están traducidos con traducción automática.
Actividades de Integration Service
Last updated 21 de oct. de 2024

Mejores prácticas

Esta sección incluye información sobre cómo utilizar Context Grounding de forma eficaz.

Primeros pasos

Para empezar a utilizar Context Grounding, sigue estos pasos primero:

  1. Asegúrate de utilizar la versión 2024.4 o posterior de Studio Web o Studio Desktop.
  2. En Automation Cloud, en Integration Service, establece una conexión con el conector de actividades de UiPath GenAI .

Cómo interactúa la conexión a tierra del contexto con tus datos en las actividades de GenAI

Para utilizar Contexto , necesitas un conjunto de datos (p. ej., un grupo de documentos) fácilmente disponible. Entonces, la conexión a tierra del contexto puede interactuar con tus datos en tres fases:

  1. Establece tu origen de datos para la puesta a tierra del contexto.
    • Utiliza una automatización o carga archivos directamente en un depósito de Orchestrator, en una carpeta compartida de Orchestrator. La carpeta de Orchestrator debe compartirse, porque Context Grounding es un ámbito de tenant.
    • Debes tener permisos de edición para esa carpeta para asegurarte de que puedes cargar o eliminar documentos del depósito. No se requieren permisos adicionales.
  2. Ingerir datos de tu origen de datos en la puesta a tierra del contexto.
  3. Consultas y solicitudes de tierra con tus datos.
    • Utiliza la generación de contenido para consultar documentos y utilizar la información para aumentar o fundamentar las solicitudes.

Gestionar el proceso de ingestión

Conexión a tierra del contexto en la capa de confianza de IA

En UiPath® Automation CloudTM Admin, como parte de la experiencia de administrador de AI Trust Layer, puedes gestionar y controlar los datos que utilizas como contexto con las características de UiPath GenAI.

Puedes crear y gestionar índices de conexión a tierra de contexto disponibles en tenants específicos. Una vez creado, puedes consultar un índice de otros productos y características utilizando GenAI, como Actividades GenAI y Autopilot para todos.

Consulta Controlar los datos contextuales para las características de GenAI en la guía del usuario de Automation Cloud Admin para aprender a crear y gestionar un índice.

Actividad de índice e ingesta de GenAI

La actividad Indexar e Ingerir (Vista previa pública) proporciona un mecanismo asíncrono para incorporar documentos que se cargan y almacenan en depósitos de Orchestrator.

En la actividad Índice e ingesta (vista previa pública) , en Propiedades adicionales, el campo desplegable Tipo de datos te permite especificar el tipo de archivo que te gustaría introducir:

  • PDF: para incorporar archivos PDF (selección predeterminada).
  • CSV: para incorporar archivos CSV.
  • JSON: para incorporar archivos JSON.

Si añades más archivos a tu depósito de Orchestrator, deberás volver a ejecutar esta actividad para asegurarte de que el índice permanece actualizado.

El campo Patrón global de archivo está diseñado para el tipo de archivo que establezcas Tipo de datos:

  • Si tienes un tipo de datos en tu depósito de Orchestrator (p. ej. todos los PDF), seleccionas PDF en la lista desplegable Tipo de datos y mantienes el valor predeterminado Patrón global de archivo como *..
  • Si tienes varios tipos de archivos en tu depósito de Orchestrator, debes especificar tanto en el menú desplegable Tipo de datos como en el Patrón global de archivos los tipos de datos que quieres incorporar. Los patrones son los mismos que el tipo de datos, especificamos la diferencia para ayudar a aclarar la solicitud de ingestión:
    • *.pdf para archivos PDF.
    • *.csv para CSV.
    • *.json para JSON.
Por ejemplo: si cargas archivos PDF en tu depósito de Orchestrator, debes ejecutar Índice e ingesta (vista previa pública) con tu índice, Tipo de datos establecido en PDF y Patrón global de archivo establecido en *.. A continuación, carga los archivos CSV en ese mismo depósito de Orchestrator. Debes ejecutar Índice e Ingerir (Vista previa pública) de nuevo, seleccionar el mismo índice, pero establecer el campo Tipo de datos en CSV y Patrón global de archivo en *.CSV.

Sigue un patrón similar cuando elimines documentos de tu origen de datos: cuando vuelvas a ingerir a través de Índice e Ingerir (Vista previa pública), debes especificar el Tipo de datos y el Glob de archivo para garantizar que la ingestión reconozca eliminar ese tipo de documento del índice .

Nota: La ingesta y reingestión de archivos CSV puede tardar un poco más que otros tipos de datos.

Después de crear un índice, las actividades y otros productos de UiPath pueden utilizarlo para consultar documentos que son importantes para tu caso de uso.

Tiempo de ingestión

La ingestión es un proceso asíncrono. Después de ejecutar la actividad, no significa que los datos se puedan consultar de inmediato. Las cargas útiles de ingestión más pequeñas se procesan más rápido. Por lo tanto, te recomendamos que cargues los documentos por lotes y ejecutes esta actividad periódicamente. La duración de este proceso depende de la cantidad de datos y de cuántos otros usuarios envíen solicitudes de ingestión.

Después de enviar la solicitud de ingestión, suponiendo que cada documento sea menor o igual a 1 MB, normalmente recomendamos esperar:

  • <10 minutos: para 10 documentos o menos;
  • <30 minutos: para 50 documentos o menos;
  • hasta 2 horas: para 50 documentos o más.
Nota: Estos no son SLA ni SLO. El rendimiento depende de la naturaleza de los documentos, el tamaño y la cantidad de solicitudes simultáneas.

Ejecuta la actividad Índice e ingesta (vista previa pública) cada vez que añadas o elimines datos de tu origen de datos. Esto garantiza la paridad con tu origen de datos y las incrustaciones utilizadas para la búsqueda y RAG.

Es posible que el nombre del índice no aparezca en la actividad Generación de contenido antes de que se complete la ingestión. Si no puedes encontrar el nombre del índice en la actividad Generación de contenido :

Después de ejecutar la actividad Índice e ingesta (vista previa pública) , si utilizas un índice existente, selecciona el menú del botón Forzar actualización junto al campo Índice :

docs image

Errores comunes y patrones de resolución

  • Es posible que recibas un error ("No se encontraron resultados") si el trabajo de ingestión no se ha completado.
  • Puedes recibir un error ("No se ha encontrado ningún esquema") si el trabajo de ingestión ha fallado. En este caso, espera unos minutos, vuelve a intentar la consulta y vuelve a intentar la ingestión.
  • Es posible que recibas un error ("Sincronización del origen de datos ya en curso"), lo que significa que tienes un trabajo de ingestión en ese índice que está actualmente en curso. Espere unos minutos y vuelva a intentar la ingestión.

Puedes ejecutar la actividad Índice e ingesta (vista previa pública) :

  • Manualmente (muy recomendable).
  • Basado en eventos: configura una automatización para ejecutar el proceso de ingesta cada vez que se añade o elimina un nuevo documento de un depósito de almacenamiento. Haz esto si añades o eliminas documentos de los depósitos con regularidad.
  • Basado en el tiempo: configura una automatización para ejecutar el proceso de ingesta de forma programada. Haz esto si esperas regularmente un alto volumen de entrada/salida de documentos. Para que cualquier creación de desencadenador funcione con estas actividades, debes considerar que las declaraciones anteriores de ingestión son un proceso asíncrono.

Eliminar índice

Utiliza la actividad Eliminar índice (vista previa pública) si quieres eliminar el índice y las incrustaciones, eliminándolo como fuente de datos que se puede consultar desde otras experiencias de actividad de UiPath GenAI. Esto no elimina los documentos o datos en el origen de datos (p. ej. depósitos de Orchestrator).

Consejo: tanto para las actividades Índice e Ingesta (vista previa pública) como para Eliminar índice (vista previa pública) , recomendamos utilizar un proyecto de Studio independiente para ejecutarlas por separado de la actividad Generación de contenido (consulta/RAG). De esta manera, puede tener lugar el proceso de ingestión/eliminación asíncrono.

Consultas y RAG con Context Grounding

La actividad Generación de contenido presenta dos opciones para trabajar con documentos: Recurso de archivo e Índice existente.

Recurso de archivo

La opción Recurso de archivo te permite utilizar variables de archivo de actividades anteriores (por ejemplo, un documento descargado de Google Drive) y hacer que Context Grounding realice un estilo RAG justo a tiempo (JIT). Esto significa que ingiere el documento en un índice, busca en él, aumenta la solicitud y luego elimina el índice, por lo que esos datos no son persistentes.

Nota:
  • La opción Recurso de archivo actualmente solo admite el formato PDF.
  • Mantén estos documentos más pequeños (menos de 50 páginas). Las actividades de Integration Service tienen una ventana de tiempo de espera en la que debe tener lugar todo el procesamiento anterior.

  • Si tienes un PDF con imágenes escaneadas, recomendamos utilizar la opción OCR de Document Understanding en la actividad Extraer datos después de haber descargado un archivo para extraer el texto de estas imágenes (ya que Context Grounding aún no admite imágenes). Pasa esa salida extracted_data a la solicitud con ese recurso de archivo apuntando a tu archivo descargado.

Índice existente

La opción Índice existente te permite utilizar un índice que hayas creado con la actividad Índice e ingesta (vista previa pública) . Consultas a través de un índice persistente en el que has ingerido documentos de tu origen de datos. Puedes reutilizar este índice tantas veces como quieras hasta que lo elimines.

Recomendamos utilizar la actividad Mensaje de registro después de la generación de contenido en tu secuencia de flujo de trabajo, para introducir la variable Texto más generado y ver la respuesta de generación de LLM después de que se ejecute el flujo de trabajo.

La actividad Generación de contenido también tiene una variable de salida llamada Cadena de citas (vista previa pública). Úsalo como entrada en una actividad Mensaje de registro para ver los resultados de búsqueda semántica utilizados para influir en la salida de generación. Esto solo funciona para los tipos de datos PDF y JSON.

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.