- Primeros pasos
- Seguridad y cumplimiento de los datos
- Organizaciones
- Autenticación y seguridad
- Licencia
- Acerca de la licencia
- Precios unificados: marco del plan de licencias
- Activar su licencia Enterprise
- Migrar de Test Suite a Test Cloud
- Migración de licencias
- Asignar licencias a tenants
- Asignación de licencias de usuario
- Anular la asignación de licencias de usuarios
- Monitoring license allocation
- Licencias con exceso de asignación
- Notificaciones de licencias
- Administración de licencias de usuario
- Tenants y servicios
- Cuentas y roles
- Ai Trust Layer
- Aplicaciones externas
- Notificaciones
- Registro
- Data Export
- Pruebas en su organización
- Solución de problemas
- Migrar a Test Cloud
Guía de administración de Test Cloud
Contextualización es un componente de la AI Trust Layer de UiPath que hace que tus datos empresariales estén listos para LLM, sin suscripciones adicionales para incrustar modelos, bases de datos vectoriales o LLM. Crea índices e incrustaciones de tus datos a los que las características de GenAI de UiPath pueden hacer referencia en tiempo de ejecución a través de la generación aumentada de recuperación (RAG).
Como RAG como servicio con ámbito de tenant, Contextualización basa tus solicitudes con información relevante antes de la ejecución de LLM. Admite las siguientes experiencias de IA generativa de UiPath:
- Actividades de GenAI
- Autopilot for Everyone
- Agentes de UiPath
Proporcionar RAG a estas experiencias ayuda a:
- Supere las limitaciones de la ventana de contexto y mejore la precisión, la fiabilidad y la eficiencia del modelo.
- Reducir el riesgo de alucinaciones mediante referencias a datos reales.
- Concede a las aplicaciones generativas acceso a conocimientos especializados, patentados y actualizados.
- Habilita los bucles de retroalimentación entre los almacenes de datos y las consultas de los usuarios.
Componentes básicos
La terminología y los componentes básicos de Context Grounding incluyen:
Figura 1. Arquitectura del componente de contextualización
Ingestión e indexación
- Ingestión: convierte los datos empresariales en incrustaciones representativas utilizando modelos de incrustación administrados por UiPath.
- Incrustación: una representación de los datos empresariales que un LLM puede comprender y buscar.
- Índice: una carpeta en una base de datos vectorial que organiza incrustaciones.
- BD vectorial: una base de datos vectorial administrada por UiPath que almacena incrustaciones organizadas en índices.
Recuperación
Contextualización busca a través de datos empresariales listos para LLM para encontrar la información más relevante, utilizando técnicas de extracción, fragmentación, recuperación y reclasificación optimizadas para diferentes formatos de datos y consultas. Las actividades de GenAI, Autopilot for Everyone y los agentes interpretan las solicitudes como consultas y devuelven los resultados más relevantes a través de la búsqueda de similitud de coseno, un paso intermedio antes de RAG.
Generación aumentada de recuperación (RAG)
Fundamenta las solicitudes con la información más relevante de los resultados de búsqueda de similitud semántica y luego ejecuta la generación a través de un LLM alojado a través de la puerta de enlace LLM de AI Trust Layer.
DeepRAG (Generación aumentada de investigación profunda)
Una capacidad RAG avanzada, generalmente disponible para agentes, que permite la síntesis y recuperación de varios documentos para casos de uso de agentes complejos. Los agentes pueden sintetizar información en varios documentos y ofrecer respuestas completas respaldadas por citas. Actualmente solo se admite para archivos PDF.
Características clave
- Compatibilidad con varios documentos: CSV, DOCX, JPG, JSON, PDF, PNG, TXT y XLSX.
- Ingestión multimodal: procesa documentos que contienen tanto imágenes como texto, incluidos los PDF no nativos (escaneados).
- Compatibilidad con consultas estructuradas: consulta CSV avanzada, disponible al añadir un índice a un agente.
- Soporte multilingüe: ingiere y consulta documentos en todos los idiomas codificados en UTF-8.
- DeepRAG: síntesis de varios documentos para consultas de agentes complejas, con respuestas respaldadas por citas. Disponible solo para archivos PDF.
- Prueba de conocimiento: cita la fuente de referencia y el texto de los resultados de búsqueda de similitud semántica.
- Compatibilidad con LLM personalizada: Trae tu propio modelo y Trae tus propias configuraciones de suscripción a través de la AI Trust Layer, lo que permite a los administradores utilizar sus propios modelos de incrustación e inferencia. Para obtener más información, consulta Trae tu propio LLM para Contextualización.
- Múltiples fuentes de datos:
- Entidades de depósito de UiPath Orchestrator: ingiere, indexa y consulta datos almacenados en carpetas compartidas de Orchestrator.
- Sistemas de almacenamiento de documentos: accede a los datos de Confluence Cloud, Dropbox, Google Drive y Microsoft OneDrive & SharePoint a través de los conectores de Integration Service.
Licencia
Consulta Licencias de Contextualización.
Limitaciones y consideraciones
- Tipos de archivo compatibles: CSV, DOCX, JPG, JSON, PDF, PNG, TXT y XLSX.
- Límite de índice: diez índices por tenant, ampliable bajo petición. Recomendamos una relación 1:1 entre los índices y las rutas de las carpetas en tu origen de datos.
- Permisos de carpeta: los índices heredan los permisos de carpeta. Los usuarios sin acceso a una carpeta compartida no pueden ver, actualizar, eliminar o utilizar sus índices asociados.
- Requisito de la versión de Studio: para utilizar Contextualización a través de actividades de GenAI, debes utilizar Studio Web o Studio Desktop versión 2024.4 o posterior. Para obtener más información, consulta Trabajar con contextualización.
- Gestión de datos: para obtener más información sobre cómo Contextualización gestiona los archivos durante la ingestión, incluido el comportamiento de retención y eliminación, consulta las Preguntas frecuentes de Contextualización.
- Autorización del origen de datos: la conexión de Integration Service utilizada como origen de datos debe estar autorizada con al menos el ámbito Files.Read del proveedor externo. Este ámbito de OAuth se solicita durante la configuración de la conexión y rige lo que Context Grounding puede leer del sistema de origen (Confluence Cloud, Dropbox, Google Drive o Microsoft OneDrive & SharePoint).