activities
latest
false
Important :
Veuillez noter que ce contenu a été localisé en partie à l’aide de la traduction automatique. Les packages de connecteurs disponibles dans Integration Service sont traduits à l'aide d'un moteur de traduction.
Activités Integration Service
Last updated 21 oct. 2024

Meilleures pratiques

Cette section comprend des informations sur l'utilisation efficace de l' ancrage dans le contexte .

Démarrage

Pour commencer à utiliser l'ancrage dans le contexte, procédez d'abord comme suit :

  1. Assurez-vous d'utiliser Studio Web ou Studio Desktop version 2024.4 ou ultérieure.
  2. Dans Automation Cloud, dans Integration Service, établir une connexion au connecteur d' activités UiPath GenAI .

Comment l'ancrage dans le contexte interagit avec vos données dans les activités GenAI

Pour utiliser l’ancrage dans le contexte , vous avez besoin d’un ensemble de données (par exemple, un groupe de documents) facilement disponible. Ensuite, l'ancrage dans le contexte peut interagir avec vos données en trois phases :

  1. Établissez votre source de données pour l'ancrage dans le contexte.
    • Utilisez une automatisation ou téléchargez des fichiers directement dans un compartiment Orchestrator, dans un dossier Orchestrator partagé. Le dossier Orchestrator doit être partagé, car Mise à la base du contexte (Context Griding) est une activité à l'échelle du locataire.
    • Vous devez disposer des autorisations Modification (Edit) pour ce dossier afin de pouvoir télécharger ou supprimer des documents du compartiment. Aucune autorisation supplémentaire n’est requise.
  2. Ingérer les données de votre source de données dans Ancrage dans le contexte ( Contexte l'ancrage).
  3. Interrogez et ancréez des invites avec vos données.
    • Utilisez la génération de contenu pour interroger des documents et utiliser des informations pour augmenter ou ancrer les invites.

Gestion du pipeline d'ingestion

Ancrage dans AI Trust Layer

Dans UiPath® Automation CloudTM Admin, dans le cadre de l’expérience d’administration AI Trust Layer, vous pouvez gérer et régir les données que vous utilisez comme contexte avec les fonctionnalités UiPath GenAI.

Vous pouvez créer et gérer les index d'ancrage dans le contexte disponibles dans des locataires spécifiques. Une fois créé, vous pouvez interroger un index à partir d'autres produits et fonctionnalités utilisant GenAI, tels que les activités GenAI et Autopilot for everyone.

Voir Gouvernance des données contextuelles pour les fonctionnalités GenAI dans le Guide de l'utilisateur d'administration d'Automation Cloud pour savoir comment créer et gérer un index.

Indexer et ingérer l'activité GenAI

L'activité Indexer et ingérer (Aperçu public) (Index and Ingest (Public Preview)) fournit un mécanisme asynchrone pour ingérer des documents téléchargés et stockés dans des compartiments Orchestrator.

Dans l’activité Indexer et ingérer (aperçu public) (Index and Ingest (Public Preview) , sous Propriétés supplémentaires (Additional properties), le champ déroulant Type de données (Data type ) vous permet de spécifier le type de fichier que vous souhaitez ingérer :

  • PDF : pour ingérer les fichiers PDF (sélection par défaut).
  • CSV : pour ingérer les fichiers CSV.
  • JSON : pour ingérer les fichiers JSON.

Si vous ajoutez d'autres fichiers à votre compartiment Orchestrator, vous devez réexécuter cette activité pour vous assurer que l'index est à jour.

Le champ Modèle glob de fichier ( File glob Pattern ) est conçu pour le type de fichier que vous avez défini Type de données:

  • Si vous avez un type de données dans votre compartiment Orchestrator (par exemple, tous les PDF), vous sélectionnez PDF dans la liste déroulante Type de données (Data type) et conservez la valeur par défaut Modèle glob de fichier ( File glob Pattern ) sur *..
  • Si vous avez plusieurs types de fichiers dans votre compartiment Orchestrator, vous devez spécifier à la fois dans la liste déroulante Type de données (Data type dropdown) et dans Modèle glob (File) les types de données que vous souhaitez ingérer. Les modèles sont les mêmes que le type de données, nous spécifions la différence pour aider à clarifier la demande d'ingestion :
    • *.pdf pour les fichiers PDF.
    • *.csv pour les fichiers CSV.
    • *.json pour les fichiers JSON.
Par exemple : si vous téléchargez des fichiers PDF dans votre compartiment Orchestrator, vous devez exécuter Index et Ingérer (aperçu public) avec votre index, le type de données défini sur PDF et le modèle glob de fichier défini sur *.. Ensuite, vous téléchargez les fichiers CSV dans ce même compartiment Orchestrator. Vous devez réexécuter Index et Ingest (Aperçu public) , sélectionner le même index, mais définir le champ Type de données sur CSV et Modèle glob de fichier ( File glob Pattern ) sur *.CSV.

Suivez un modèle similaire lorsque vous supprimez des documents de votre source de données : lorsque vous ré-ingérez via Index et Ingérer (Aperçu public), vous devez spécifier le type de données et le groupe de fichiers pour vous assurer que l'ingestion reconnaît ce type de document de l'index .

Remarque : l'ingestion et la ré-ingestion de fichiers CSV peuvent prendre légèrement plus de temps que d'autres types de données.

Après avoir créé un index, les activités et d'autres produits UiPath peuvent l'utiliser pour interroger les documents importants pour votre cas d'utilisation.

Durée d’ingestion

L’ingestion est un processus asynchrone. Une fois l'activité exécutée, cela ne signifie pas que les données sont immédiatement interrogées. Les charges utiles d'ingestion plus petites sont traitées plus rapidement. Par conséquent, nous vous recommandons de charger les documents par lots et d’exécuter cette activité régulièrement. La durée de ce processus dépend de la quantité de données et du nombre d'autres utilisateurs qui soumettent des demandes d'ingestion.

Après avoir envoyé la demande d'ingestion, et en supposant que chaque document est inférieur ou égal à 1 Mo, nous vous recommandons généralement d'attendre :

  • <10 minutes : pour 10 documents ou moins ;
  • <30 minutes : pour 50 documents ou moins ;
  • jusqu'à 2 heures : pour 50 documents ou plus.
Remarque : Il ne s'agit pas de SLA ou de SLO. Les performances dépendent de la nature des documents, de la taille et du nombre de requêtes simultanées.

Exécutez l'activité Indexer et ingérer (aperçu public) (Index and Ingest (Public Preview)) chaque fois que vous ajoutez ou supprimez des données de votre source de données. Cela garantit la parité avec votre source de données et les intégrations utilisées pour la recherche et RAG.

Le nom de l’index peut ne pas apparaître dans l’activité de génération de contenu tant que l’ingestion n’est pas terminée. Si vous ne trouvez pas le nom d'index dans l'activité de génération de contenu :

Après avoir exécuté l'activité Indexer et ingérer (aperçu public) (Index and Ingest (Public Preview)) , si vous utilisez un index existant, sélectionnez le bouton Forcer l'actualisation ( Force Refresh ) à côté du champ Index (Index) :

docs image

Erreurs courantes et modèles de résolution

  • Vous pouvez recevoir une erreur (« Aucun résultat trouvé ») si la tâche d'ingestion n'est pas terminée.
  • Vous pouvez recevoir une erreur (« Aucun schéma trouvé ») si la tâche d'ingestion a échoué. Dans ce cas, attendez quelques minutes, réessayez de lancer des requêtes et réessayez d'ingérer.
  • Vous pouvez recevoir une erreur (« Synchronisation de la source de données déjà en cours »), ce qui signifie que vous avez une tâche d'ingestion vers cet index qui est actuellement en cours. Attendez quelques minutes et réessayez l’ingestion.
  • Manuellement (fortement recommandé).
  • Basé sur les événements : configurez une automatisation pour exécuter le pipeline d'ingestion chaque fois qu'un nouveau document est ajouté ou supprimé d'un compartiment de stockage. Faites-le si vous ajoutez ou supprimez régulièrement des documents dans les compartiments.
  • Temporel : configurez une automatisation pour exécuter le pipeline d'ingestion de manière planifiée. Faites-le si vous prévoyez régulièrement un volume élevé d'entrées/de sorties de documents. Pour que toute création de déclencheur fonctionne avec ces activités, vous devez considérer les instructions d'ingestion précédentes comme un processus asynchrone.

Supprimer un index

Utilisez l’activité Supprimer l’ index (aperçu public) (Delete Index (Public Preview)) si vous souhaitez supprimer l’index et les intégrations, en les supprimant en tant que source de données pouvant être interrogée à partir d’autres expériences d’activité UiPath GenAI. Cela ne supprime pas les documents ou les données dans la source de données (par exemple Compartiments Orchestrator).

Astuce : pour les activités Indexer et Ingérer (Aperçu public) et Supprimer l’index (Aperçu public) , nous recommandons d’utiliser un projet Studio distinct pour les exécuter séparément de l’activité Génération de contenu (requête/RAG). De cette façon, le processus d'ingestion/suppression asynchrone peut avoir lieu.

Requêtes et RAG avec ancrage en contexte

L'activité de génération de contenu propose deux options pour travailler avec les documents : Ressource de fichier et Index existant.

Ressource de fichier

L'option de ressource de fichier vous permet d'utiliser des variables de fichier à partir d'activités précédentes (par exemple, un document téléchargé à partir de Google Drive) et que l'ancrage en contexte effectue un style de RAG juste à temps (JIT). Cela signifie qu'il ingère le document dans un index, qu'il effectue une recherche, augmente l'invite, puis supprime l'index, afin que ces données ne soient pas persistantes.

Remarque :
  • L'option de ressource de fichier ne prend actuellement en charge que le format PDF.
  • Gardez ces documents plus petits (moins de 50 pages). Les activités Integration Service ont une fenêtre d'expiration dans laquelle tout le traitement ci-dessus doit avoir lieu.

  • Si vous avez un PDF avec des images numérisées, nous vous recommandons d’utiliser l’option Document Understanding OCR dans l’activité Extraire des données (Extract Data) après avoir téléchargé un fichier pour extraire le texte de ces images (car Context fois que l’ancrage dans le contexte ne prend pas encore en charge les images). Transmettez cette sortie extracted_data dans l'invite avec cette ressource de fichier pointant vers votre fichier téléchargé.

Index existant

L’option Index existant ( Existing index ) vous permet d’utiliser un index que vous avez créé avec l’activité Indexer et ingérer (aperçu public) (Index and Ingest (Public Preview)) . Vous effectuez une requête sur un index persistant dans lequel vous avez ingéré des documents à partir de votre source de données. Vous pouvez réutiliser cet index autant de fois que vous le souhaitez jusqu'à le supprimer.

Nous vous recommandons d'utiliser l'activité Log Message après la génération de contenu dans votre séquence de workflow, pour saisir la variable Top Generated Text et voir la réponse de génération LLM après l'exécution du workflow.

L’activité Génération de contenu a également une variable de sortie appelée Chaîne de citations (aperçu public) (Citations String (Public Preview)). Utilisez-le comme entrée dans une activité Message du journal ( Log Message ) pour afficher les résultats de la recherche sémantique utilisés pour influencer la sortie de la génération. Cela ne fonctionne que pour les types de données PDF et JSON.

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.