UiPath Documentation
agents
latest
false
Important :
La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Guide de l'utilisateur des Agents

Analyser les fichiers

L’outil Analyser les fichiers permet aux Agents de traiter et de raisonner sur le contenu des fichiers à l’aide de LLM.

Ajouter l’outil Analyser les fichiers

Pour ajouter l’outil Analyser les fichiers à votre agent, procédez comme suit :

  1. Définissez les entrées de fichier. Dans le panneau Gestionnaire de données, ajoutez un argument pour chaque entrée de fichier dans le schéma de votre agent.

    Figure 1. Créer des arguments d'entrée de fichier

    L’argument d’entrée doit être explicitement référencé dans l’invite de l’utilisateur à l’aide de la syntaxe {{exampleInput}}.Les arguments d’entrée non référencés sont ignorés et peuvent affecter la note de l’agent.

    • Pour un seul fichier, définissez le type d'argument sur Fichier et référencez-le dans l'invite utilisateur. Par exemple : « Analysez le rapport suivant et résumez les principales conclusions : {{reportFile}} ».
    • Pour transmettre plusieurs fichiers, définissez le type d'argument sur Array et le type d'élément sur Fichier, puis référencez l'argument par son nom dans l'invite de l'utilisateur. Vous pouvez également ajouter des arguments de chaîne facultatifs pour les instructions du runtime. Par exemple :
    Analyze the following report files and summarize the key findings.
    
    ## Inputs
    - Report files: {{reportFiles}}
    - Additional instructions (optional): {{analysisInstructions}}
    Analyze the following report files and summarize the key findings.
    
    ## Inputs
    - Report files: {{reportFiles}}
    - Additional instructions (optional): {{analysisInstructions}}
    

    Dans cet exemple, reportFiles est un argument Array de fichier et analysisInstructions est un argument String facultatif. Définissez les deux dans le panneau Gestionnaire de données.

  2. Ajoutez l’outil Analyser les fichiers à la définition de votre agent :

    1. Sélectionnez Ajouter un outil dans le panneau Outils.
    2. Dans la catégorie Outils intégrés, choisissez Analyser les fichiers.
    3. Mettez à jour le nom et la description de l’outil pour aider l’agent à mieux raisonner sur le moment où l’utiliser. Le nom et la description guident la phase de planification de l'agent : ils déterminent le moment où l'agent décide d'appeler l'outil, et non ce que l'outil fait des fichiers lors du runtime.

  3. Définissez les entrées de l'outil. L'outil est préconfiguré avec deux entrées principales :

    • attachments (array) : une entrée définie par une invite qui indique à l'agent les fichiers à transmettre à l'outil. Dans ce champ, décrivez comment l'agent doit utiliser les entrées de fichier référencées dans l'invite utilisateur (par exemple, {{reportFiles}}). L'agent mappe automatiquement ces fichiers référencés à cette entrée lors du runtime. Exemple : « Utilisez les fichiers fournis dans l'invite utilisateur (par exemple, {{reportFiles}}) comme entrées pour l'analyse. »
    • analysisTask (string) : une instruction de runtime indiquant au LLM quoi faire des fichiers une fois l'outil invoqué - par exemple, « Analysez ces rapports. Extrayez le titre du rapport, un résumé exécutif, les principales conclusions triées par importance, des recommandations exploitables et le sentiment global. » Cela est distinct du nom et de la description de l'outil, qui contrôlent le moment où l'agent appelle l'outil. Si votre cas d'utilisation implique un seul fichier, vous pouvez décrire les pièces jointes en conséquence (par exemple, « Utiliser le fichier fourni dans {{reportFile}}… »).
  4. Exécutez l'agent avec des fichiers d'entrée.

    1. Ouvrez la fenêtre Configuration Debug  :
      1. Accédez à l'onglet Arguments du projet.
      2. Chargez vos fichiers d’entrée liés à votre argument reportFiles.
    2. Sélectionnez Enregistrer et exécutez la session de Debug.

  5. Après avoir exécuté l'agent, inspectez la trace d'exécution dans le panneau inférieur.

L’outil Analyser les fichiers s’ajoute désormais à votre agent et se configure pour le processus des entrées de fichiers. La trace d'exécution dans le panneau Piste d'exécution montre comment le système a géré chaque pièce jointe pendant l'exécution.

Traces des pièces jointes de fichiers

Lors de l’utilisation de l’outil Analyser les fichiers, toutes les entrées et sorties de fichiers sont capturées dans le panneau Piste d’exécution dans l’onglet Historique.Le traçage fournit une visibilité détaillée sur la façon dont les pièces jointes ont été gérées lors de l'exécution de l'agent.

Pour chaque fichier, la trace affiche :

  • ID : Un identifiant unique de la pièce jointe.

  • Nom : nom du fichier d’origine (par exemple, 1.jpg).

  • Type MIME : type de fichier détecté (par exemple, image/jpeg).

    Figure 2. L’analyse du fichier dans la piste d’exécution

Sélectionnez l’appel de l’outil à partir de la Trace d’exécution et naviguez vers l’onglet Fichiers pour télécharger le fichier.

Figure 3. Comment télécharger un fichier à partir des Traces

PII masking for file contents

When PII in-flight masking is enabled in your AI Trust Layer policy, it automatically applies to file content processed through the Analyze Files tool. PII detected in the extracted file content is pseudonymized before the content reaches the LLM, and rehydrated in the LLM response. For configuration details, refer to PII masking.

The following file formats are supported:

  • PDF
  • DOCX
  • CSV
  • TXT
  • JSON
  • Images

Meilleures pratiques et FAQ

Remarque :

Reportez-vous à Utilisation des fichiers pour de plus amples détails sur l'utilisation de fichiers depuis des Processes Maestro, des workflows RPA ou des exécutions d'agent autonomes.

L’outil Analyser les fichiers permet aux Agents de traiter des documents et des images à l’aide de LLM.Bien que puissant, il présente certaines limitations et comportements importants à connaître lors de la conception d'agents amenés à traiter des fichiers.

Limites de fichier

Chaque fichier ne doit pas dépasser 30 Mo. Aucune limite n'est imposée sur le nombre de fichiers par requête.

Prise en charge des types de fichiers par le fournisseur

La prise en charge des fichiers dépend du fournisseur LLM et du modèle sélectionné pour l'agent. Bien que plusieurs fournisseurs prennent en charge des formats tels que PDF, Word, feuilles de calcul, HTML, texte, Markdown et images, chaque fournisseur peut traiter ces fichiers différemment avant d'envoyer le contenu au modèle. Les résultats peuvent varier entre les fournisseurs et les modèles, en particulier pour les fichiers qui contiennent des graphiques, des images intégrées, des mises en page complexes, des formules ou des tables volumineuses.

Le tableau ci-dessous répertorie les formats pris en charge par les derniers modèles exposés par UiPath:

Fournisseur / famille de modèlesFormats de documents et de textes pris en chargeFormats d’images pris en charge
Modèles Anthropic via AWS BedrockFichiers.pdf,.csv, fichier.doc, fichier.docx, fichier.xls, fichier.xlsx, HTML, .txt, fichier.md.gif,.jpe, jpeg, documents.pdf, .png, .tiff, .webp
Modèles OpenAI GPTFichiers.pdf,.csv, fichier.doc, fichier.docx, fichier.xls, fichier.xlsx, HTML, .txt, fichier.md.gif,.jpe, jpeg, documents.pdf, .png, .tiff, .webp
Modèles Gemini via Vertex AIFichiers.csv,.txt, fichier.md, .html.gif,.jpe, jpeg, documents.pdf, .png, .tiff, .webp
Remarque :

La prise en charge dépend du modèle sélectionné et des capacités du fournisseur. Certains modèles peuvent prendre en charge une extension de fichier au niveau de l'API, mais traitent le fichier différemment en interne, ce qui peut affecter la qualité de la réponse.

Prise en charge des fichiers pour les configurations LLM personnalisées

Lors de l'utilisation de la capacité Apporter votre propre LLM via AI Trust Layer, les types de fichiers pris en charge par Analyser les fichiers dépendent de la configuration LLM configurée. Pour de plus amples informations, consultez la section Configurer des LLM.

La prise en charge des fichiers est déterminée par la combinaison de:

  • Le fournisseur sélectionné, tel qu’Azure OpenAI, Amazon Web Services ou Google Vertex
  • La famille de modèles sélectionnée et la version du modèle
  • Le type d’API configuré, tel que le point de terminaison du fournisseur utilisé pour appeler le modèle
  • Les fonctionnalités de traitement de fichiers exposées par le point de terminaison de ce fournisseur

Un type de fichier qui fonctionne avec un modèle ou un fournisseur peut ne pas fonctionner avec un autre, même lorsque les deux modèles sont disponibles via AI Trust Layer. Par exemple, la prise en charge des documents, des feuilles de calcul, des images et des PDF peut varier selon que l'API du fournisseur accepte directement ces fichiers, extrait le texte qu'ils contiennent, les convertit en images ou applique une étape de prétraitement spécifique au fournisseur.

UiPath vérifie que le point de terminaison LLM configuré est accessible et compatible avec la configuration de produit sélectionnée. Lorsque vous utilisez une configuration LLM personnalisée, vous devez vous assurer que le modèle, le fournisseur et le type d'API configurés prennent en charge les types de fichiers requis par votre cas d'utilisation Analyser les fichiers.

Remarque :

La compatibilité des fichiers peut changer lors du passage d'un modèle géré par UiPath à une configuration LLM personnalisée, ou lors du changement de fournisseur, de version du modèle ou de type d'API. Si l’option Analyser les fichiers ne parvient pas à traiter un fichier après avoir modifié la configuration du LLM, examinez le fournisseur, le modèle et le type d’API configurés dans AI Trust Layer.

Fonctionnement du traitement des fichiers

Lorsqu'un fichier est transmis à un LLM, le modèle ne reçoit pas le fichier d'origine tel quel. La plupart des fournisseurs appliquent une étape de prétraitement avant que le contenu ne soit ajouté au contexte du modèle. Le comportement de prétraitement dépend du type de fichier.

Pour les entrées de fichier OpenAI:

  • Les fichiers PDF peuvent être traités à la fois comme du texte extrait et des images de page sur les modèles compatibles.
  • Les fichiers de documents et de textes non PDF sont traités uniquement comme du texte extrait.
  • Les fichiers de feuille de calcul utilisent un flux d'augmentation spécifique à la feuille de calcul. OpenAI analyse jusqu'aux 1 000 premières lignes par feuille et ajoute des métadonnées de résumé et d'en-tête afin que le modèle puisse fonctionner à partir d'une représentation structurée des données.

D'autres fournisseurs tels qu'AWS Bedrock et Vertex AI peuvent utiliser des approches de prétraitement similaires, mais les détails exacts de la mise en œuvre sont spécifiques au fournisseur et peuvent ne pas être entièrement documentés.

Les gros fichiers peuvent dépasser les limites de jetons

Les agents traitent les fichiers en intégrant leur contenu dans les requêtes envoyées au LLM, lesquelles sont limitées par la capacité maximale en jetons du modèle. Les fichiers PDF volumineux ou les documents numérisés peuvent échouer sans message clair ou renvoyer des erreurs vagues telles que « Une erreur s'est produite », en particulier lorsqu'ils dépassent la limite de jetons du modèle.

Pour atténuer :

  • Utilisez des modèles avec une capacité de jeton supérieure.
  • Utilisez des fonctionnalités axées sur la récupération telles que la recherche de fichiers ou l'ancrage dans le contexte, en particulier pour les fichiers volumineux ou comportant plusieurs pages.
  • Pré-indexez les documents et synchronisez-les avant ou pendant l'exécution de l'agent à l'aide d'outils personnalisés.

Gestion des grands PDF

Les fichiers PDF volumineux peuvent dépasser la limite de jetons du LLM lorsqu'ils sont traités entièrement. Fractionnez le PDF en plus petits fragments ou en pages individuelles avant de les transmettre à l’agent.

Les LLM redimensionnent les images.

Lorsque des fichiers d’image (par exemple, .jpg, .png) sont envoyés dans le cadre de l’invite LLM, la plupart des modèles les redimensionnent automatiquement. Cela peut déformer les rapports d'aspect ou perdre des données au pixel près.

Évitez les invites qui reposent sur des coordonnées exactes, des cases de limitation ou des comparaisons alignées sur les pixels (par exemple, les différences d’image nécessitant un positionnement x/y spécifique). Pour de plus amples informations, consultez le Guide de vision d'OpenAI pour le comportement de redimensionnement spécifique à un modèle.

Conseils pour de meilleurs résultats

  • Les noms de fichiers doivent être propres : Les modèles Anthropic, en particulier, rejettent les noms de fichiers contenant des caractères spéciaux ou des espaces blancs répétés.
  • Limitez le nombre d'images : Certains modèles comme GPT-4o prennent en charge un maximum de 10 à 50 images par requête.
  • Utilisez le format PDF lorsque la mise en page, les graphiques ou les diagrammes sont importants. Images et graphiques intégrés dans des formats non PDF tels que .docx peuvent ne pas être extraits dans le contexte du modèle.
  • Utilisez des formats basés sur le texte tels que.txt, fichier.md, ou.html pour les tâches Document Understanding simples.
  • Pour l’analyse complexe de feuilles de calcul impliquant des agrégations, des jointures, des formules ou des graphiques, utilisez une étape de traitement déterministe ou un workflow de traitement de données dédié avant de transmettre le résultat à l’agent.

Cette page vous a-t-elle été utile ?

Connecter

Besoin d'aide ? Assistance

Vous souhaitez apprendre ? UiPath Academy

Vous avez des questions ? UiPath Forum

Rester à jour