Agents – Analyser les fichiers

agents

latest

false

Guide de l'utilisateur des Agents

Important :

La localisation du contenu nouvellement publié peut prendre 1 à 2 semaines avant d’être disponible.

Analyser les fichiers

Ajoutez et configurez l'outil Analyser les fichiers pour permettre à votre agent de traiter et d'analyser le contenu des fichiers à l'aide de LLM.

L’outil Analyser les fichiers permet aux Agents de traiter et de raisonner sur le contenu des fichiers à l’aide de LLM.

Ajouter l'outil Analyser les fichiers

Pour ajouter l’outil Analyser les fichiers à votre agent, procédez comme suit :

Définissez les entrées de fichier. Dans le panneau Gestionnaire de données, ajoutez un argument pour chaque entrée de fichier dans le schéma de votre agent.

Figure 1. Créer des arguments d'entrée de fichier

L’argument d’entrée doit être explicitement référencé dans l’invite de l’utilisateur à l’aide de la syntaxe {{exampleInput}}.Les arguments d’entrée non référencés sont ignorés et peuvent affecter la note de l’agent.
- Pour un seul fichier, définissez le type d'argument sur Fichier et référencez-le dans l'invite utilisateur. Par exemple : « Analysez le rapport suivant et résumez les principales conclusions : {{reportFile}} ».
- Pour transmettre plusieurs fichiers, définissez le type d'argument sur Array et le type d'élément sur Fichier, puis référencez l'argument par son nom dans l'invite de l'utilisateur. Vous pouvez également ajouter des arguments de chaîne facultatifs pour les instructions du runtime. Par exemple :
```
Analyze the following report files and summarize the key findings.

## Inputs
- Report files: {{reportFiles}}
- Additional instructions (optional): {{analysisInstructions}}
Analyze the following report files and summarize the key findings.

## Inputs
- Report files: {{reportFiles}}
- Additional instructions (optional): {{analysisInstructions}}
```
Dans cet exemple, reportFiles est un argument Array de fichier et analysisInstructions est un argument String facultatif. Définissez les deux dans le panneau Gestionnaire de données.
Ajoutez l’outil Analyser les fichiers à la définition de votre agent :
1. Sélectionnez Ajouter un outil dans le panneau Outils.
2. Dans la catégorie Outils intégrés, choisissez Analyser les fichiers.
3. Mettez à jour le nom et la description de l’outil pour aider l’agent à mieux raisonner sur le moment où l’utiliser. Le nom et la description guident la phase de planification de l'agent : ils déterminent le moment où l'agent décide d'appeler l'outil, et non ce que l'outil fait des fichiers lors du runtime.
Définissez les entrées de l'outil. L'outil est préconfiguré avec deux entrées principales :
- attachments (array) : une entrée définie par une invite qui indique à l'agent les fichiers à transmettre à l'outil. Dans ce champ, décrivez comment l'agent doit utiliser les entrées de fichier référencées dans l'invite utilisateur (par exemple, {{reportFiles}}). L'agent mappe automatiquement ces fichiers référencés à cette entrée lors du runtime. Exemple : « Utilisez les fichiers fournis dans l'invite utilisateur (par exemple, {{reportFiles}}) comme entrées pour l'analyse. »
- analysisTask (string) : une instruction de runtime indiquant au LLM quoi faire des fichiers une fois l'outil invoqué - par exemple, « Analysez ces rapports. Extrayez le titre du rapport, un résumé exécutif, les principales conclusions triées par importance, des recommandations exploitables et le sentiment global. » Cela est distinct du nom et de la description de l'outil, qui contrôlent le moment où l'agent appelle l'outil. Si votre cas d'utilisation implique un seul fichier, vous pouvez décrire les pièces jointes en conséquence (par exemple, « Utiliser le fichier fourni dans {{reportFile}}… »).
Exécutez l'agent avec des fichiers d'entrée.
1. Ouvrez la fenêtre Configuration Debug :
  1. Accédez à l'onglet Arguments du projet.
  2. Chargez vos fichiers d’entrée liés à votre argument reportFiles.
2. Sélectionnez Enregistrer et exécutez la session de Debug.
Après avoir exécuté l'agent, inspectez la trace d'exécution dans le panneau inférieur.

L’outil Analyser les fichiers s’ajoute désormais à votre agent et se configure pour le processus des entrées de fichiers. La trace d'exécution dans le panneau Piste d'exécution montre comment le système a géré chaque pièce jointe pendant l'exécution.

Traces des pièces jointes de fichiers

Lors de l’utilisation de l’outil Analyser les fichiers, toutes les entrées et sorties de fichiers sont capturées dans le panneau Piste d’exécution dans l’onglet Historique.Le traçage fournit une visibilité détaillée sur la façon dont les pièces jointes ont été gérées lors de l'exécution de l'agent.

Pour chaque fichier, la trace affiche :

ID : Un identifiant unique de la pièce jointe.
Nom : nom du fichier d’origine (par exemple, 1.jpg).
Type MIME : type de fichier détecté (par exemple, image/jpeg).

Figure 2. L’analyse du fichier dans la piste d’exécution

Sélectionnez l’appel de l’outil à partir de la Trace d’exécution et naviguez vers l’onglet Fichiers pour télécharger le fichier.

Figure 3. Comment télécharger un fichier à partir des Traces

Masque des PII pour le contenu des fichiers

Lorsque le masquage des PII en transit est activé dans votre politique AI Trust Layer, il s'applique automatiquement au contenu des fichiers traité via l'outil Analyser les fichiers. Les PII détectées dans le contenu du fichier extrait sont pseudonymisées avant que le contenu n'atteigne le LLM et réhydratées dans la réponse LLM. Pour plus de détails de configuration, reportez-vous à Masquage des PII.

Les formats de fichier suivants sont pris en charge :

PDF
DOCX
CSV
TXT
JSON
Images

Meilleures pratiques et FAQ

Remarque :

Reportez-vous à Utilisation des fichiers pour de plus amples détails sur l'utilisation de fichiers depuis des Processes Maestro, des workflows RPA ou des exécutions d'agent autonomes.

L’outil Analyser les fichiers permet aux Agents de traiter des documents et des images à l’aide de LLM.Bien que puissant, il présente certaines limitations et comportements importants à connaître lors de la conception d'agents amenés à traiter des fichiers.

Limites de fichier

Chaque fichier ne doit pas dépasser 30 Mo. Aucune limite n'est imposée sur le nombre de fichiers par requête.

Prise en charge des types de fichier par fournisseur

La prise en charge des fichiers dépend du fournisseur LLM et du modèle sélectionnés pour l'agent. Bien que plusieurs fournisseurs prennent en charge des formats tels que PDF, les documents Word, les feuilles de calcul, le HTML, le texte, Markdown et les images, chaque fournisseur peut traiter ces fichiers différemment avant d'envoyer le contenu au modèle. Les résultats peuvent varier d'un fournisseur et d'un modèle à l'autre, en particulier pour les fichiers contenant des graphiques, des images intégrées, des mises en page complexes, des formules ou de grandes tables.

La table ci-dessous affiche les formats pris en charge par les derniers modèles exposés par UiPath :

Fournisseur / Famille de modèles	Formats de document et de texte pris en charge	Formats d'image pris en charge
Modèles Anthropic via AWS Bedrock	.pdf, .csv, .doc, .docx, .xls, .xlsx, .html, .txt, .md	.gif, .jpe, .jpeg, .pdf, .png, .tiff. .webp
Modèles OpenAI GPT	.pdf, .csv, .doc, .docx, .xls, .xlsx, .html, .txt, .md	.gif, .jpe, .jpeg, .pdf, .png, .tiff. .webp
Modèles Gemini via Vertex AI	.csv, .txt, .md, .html	.gif, .jpe, .jpeg, .pdf, .png, .tiff. .webp

Remarque :

L'assistance dépend du modèle sélectionné et des capacités du fournisseur. Certains modèles peuvent prendre en charge une extension de fichier au niveau de l'API, mais traitent le fichier différemment en interne, ce qui peut affecter la qualité de la réponse.

Prise en charge des fichiers pour les configurations LLM personnalisées

Lors de l'utilisation de la capacité Bring Your Own LLM via AI Trust Layer, les types de fichier pris en charge par Analyser les fichiers dépendent de la configuration du LLM.Pour de plus amples informations, consultez la section Configurer des LLM.

La prise en charge des fichiers est déterminée par la combinaison des éléments suivants :

Le fournisseur sélectionné, tel qu'Azure OpenAI, Amazon Web Services ou Google Vertex
La famille et la version de modèle sélectionnées
Le type d'API configuré, tel que le point de terminaison du fournisseur utilisé pour appeler le modèle
Les capacités de traitement de fichiers exposées par ce point de terminaison de fournisseur

Un type de fichier qui fonctionne avec un modèle ou un fournisseur peut ne pas fonctionner avec un autre, même lorsque les deux modèles sont disponibles via AI Trust Layer. Par exemple, la prise en charge des documents, des feuilles de calcul, des images et des PDF peut varier selon que l'API du fournisseur accepte directement ces fichiers, en extrait le texte, les convertit en images ou applique une étape de prétraitement spécifique au fournisseur.

UiPath valide que le point de terminaison LLM configuré est accessible et compatible avec la configuration du produit sélectionnée. Lorsque vous utilisez une configuration LLM personnalisée, vous devez vous assurer que le modèle, le fournisseur et le type d'API configurés prennent en charge les types de fichier requis par votre cas d'utilisation Analyser les fichiers.

Remarque :

La compatibilité des fichiers peut changer lors du passage d'un modèle géré par UiPath à une configuration LLM personnalisée, ou lors du changement de fournisseur, de version du modèle ou de type d'API. Si Analyser les fichiers ne parvient pas à traiter un fichier après avoir modifié la configuration LLM, examinez le fournisseur, le modèle et le type d'API configurés dans AI Trust Layer.

Comment fonctionne le traitement des fichiers

Lorsqu'un fichier est transmis à un LLM, le modèle ne reçoit pas le fichier d'origine tel quel. La plupart des fournisseurs appliquent une étape de prétraitement avant d'ajouter le contenu au contexte du modèle. Le comportement de prétraitement dépend du type de fichier.

Pour les entrées de fichiers OpenAI :

Les fichiers PDF peuvent être traités en tant que texte extrait et images de page sur les modèles dotés de capacités de vision.
Les fichiers texte et de document non PDF sont traités en tant que texte extrait uniquement.
Les fichiers de feuille de calcul utilisent un flux d'augmentation spécifique à la feuille de calcul.OpenAI analyse jusqu'aux 1 000 premières lignes par feuille et ajoute des métadonnées de résumé et d'en-tête afin que le modèle puisse fonctionner à partir d'une représentation structurée des données.

D'autres fournisseurs tels qu'AWS Bedrock et Vertex AI peuvent utiliser des approches de prétraitement similaires, mais les détails de l'implémentation exacts sont spécifiques à chaque fournisseur et peuvent ne pas être entièrement documentés.

Les gros fichiers peuvent dépasser les limites de jetons

Les agents traitent les fichiers en intégrant leur contenu dans les requêtes envoyées au LLM, lesquelles sont limitées par la capacité maximale en jetons du modèle. Les fichiers PDF volumineux ou les documents numérisés peuvent échouer sans message clair ou renvoyer des erreurs vagues telles que « Une erreur s'est produite », en particulier lorsqu'ils dépassent la limite de jetons du modèle.

Pour atténuer :

Utilisez des modèles avec une capacité de jeton supérieure.
Utilisez des capacités orientées vers la récupération telles que la recherche de fichiers ou l'ancrage dans le contexte, en particulier pour les fichiers volumineux ou multi-pages.
Pré-indexez les documents et synchronisez-les avant ou pendant l'exécution de l'agent à l'aide d'outils personnalisés.

Gestion des grands PDF

Les grands PDF peuvent dépasser le budget de jeton du LLM lorsqu'ils sont entièrement traités. Fractionnez le PDF en plus petits morceaux ou en pages individuelles avant de les transmettre à l'agent.

Les LLM redimensionnent les images.

Lorsque des fichiers d’image (par exemple, .jpg, .png) sont envoyés dans le cadre de l’invite LLM, la plupart des modèles les redimensionnent automatiquement. Cela peut déformer les rapports d'aspect ou perdre des données au pixel près.

Évitez les invites qui reposent sur des coordonnées exactes, des cases de limitation ou des comparaisons alignées par pixels (par exemple, les différences d’image nécessitant un positionnement x/y spécifique). Pour de plus amples informations, consultez le Guide sur la vision par image d'OpenAI afin de connaître le comportement de redimensionnement spécifique à chaque modèle.

Conseils pour de meilleurs résultats

Les noms de fichiers doivent être propres : Les modèles Anthropic, en particulier, rejettent les noms de fichiers contenant des caractères spéciaux ou des espaces blancs répétés.
Limitez le nombre d'images : Certains modèles comme GPT-4o prennent en charge un maximum de 10 à 50 images par requête.
Utilisez le format PDF lorsque la mise en page, les graphiques ou les diagrammes sont importants. Les images et graphiques intégrés dans des formats non PDF tels que .docx peuvent ne pas être extraits dans le contexte du modèle.
Utilisez des formats basés sur du texte tels que .txt, .md, ou .html pour les tâches de Document Understanding simples.
Pour l'analyse de feuilles de calcul complexes impliquant des agrégations, des jointures, des formules ou des graphiques, utilisez une étape de traitement déterministe ou un workflow de traitement des données dédié avant de transmettre le résultat à l'agent.

Cette page vous a-t-elle été utile ?

PrécédentOutils intégrés

SuivantTransformation par lots

Ajouter l'outil Analyser les fichiers​

Traces des pièces jointes de fichiers​

Masque des PII pour le contenu des fichiers​

Meilleures pratiques et FAQ​

Limites de fichier​

Prise en charge des types de fichier par fournisseur​

Prise en charge des fichiers pour les configurations LLM personnalisées​

Comment fonctionne le traitement des fichiers​

Les gros fichiers peuvent dépasser les limites de jetons​

Gestion des grands PDF​

Les LLM redimensionnent les images.​

Conseils pour de meilleurs résultats​

Cette page vous a-t-elle été utile ?

Ajouter l'outil Analyser les fichiers

Traces des pièces jointes de fichiers

Masque des PII pour le contenu des fichiers

Meilleures pratiques et FAQ

Limites de fichier

Prise en charge des types de fichier par fournisseur

Prise en charge des fichiers pour les configurations LLM personnalisées

Comment fonctionne le traitement des fichiers

Les gros fichiers peuvent dépasser les limites de jetons

Gestion des grands PDF

Les LLM redimensionnent les images.

Conseils pour de meilleurs résultats