activities
latest
false
Important :
Veuillez noter que ce contenu a été localisé en partie à l’aide de la traduction automatique. Les packages de connecteurs disponibles dans Integration Service sont traduits à l'aide d'un moteur de traduction.
UiPath logo, featuring letters U and I in white
Activités Integration Service
Last updated 5 nov. 2024

Analyse des images

Description

Générez une complétion avec une invite personnalisée pouvant contenir du texte statique, des variables, des arguments, ainsi qu’un fichier image ou une URL d’image accessible au public.

Compatibilité du projet

Windows | Multiplate-forme

Configuration

  • ID de connexion ( Connection ID) - La connexion établie dans Integration Service. Accédez au menu déroulant pour choisir, ajouter ou gérer des connexions.

  • Nom du modèle : le nom ou l'ID du modèle de vision ou du déploiement à utiliser pour la complétion. Cette activité utilise par défaut le modèle ayant la sortie de qualité la plus élevée observé. Cependant, vous pouvez sélectionner un modèle différent en fonction des sorties et des tests souhaités. Le changement de modèle peut avoir un impact sur la sortie. Tous les modèles disponibles sont dotés de la visionneuse, ce qui signifie qu’ils peuvent également examiner une image. Si vous soumettez uniquement une invite textuelle, vous pouvez utiliser la génération de contenu à la place.
  • Invite : l'invite de l'utilisateur pour la demande de complétion de chat. Ce champ prend en charge le type d'entrée String .
  • Type d' image : le type d'image à envoyer avec un message si l'analyse de l'image est nécessaire. Sélectionnez l'une des options suivantes : Fichier(File), URL publique ( Public URL).
    • Fichier (File) : le fichier image à utiliser pour la demande de complétion. Ce champ prend en charge une entrée de type IResource . Ce champ s'affiche si le type d'image est défini sur Fichier(File).
    • URL publique ( Public URL ) : l'URL accessible au public de l'image à envoyer avec l'invite de l'utilisateur. Ce champ prend en charge une entrée de type String . Ce champ s'affiche si le type d'image est défini sur URL publique.
  • Invite système : l'invite système ou l'instruction contextuelle pour la demande de complétion. Ce champ prend en charge une entrée de type String .
Remarque : le format de fichier image pris en charge dépend du modèle sélectionné. À mesure que de nouveaux modèles sont publiés, davantage de formats d'image seront disponibles.
  • GPT-4o : PNG (.png), JPEG (.jpeg et .jpg), WEBP (.webp) et GIF non animé (.gif).
  • Gemini Flash : = PNG (.png), JPEG (.jpeg et .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg et .jpg).
Gérer les propriétés

Utilisez l’assistant Gérer les propriétés ( Manage Properties ) pour configurer ou utiliser l’un des champs standard ou personnalisés de l’objet. Vous pouvez sélectionner des champs et les ajouter à la zone de dessin de l’activité. Les champs standard ou personnalisés ajoutés sont disponibles dans le panneau Propriétés (Properties) (dans Studio Desktop) ou sous Afficher les propriétés supplémentaires ( Show additional properties ) (dans Studio Web).

Propriétés supplémentaires
  • Nombre maximal de jetons : le nombre maximal de jetons à générer lors de l'achèvement. La somme du nombre de jetons de votre invite et de ceux du résultat/de l’achèvement ne peut pas dépasser la valeur fournie pour ce champ. Nous recommandons de définir une valeur inférieure au nombre maximal du modèle afin de garder de la place pour le nombre de jetons d’invite. La valeur par défaut est 1 024. Si ce champ n’est pas défini, l’activité utilisera par défaut les jetons nécessaires pour répondre à la requête ou au nombre maximal de jetons autorisés par le modèle. Ce champ prend en charge une entrée de type Int64 .
  • Température : la valeur du facteur de créativité ou de la température d’échantillon à utiliser. Des valeurs plus élevées signifient que le modèle prendra plus de risques. Essayez 0,9 pour des réponses ou des complétions plus créatives, ou 0 (également appelé échantillon argmax) pour ceux avec une réponse bien définie ou plus exacte. Il est recommandé de modifier, à partir de la valeur par défaut, cette valeur ou l'échantillon Nucleus, mais pas les deux. La valeur par défaut est 0.
  • Pénalité de fréquence : nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte, réduisant ainsi la probabilité pour le modèle de répéter textuellement la même ligne. La valeur par défaut est 0.
  • Pénalité de présence : nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons selon qu'ils apparaissent ou non dans le texte, augmentant ainsi la probabilité pour le modèle d'aborder de nouveaux sujets. La valeur par défaut est 0.
  • Nombre de choix de complétion ( Completion choices ) : le nombre de choix de complétion à générer pour la requête. Plus la valeur de ce champ est élevée, plus le nombre de jetons qui seront utilisés est élevé. Cela entraîne un coût plus élevé, vous devez donc en être conscient lors de la définition de la valeur de ce champ. La valeur par défaut est de 1.
  • Arrêter la séquence (Stop sequence ) : jusqu'à quatre séquences au cours desquelles l'API cessera de générer d'autres jetons. Le texte renvoyé ne contient pas la séquence d'arrêt. La valeur par défaut est null.
Sortie
  • Premier texte généré : le texte de complétion de l'analyse de l'image.
  • Objet d' analyse d'image : l'objet de réponse contient le texte de complétion de l'analyse de l'image, le modèle utilisé et d'autres détails.
  • Description
  • Compatibilité du projet
  • Configuration

Cette page vous a-t-elle été utile ?

Obtenez l'aide dont vous avez besoin
Formation RPA - Cours d'automatisation
Forum de la communauté UiPath
Uipath Logo White
Confiance et sécurité
© 2005-2024 UiPath Tous droits réservés.