activities
latest
false
Wichtig :
Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde. Die Connector-Pakete, die in Integration Service verfügbar sind, werden maschinell übersetzt.
Aktivitäten für Integration Services
Last updated 26. Sep. 2024

Bildanalyse

Beschreibung

Generieren Sie eine Vervollständigung mit einer benutzerdefinierten Eingabeaufforderung, die statischen Text, Variablen, Argumente und auch eine Bilddatei oder eine öffentlich zugängliche Bild-URL enthalten kann.

Projektkompatibilität

Windows | Plattformübergreifend

Konfiguration

  • Verbindungs-ID – Die im Integration Service hergestellte Verbindung. Greifen Sie auf das Dropdownmenü zu, um Verbindungen auszuwählen, hinzuzufügen oder zu verwalten.

  • Modellname – Der Name oder die ID des Visionsmodells oder der Bereitstellung, die für die Vervollständigung verwendet werden soll. Diese Aktivität wird standardmäßig auf das Modell mit der höchsten beobachteten Ausgabequalität eingestellt. Sie können jedoch basierend auf den gewünschten Ausgaben und Tests ein anderes Modell auswählen. Das Wechseln von Modellen kann sich auf die Ausgabe auswirken. Alle verfügbaren Modelle sind mit Visionen ausgestattet, d. h. sie können auch ein Bild überprüfen. Wenn Sie nur eine Textaufforderung einreichen, können Sie stattdessen die Inhaltsgenerierung verwenden.
  • Eingabeaufforderung – Die Benutzeraufforderung für die Chatvervollständigungsanforderung. Dieses Feld unterstützt die Eingabe vom Typ String .
  • Bildtyp – Der Typ des Bildes, das zusammen mit einer Nachricht gesendet werden soll, wenn eine Bildanalyse erforderlich ist. Wählen Sie eine der folgenden Optionen aus: Datei, Öffentliche URL.
    • Datei ( File ) - Die zu verwendende Bilddatei für die Vervollständigungsanforderung. Dieses Feld unterstützt die Eingabe vom Typ IResource . Dieses Feld wird angezeigt, wenn Bildtyp auf Datei festgelegt ist.
    • Öffentliche URL – Die öffentlich zugängliche URL des Bildes, das zusammen mit der Benutzeraufforderung gesendet werden soll. Dieses Feld unterstützt die Eingabe vom Typ String . Dieses Feld wird angezeigt, wenn Bildtyp auf Öffentliche URL festgelegt ist.
  • Systemaufforderung – Die Systemaufforderung oder Kontextanweisung für die Vervollständigungsanforderung. Dieses Feld unterstützt die Eingabe vom Typ String .
Hinweis: Das unterstützte Bilddateiformat hängt vom ausgewählten Modell ab. Mit der Veröffentlichung neuer Modelle werden mehr Bildformate verfügbar sein.
  • GPT-4o: PNG (.png), JPEG (.jpeg und .jpg), WEBP (.webp) und nicht animiertes GIF (.gif).
  • Gemini Flash: = PNG (.png), JPEG (.jpeg und .jpg).
  • Gemini Pro = PNG (.png), JPEG (.jpeg und .jpg).
Eigenschaften verwalten

Verwenden Sie den Assistenten Eigenschaften verwalten , um Standard- oder benutzerdefinierte Felder des Objekts zu konfigurieren oder zu verwenden. Sie können Felder auswählen, um sie der Aktivitäts-Canvas hinzuzufügen. Die hinzugefügten Standard- oder benutzerdefinierten Felder sind im Eigenschaftenbereich (in Studio Desktop) oder unter Zusätzliche Eigenschaften anzeigen (in Studio Web) verfügbar.

Zusätzliche Eigenschaften
  • Maximale Anzahl von Token – Die maximale Anzahl der Token, die in der Vervollständigung generiert werden sollen. Die Tokenanzahl der Aufforderung zuzüglich der des Ergebnisses/der Vervollständigung dürfen den für dieses Feld angegebenen Wert nicht überschreiten. Am besten ist es, diesen Wert kleiner als die maximale Anzahl des Modells zu wählen, um etwas Spielraum für die Anzahl der Aufforderungstoken zu haben. Der Standardwert ist 1024. Wenn diese Option nicht festgelegt ist, verwendet die Aktivität standardmäßig die erforderlichen Token, um der Anforderung gerecht zu werden, oder die maximal vom Modell zulässigen Token. Dieses Feld unterstützt die Eingabe vom Typ Int64 .
  • Temperatur – Der Wert des Kreativitätsfaktors oder die zu verwendende Stichprobe. Höhere Werte bedeuten, dass das Modell mehr Risiken eingeht. Versuchen Sie es mit 0,9 für kreativere Antworten oder Vervollständigungen oder 0 (auch „Argmax-Sampling“ genannt) für solche mit einer genau definierten oder genaueren Antwort. Im Allgemeinen wird empfohlen, ab dem Standardwert diesen oder den Nucleus-Beispielwert zu ändern, aber nicht beide Werte. Der Standardwert ist 1.
  • Ahndung für Häufigkeit – Zahl zwischen -2,0 und 2,0. Bei positiven Werten werden neue Token auf der Grundlage ihrer vorhandenen Häufigkeit im Text geahndet und die Wahrscheinlichkeit wird verringert, dass das Modell dieselbe Zeile wortwörtlich wiederholt. Der Standardwert ist 0.
  • Ahndung für Vorkommen – Zahl zwischen -2,0 und 2,0. Bei positiven Werten werden neue Token auf der Grundlage geahndet, ob sie bisher im Text vorkommen, und die Wahrscheinlichkeit wird erhöht, dass das Modell über neue Themen spricht. Der Standardwert ist 0.
  • Anzahl der Vervollständigungsauswahlen – Die Anzahl der Vervollständigungsauswahlen, die für die Anforderung generiert werden sollen. Je höher der Wert dieses Felds ist, desto mehr Token werden verwendet. Dies führt zu höheren Kosten. Dies müssen Sie beim Festlegen des Werts dieses Felds berücksichtigen. Der Standardwert ist 1.
  • Sequence anhalten – Bis zu vier Sequences, bei denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text enthält die Stopp-Sequence nicht. Der Standardwert ist null.
Ausgabe
  • Am häufigsten generierter Text – Der Vervollständigungstext der Bildanalyse.
  • Bildanalyseobjekt – Das Antwortobjekt enthält den Text zum Abschluss der Bildanalyse, das verwendete Modell und andere Details.
  • Beschreibung
  • Projektkompatibilität
  • Konfiguration

War diese Seite hilfreich?

Hilfe erhalten
RPA lernen – Automatisierungskurse
UiPath Community-Forum
Uipath Logo White
Vertrauen und Sicherheit
© 2005–2024 UiPath. Alle Rechte vorbehalten