activities

latest

false

Wichtig :

Bitte beachten Sie, dass dieser Inhalt teilweise mithilfe von maschineller Übersetzung lokalisiert wurde. Es kann 1–2 Wochen dauern, bis die Lokalisierung neu veröffentlichter Inhalte verfügbar ist.

Aktivitäten für Integration Services

Letzte Aktualisierung 16. Okt. 2025

Bildanalyse

Beschreibung

Erstellen Sie eine benutzerdefinierte Eingabeaufforderung, die statischen Text, Variablen, Argumente sowie eine Bilddatei oder eine öffentlich zugängliche Bild-URL enthalten kann.

Projektkompatibilität

Windows | Plattformübergreifend

Konfiguration

Verbindung – Die im Integration Service hergestellte Verbindung. Greifen Sie auf das Dropdown-Menü zu, um Verbindungen auszuwählen, hinzuzufügen oder zu verwalten.

Modellname – Der Name oder die ID des Visionsmodells oder der Bereitstellung, die für die Vervollständigung verwendet werden soll. Diese Aktivität verwendet standardmäßig das Modell mit der höchsten Qualität der beobachteten Ausgabe. Sie können jedoch ein anderes Modell basierend auf den gewünschten Ausgaben und Tests auswählen. Das Wechseln der Modelle kann sich auf die Ausgabe auswirken. Alle verfügbaren Modelle sind mit einer Bildverarbeitungsfunktion ausgestattet, d. h., sie können auch ein Bild überprüfen. Wenn Sie nur eine Textaufforderung einreichen, können Sie stattdessen die Content Generation verwenden.
Eingabeaufforderung – Die Benutzeraufforderung für die Chatvervollständigungsanforderung. Dieses Feld unterstützt die Eingabe vom Typ String.
Bildtyp – Der Typ des Bildes, das zusammen mit einer Nachricht gesendet werden soll, wenn eine Bildanalyse erforderlich ist. Wählen Sie eine der folgenden Optionen aus: Datei, Öffentliche URL.
- Datei – Die zu verwendende Bilddatei für die Vervollständigungsanforderung. Dieses Feld unterstützt die Eingabe vom Typ IResource. Dieses Feld wird angezeigt, wenn der Bildtyp auf Datei festgelegt ist.
- Öffentliche URL – Die öffentlich zugängliche URL des Bildes, das zusammen mit der Benutzeraufforderung gesendet werden soll. Dieses Feld unterstützt die Eingabe vom Typ String. Dieses Feld wird angezeigt, wenn Bildtyp auf Öffentliche URL festgelegt ist.
Systemaufforderung – Die Systemaufforderung oder Kontextanweisung für die Vervollständigungsanforderung. Dieses Feld unterstützt die Eingabe vom Typ String.

Hinweis: Das unterstützte Bilddateiformat hängt vom ausgewählten Modell ab. Mit der Veröffentlichung neuer Modelle werden mehr Bildformate verfügbar sein.

GPT-4o: PNG (.png), JPEG (.jpeg und .jpg), WEBP (.webp) und nicht animiertes GIF (.gif).
Gemini Flash: = PNG (.png), JPEG (.jpeg und .jpg).
Gemini Pro = PNG (.png), JPEG (.jpeg und .jpg).

Eigenschaften verwalten

Verwenden Sie den Assistenten Eigenschaften verwalten , um Standard- oder benutzerdefinierte Felder des Objekts zu konfigurieren oder zu verwenden. Sie können Felder auswählen, um sie der Aktivitäts-Canvas hinzuzufügen. Die hinzugefügten Standard- oder benutzerdefinierten Felder sind im Eigenschaftenbereich (in Studio Desktop) oder unter Zusätzliche Eigenschaften anzeigen (in Studio Web) verfügbar.

Zusätzliche Eigenschaften

Maximale Anzahl von Token – Die maximale Anzahl der Token, die in der Vervollständigung generiert werden sollen. Die Tokenanzahl der Aufforderung zuzüglich der des Ergebnisses/der Vervollständigung dürfen den für dieses Feld angegebenen Wert nicht überschreiten. Am besten ist es, diesen Wert kleiner als die maximale Anzahl des Modells zu wählen, um etwas Spielraum für die Anzahl der Aufforderungstoken zu haben. Der Standardwert ist 1024. Wenn nicht festgelegt, werden standardmäßig die erforderlichen Token verwendet, um die Anfrage zu bearbeiten, oder die maximal zulässigen Token, die vom Modell vorgegeben werden. Dieses Feld unterstützt die Eingabe vom Typ Int64.
Temperatur – Der Wert des Kreativitätsfaktors oder der zu verwendenden Stichprobentemperatur. Höhere Werte bedeuten, dass das Modell mehr Risiken eingeht. Probieren Sie 0,9 für kreativere Antworten oder Vervollständigungen oder 0 (auch als Argmax-Stichprobe bezeichnet) für solche mit einer klar definierten oder genaueren Antwort. Es wird empfohlen, diesen oder den Nucleus-Beispielwert im Vergleich zum Standardwert zu ändern, jedoch nicht beide Werte. Der Standardwert ist 0.

Ahndung für Häufigkeit – Zahl zwischen -2,0 und 2,0. Positive Werte wirken sich negativ auf neue Token aus, die auf ihrer vorhandenen Häufigkeit im Text basieren, und verringern die Wahrscheinlichkeit, dass das Modell dieselbe Zeile wörtlich wiederholt. Der Standardwert ist 0.
Ahndung für Vorkommen – Zahl zwischen -2,0 und 2,0. Positive Werte wirken sich negativ auf neue Token aus, je nachdem, ob sie bisher im Text vorkommen, und erhöhen die Wahrscheinlichkeit, dass das Modell über neue Themen spricht. Der Standardwert ist 0.
Anzahl der Fertigstellungsauswahlmöglichkeiten – Die Anzahl der Fertigstellungsauswahlmöglichkeiten, die für die Anforderung generiert werden sollen. Je höher der Wert dieses Felds, desto mehr Token werden verwendet. Dies führt zu höheren Kosten, deshalb müssen Sie sich dies beim Festlegen des Werts für dieses Feld bewusst sein. Der Standardwert ist 1.
Sequence anhalten – Bis zu vier Sequences, in denen die API die Generierung weiterer Token anhält. Der zurückgesendete Text enthält keine Stopp-Sequence. Der Standardwert ist null.

Ausgabe

Am häufigsten generierter Text – Der Vervollständigungstext der Bildanalyse.
Bildanalyseobjekt – Das Antwortobjekt enthält den Text zum Abschluss der Bildanalyse, das verwendete Modell und andere Details.

Einschränkungen

Die GPT-4-Modelle haben bestimmte Einschränkungen bei der Arbeit mit Bildern. Weitere Informationen finden Sie in der OpenAI Plattform-Dokumentation unter Einschränkungen.

Auf dieser Seite