- Erste Schritte
- Datensicherheit und Compliance
- Organisationen
- Authentifizierung und Sicherheit
- Lizenzierung
- Über die Lizenzierung
- Einheitliche Preise: Lizenzierungsplan-Framework
- Aktivieren Ihrer Enterprise-Lizenz
- Migrieren von Test Suite zu Test Cloud
- Lizenzmigration
- Zuweisen von Lizenzen zu Mandanten
- Zuweisen von Benutzerlizenzen
- Freigegeben von Benutzerlizenzen
- Überwachung der Lizenzzuweisung
- Lizenzüberzuweisung
- Lizenzierungsbenachrichtigungen
- Benutzerlizenzverwaltung
- Mandanten und Dienste
- Konten und Rollen
- AI Trust Layer
- Externe Anwendungen
- Benachrichtigungen
- Protokollierung
- Datenexport
- Tests in Ihrer Organisation
- Fehlersuche und ‑behebung
- Migration zur Test Cloud
Test Cloud-Administratorhandbuch
Erzwingen des Mandantenverbrauchs
Das Erzwingen des Mandantenverbrauchs ist nur für Automation Cloud und Test Cloud verfügbar.
Die Durchsetzung des Mandantenverbrauchs ist eine Konfiguration pro Dienst und pro Mandant, die steuert, ob ein Dienst den Verbrauch von Einheiten einstellt, wenn er die diesem Mandanten zugewiesenen Einheiten erreicht.
In Test Cloud weisen Lizenzen jedem Mandanten einen Pool von Units – z. B. Platform Units – zu. In der Vergangenheit haben Dienste weiterhin Units verbraucht, die über die dem Mandanten zugewiesene Menge hinausgingen, und zwar unter Bezugnahme auf den Pool auf Organisationsebene.Dieses Verhalten führte dazu, dass Mandantenzuweisungen eher als Richtlinien denn als harte Grenzen fungierten, was die Kosten-Steuerelemente und Budget-Governance für Organisationen mit mehreren Mandanten schwierig machte.
Durch das Durchsetzen des Mandantenverbrauchs werden Organisationsadministratoren und Tenant Administrators pro Dienst und Mandant konfiguriert, ob der Verbrauch bei 100 % der zugewiesenen Units gestoppt oder über das Mandantenlimit hinaus in den Organisationspool fortgesetzt wird.
So funktioniert die Erzwingung
Die Erzwingung wird für jeden Dienst auf jedem Mandanten unabhängig ausgeführt. Wenn die Erzwingung für einen Dienst aktiviert ist, beendet dieser Dienst die Verarbeitung neuer Einheiten bei 100 % der Zuweisung des Mandanten. Wenn die Erzwingung deaktiviert ist, zeichnet der Dienst weiter aus dem Pool auf Organisationsebene aus, nachdem die Mandantenzuweisung aufgebraucht ist.
Jeder Dienst ist einzeln konfiguriert.Es gibt keine Dienstgruppen – Durchsetzungseinstellungen für einen Dienst wirken sich nicht auf andere Dienste auf demselben Mandanten aus.
Verhaltensszenarien
| Erzwingungseinstellung | Verbrauch bei 100 % der Mandantenzuweisung | Einheitenquelle nach Mandantenlimit |
|---|---|---|
| Bei 100 % aktiviert | Der Dienst beendet den Verbrauch für diesen Mandanten | Keine zusätzlichen Einheiten verbraucht |
| Bei 100 % deaktiviert | Der Verbrauch wird über das Mandantenlimit hinaus fortgesetzt | Pool auf Organisationsebene |
Wenn der Verbrauch das Mandantenlimit überschreitet, werden die zusätzlichen Einheiten aus dem Pool auf Organisationsebene abgerufen. Dies bietet ein Sicherheitsnetz für geschäftskritische Prozesse, während gleichzeitig der Verbrauch auf Organisationsebene für die Berichterstattung aufgezeichnet wird.
Verhalten pro Dienst an der Erzwingungsgrenze
Verschiedene Dienste gehen auf unterschiedliche Weise mit der Durchsetzungsgrenze um, je nachdem, wie sie Verbrauchsereignisse an die Lizenzierungsebene melden.
Das Lizenzierungssystem erhält Verbrauchsereignisse, wenn ein Prozess oder eine Aktivität abgeschlossen wird, nicht während der Ausführung. Das bedeutet, dass, wenn ein Prozess abgeschlossen wird und der gemeldete Verbrauch den Mandanten über 100 % erhöht, dieses letzte Ereignis akzeptiert wird, bevor die Erzwingung den nachfolgenden Verbrauch stoppt. Ein geringfügiger Überverbrauch an Prozessgrenzen ist daher auch bei aktivierter Durchsetzung möglich.
Enforcement activates at the next consumption event after the limit is hit, not mid-execution. If multiple processes are running when the limit is reached, all of them continue to completion and report their consumption — only new processes starting after that point are blocked.
For example, if five processes are still running when the tenant limit is hit, all five continue to completion, because enforcement only activates after each process reports its consumption event at the end of its run.
For services with larger individual consumption events, the overconsumption at the boundary may be proportionally larger.
Document Understanding
Consumption events are reported at the end of a complete document processing job. When the tenant limit is reached, Document Understanding allows the current job to finish before stopping new jobs. As a result, a small amount of overconsumption may occur at job boundaries.
The next job is blocked if enforcement is active and the allocation is at 100%. In cross-tenant scenarios where one tenant uses a Document Understanding model hosted on another tenant, consumption is always charged to the tenant hosting the model.
To control this consumption through enforcement, enable enforcement on the model-hosting tenant.
Agents
Das Lizenzierungssystem überprüft den Verbrauch bei jedem einzelnen LLM-Aufruf innerhalb einer Agent-Ausführung. Wenn das Mandantenlimit bei aktivierter Durchsetzung erreicht ist, kann der Agent mitten in der Ausführung an der nächsten LLM-Aufrufgrenze anhalten. Die Ausführung wird nicht abgeschlossen.
ScreenPlay und Healing Agent
Both services have a separate enforcement setting for each unit type, and the two settings interact. ScreenPlay runs consume ScreenPlay Runs first; when overconsumption is allowed and ScreenPlay Runs are exhausted, ScreenPlay draws from the available Platform Units (Unified Pricing model).
Healing Agent runs consume Heals first; when overconsumption is allowed and Heals are exhausted, Healing Agent draws from the available Agent Units (Flex pricing model).
Wenn nur die Überlaufeinheit dem Mandanten zugewiesen wird (Platform Units für ScreenPlay; Agent Units für Healing Agent):
| Einstellung | ScreenPlay | Healing Agent |
|---|---|---|
| Bei 100 % anhalten | Nach erschöpften ScreenPlay-Ausführungen beginnt der Verbrauch von Mandanten-Platform Units. Wenn erschöpft ist, wird angehalten. | Nach Erschöpfung von Healings werden Agent Units für Mandanten verbraucht. Wenn erschöpft ist, wird angehalten. |
| Überverbrauch zulassen | Nach erschöpften ScreenPlay-Ausführungen beginnt der Verbrauch von Mandanten-Platform Units. Wenn diese erschöpft ist, wird sie aus dem ScreenPlay Runs-Pool auf Organisationsebene und anschließend aus dem Platform Unit-Pool auf Organisationsebene gezogen. | Nach Erschöpfung von Healings werden Agent Units für Mandanten verbraucht. Wenn sie erschöpft ist, wird sie aus dem Healing Pool auf Organisationsebene und dann aus dem Agent Unit Pool auf Organisationsebene gezogen. |
Wenn beide Einheitentypen dem Mandanten zugewiesen sind:
Für ScreenPlay: primäre Einheit = ScreenPlay Runs, Überlaufeinheit = Platform Units. Für Healing Agent: primäre Einheit = Heals, Überlaufeinheit = Agent Units.
| Einstellung der primären Einheit | Einstellung der Überlaufeinheit | Ergebnis |
|---|---|---|
| Bei 100 % anhalten | Bei 100 % anhalten | Verbraucht primäre Einheiten des Mandanten. Wenn erschöpft ist, werden Mandantenüberlaufeinheiten verbraucht. Wenn beide erschöpft sind, wird angehalten. |
| Überverbrauch zulassen | Bei 100 % anhalten | Verbraucht primäre Einheiten des Mandanten. Wenn erschöpft ist, werden Mandantenüberlaufeinheiten verbraucht. Wenn beide erschöpft sind, wird nur aus dem primären Einheitenpool auf Organisationsebene gezogen. Überlaufeinheiten werden nicht aus dem Pool auf Organisationsebene gezogen. |
| Bei 100 % anhalten | Überverbrauch zulassen | Verbraucht primäre Einheiten des Mandanten. Wenn erschöpft ist, werden Mandantenüberlaufeinheiten verbraucht. Wenn beide erschöpft sind, wird nur aus dem Pool von Überlaufeinheiten auf Organisationsebene gezogen. Primäre Einheiten werden nicht aus dem Pool auf Organisationsebene gezogen. |
| Überverbrauch zulassen | Überverbrauch zulassen | Verbraucht primäre Einheiten des Mandanten. Wenn erschöpft ist, werden Mandantenüberlaufeinheiten verbraucht. Wenn beide erschöpft sind, wird aus dem primären Unit-Pool auf Organisationsebene und dann aus dem Überlauf-Unit-Pool auf Organisationsebene gezogen. |
Maestro- und GenAI-Aktivitäten
Die Durchsetzung auf Mandantenebene wurde für diese Dienste noch nicht implementiert. Sie werden in der Konfigurationsoberfläche nicht verfügbar angezeigt und verbrauchen immer weiter aus dem Organisationspool, unabhängig von der Durchsetzungseinstellung für den Mandanten.
Benachrichtigungsschwellenwerte
Verbrauchsbenachrichtigungen werden gesendet, wenn sich Dienste der Mandantenzuweisung nähern und diese erreichen, unabhängig davon, ob die Erzwingung aktiviert oder deaktiviert ist. Benachrichtigungen werden an den folgenden Schwellenwerten für den Verbrauch auf Mandantenebene gesendet:
- 50 % der zugewiesenen Einheiten verbraucht
- 75 % der zugewiesenen Einheiten verbraucht
- 90 % der zugewiesenen Einheiten verbraucht
Alle Organisationsadministratoren und Tenant Administrators erhalten diese Benachrichtigungen standardmäßig. Informationen zu allen Lizenzierungsbenachrichtigungsereignissen finden Sie unter Lizenzierungsbenachrichtigungen.
Diese Schwellenwerte auf Mandantenebene (50 %, 75 %, 90 % sind von den Verbrauchsbenachrichtigungen auf Organisationsebene getrennt, die bei 50 %, 75 % und 95 % der organisationsweiten Zuweisung ausgelöst werden. Beide Benachrichtigungssätze können gleichzeitig aktiv sein.
Standardverhalten
Wenn die Erzwingung des Mandantenverbrauchs in Ihrer Organisation verfügbar wird, hängt die Standardeinstellung vom aktuellen Verbrauchsstatus Ihrer Organisation ab.
| Organisationszustand | Standardeinstellung für die Erzwingung |
|---|---|
| No tenants in overconsumption | Bei 100 % aktiviert für alle Dienste anhalten |
| Mindestens ein Mandant befindet sich bereits im Überverbrauch | Bei 100 % deaktiviert anhalten (um Unterbrechungen aktiver Produktionsprozesse zu vermeiden) |
Organizations in the second category should audit their tenant allocations before enabling enforcement, to avoid blocking production processes that rely on the organization pool.