- Introdução
- Segurança de dados e conformidade
- Organizações
- Autenticação e segurança
- Licenciamento
- Sobre as licenças
- Preço unificado: estrutura do plano de licenciamento
- Ativar sua licença Enterprise
- Migre do Test Suite para o Test Cloud
- Migração de licença
- Atribuição de Licenças a Tenants
- Atribuição de licenças aos usuários
- Desalocando licenças de usuário
- Monitoring license allocation
- Atribuição excessiva de licenças
- Notificações de licenciamento
- Gerenciamento de Licenças de Usuário
- Tenants e serviços
- Contas e funções
- AI Trust Layer
- Aplicativos Externos
- Notificações
- Geração de logs
- Testes em sua organização
- Solução de problemas
- Migração para o Test Cloud
Guia do administrador do Test Cloud
Imposição do consumo de tenants
A imposição de consumo de tenant está disponível apenas para o Automation Cloud e o Test Cloud.
A aplicação de consumo de tenant é uma configuração por serviço e por tenant que controla se um serviço para de consumir unidades quando atinge as unidades alocadas para esse tenant.
No Test Cloud, as licenças alocam um conjunto de unidades — como Platform Units — a cada tenant.Historicamente, os serviços continuavam a consumir unidades além da quantidade alocada do tenant, extraindo do pool no nível de organização. Esse comportamento fazia com que as alocações de tenants funcionassem como diretrizes em vez de limites rígidos, dificultando o controle de custos e a governança orçamentária para organizações com vários tenants.
A imposição de consumo de tenant aborda isso permitindo que os Administradores de organização e os Administradores de tenant configurem, por serviço e por tenant, se o consumo para de 100% das unidades alocadas ou se continua além do limite de tenant no pool da organização.
Como a aplicação funciona
A aplicação opera de forma independente para cada serviço em cada tenant. Quando a aplicação é habilitada para um serviço, esse serviço para de processar novas unidades em 100% da alocação do tenant. Quando a aplicação é desabilitada, o serviço continua desenhando do pool no nível da organização após a alocação de tenant se esgotar.
Cada serviço é configurado individualmente. Não há grupos de serviços — as configurações de imposição para um serviço não afetam outros serviços no mesmo tenant.
Cenários de comportamento
| Configuração de aplicação | Consumo em 100% da alocação de tenant | Origem da unidade após o limite do tenant |
|---|---|---|
| Parar em 100% habilitado | O serviço para de consumir para esse tenant | Nenhuma unidade adicional consumida |
| Parar em 100% desabilitado | O consumo continua além do limite do tenant | Pool no nível da organização |
Quando o consumo continuar após o limite do tenant, as unidades adicionais são retiradas do pool no nível da organização. Isso fornece uma rede de segurança para processos críticos para os negócios enquanto ainda registra o consumo no nível da organização para fins de relatório.
Comportamento por serviço no limite de aplicação
Diferentes serviços lidam com o limite de aplicação de maneiras diferentes com base em como relatam eventos de consumo para a camada de licenciamento.
O sistema de licenciamento recebe eventos de consumo quando um processo ou atividade é concluído, não no meio da execução. Isso significa que se um processo for concluído e o consumo que ele relata ultrapassar o tenant em 100%, esse último evento é aceito antes que a aplicação interrompa o consumo subsequente. Um pequeno consumo excessivo nos limites do processo é, portanto, possível, mesmo com a aplicação habilitada.
A imposição é ativada no próximo evento de consumo após o limite ser atingido, não no meio da execução. Se vários processos estiverem em execução quando o limite for atingido, todos eles continuarão até a conclusão e relatarão seu consumo — apenas os novos processos que iniciarem depois desse ponto serão bloqueados. Por exemplo, se cinco processos ainda estiverem em execução quando o limite do tenant for atingido, todos os cinco continuam até a conclusão, porque a aplicação só é ativada após cada processo relatar seu evento de consumo no final de sua execução. Para serviços com eventos de consumo individuais maiores, o consumo excessivo no limite pode ser proporcionalmente maior.
Document Understanding
Os eventos de consumo são relatados no final de um trabalho completo de processamento de documentos. Quando o limite do tenant é atingido, o Document Understanding permite que o trabalho atual seja concluído antes de interromper novos trabalhos. Como resultado, uma pequena quantidade de consumo excessivo pode ocorrer nos limites dos trabalhos. O próximo trabalho será bloqueado se a aplicação estiver ativa e a alocação estiver em 100%. Em cenários entre tenants em que um tenant usa um modelo do Document Understanding hospedado em outro tenant, o consumo é sempre cobrado do tenant que hospeda o modelo. Para controlar esse consumo por meio da aplicação, habilite a aplicação no tenant de hospedagem do modelo.
Agents
O sistema de licenciamento verifica o consumo em cada chamada de LLM individual dentro de uma execução do agente. Quando o limite do tenant for atingido com a aplicação habilitada, o agente poderá interromper no meio da execução no próximo limite de chamadas de LLM. A execução não é concluída.
ScreenPlay e Healing Agent
Ambos os serviços têm uma configuração de aplicação separada para cada tipo de unidade, e as duas configurações interagem. As execuções do ScreenPlay consomem ScreenPlay Runs primeiro; quando o consumo excessivo é permitido e as execuções do ScreenPlay estão esgotadas, o ScreenPlay é extraído das Platform Units disponíveis (modelo de Unified Pricing). As execuções do Healing Agent consomem Recuperações primeiro; quando o consumo excessivo é permitido e as Recuperações estão esgotadas, o Healing Agent extrai das Agent Units disponíveis (modelo de preços Flex).
Quando apenas a unidade de overflow é alocada ao tenant (Platform Units para ScreenPlay; Agent Units para Healing Agent):
| Configuração | ScreenPlay | Agente de Recuperação |
|---|---|---|
| Parar em 100% | Após esgotar as Execuções do ScreenPlay, começa a consumir Platform Units do tenant. Quando esgotado, é interrompido. | Após esgotar as Recuperações, começa a consumir as Agent Units do tenant. Quando esgotado, é interrompido. |
| Permitir consumo excessivo | Após esgotar as Execuções do ScreenPlay, começa a consumir Platform Units do tenant. Quando esgotado, é extraído do pool de execuções do ScreenPlay no nível da organização e, em seguida, do pool de Platform Units no nível da organização. | Após esgotar as Recuperações, começa a consumir as Agent Units do tenant. Quando esgotado, é extraído do pool de Heals no nível da organização e, em seguida, do pool de Agent Units no nível da organização. |
Quando ambos os tipos de unidade são alocados para o tenant:
Para ScreenPlay: unidade primária = ScreenPlay Runs, unidade overflow = Platform Units. Para o Healing Agent: unidade primária = Heals, unidade de overflow = Agent Units.
| Configuração da unidade principal | Configuração da unidade excedente | Resultado |
|---|---|---|
| Parar em 100% | Parar em 100% | Consome unidades primárias de tenant. Quando esgotado, começa a consumir unidades de excedente de tenant. Quando ambos estiverem esgotados, é interrompida. |
| Permitir consumo excessivo | Parar em 100% | Consome unidades primárias de tenant. Quando esgotado, começa a consumir unidades de excedente de tenant. Quando ambos estão esgotados, extrai apenas do pool de unidades primárias no nível da organização. As unidades excedentes não são extraídas do pool no nível da organização. |
| Parar em 100% | Permitir consumo excessivo | Consome unidades primárias de tenant. Quando esgotado, começa a consumir unidades de excedente de tenant. Quando ambos estão esgotados, extrai apenas do pool de unidades de overflow no nível da organização. As unidades principais não são extraídas do pool no nível da organização. |
| Permitir consumo excessivo | Permitir consumo excessivo | Consome unidades primárias de tenant. Quando esgotado, começa a consumir unidades de excedente de tenant. Quando ambos estão esgotados, extrai do pool de unidades primárias no nível da organização e, em seguida, do pool de unidades de overflow no nível da organização. |
Atividades Maestro e GenAI
A aplicação no nível do tenant ainda não foi implementada para esses serviços. Eles aparecem indisponíveis na interface de configuração e sempre continuam a consumir do pool da organização, independentemente da configuração de aplicação no tenant.
Limites de notificação
As notificações de consumo são enviadas conforme os serviços se aproximam e alcançam a alocação do tenant, independentemente de a aplicação estar habilitada ou desabilitada. As notificações são enviadas nos seguintes limites para consumo no nível do tenant:
- 50% das unidades alocadas consumidas
- 75% das unidades alocadas consumidas
- 90% das unidades alocadas consumidas
Todos os Administradores da organização e Administradores de tenant recebem essas notificações por padrão. Para obter informações sobre todos os eventos de notificação de licenciamento, consulte Notificações de licenciamento.
Esses limites de nível de tenant (50%, 75%, 90%) são separados das notificações de consumo de nível organização, que disparam em 50%, 75% e 95% da alocação de toda a organização. Os dois conjuntos de notificações podem estar ativos simultaneamente.
Comportamento padrão
Quando a aplicação do consumo de tenant ficar disponível em sua organização, a configuração padrão dependerá do estado de consumo atual de sua organização.
| Estado da organização | Configuração de aplicação padrão |
|---|---|
| Nenhum tenant atualmente com consumo excessivo | Parar em 100% habilitado para todos os serviços |
| Um ou mais tenants já estão em consumo excessivo | Parar em 100% desabilitado (para evitar a interrupção nos processos de produção ativos) |
As organizações na segunda categoria devem auditar suas alocações de tenants antes de habilitar a aplicação, para evitar o bloqueio de processos de produção que atualmente dependem do pool da organização.