Grundlegende Architekturüberlegungen

Wie bei jeder standortübergreifenden Bereitstellung sollten auch bei der Automation Suite in erster Linie die Infrastruktur, die Datenquelle, die Verwaltung, das Ziel für die Wiederherstellungszeit, das Ziel für den Wiederherstellungspunkt usw. in Bezug auf die Architektur berücksichtigt werden.

Infrastruktur

Es wird empfohlen, für beide Cluster dieselbe Hardware zu verwenden. Der Automation Suite-Cluster funktioniert jedoch wahrscheinlich mit ähnlichen Hardwarekonfigurationen mit geringen Unterschieden. Heterogene Hardware kann die Komplexität erhöhen und die Fehlerbehebung verlangsamen.

Verwaltung

Die beiden Automation Suite-Cluster sind unabhängig und haben keine gemeinsame Konfiguration. Daher muss jede Verwaltungs- oder Wartungsaktivität für diese Cluster einzeln durchgeführt werden. Sie müssen beispielsweise die SQL-Verbindungszeichenfolgen auf beiden Clustern aktualisieren, Zertifikate getrennt konfigurieren usw. Zudem müssen Sie die beiden Cluster unabhängig voneinander überwachen, sie einzeln aktualisieren usw.

Datenquelle

Der Objektspeicher bildet in Kombination mit der SQL-Datenbank den Status eines installierten Produkts in der Automation Suite.

Die SQL Server-Konfiguration spielt eine wichtige Rolle in einer Bereitstellung mit mehreren Standorten. Obwohl der SQL-Server eine externe Komponente der Automation Suite ist, sind ein paar zusätzliche Schritte erforderlich, um eine echte HA bei der Arbeit mit der gesamten Automation Suite zu gewährleisten.

Der SQL-Server sollte entweder in der Always On-Verfügbarkeitsgruppe oder in einer Failure Over-Gruppe konfiguriert werden. Er muss auf beide Sites verteilt werden, um eine genaue Hochverfügbarkeit sicherzustellen, wenn eine Site ausfällt. Beide Cluster sollten denselben SQL Listener-Endpunkt in der Verbindungszeichenfolge verwenden. Darüber hinaus wird empfohlen, die Eigenschaft MultiSubnetFailover=True in der Verbindungszeichenfolge festzulegen, wenn der SQL-Server/die Datenbanken über mehrere Subnetze verteilt sind.

Weitere Informationen finden Sie unter Always On-Verfügbarkeitsgruppen und Voraussetzungen, Einschränkungen und Empfehlungen für Always On-Verfügbarkeitsgruppen.

Der externe Objektspeicher ist immun gegen eine mögliche Beeinträchtigung durch einen Knotenausfall. Datenreplikation und Disaster Recovery können unabhängig von der Automation Suite durchgeführt werden. Wie SQL-Server muss der externe Objektspeicher in einem High Availability Disaster Recovery-Setup konfiguriert werden. Die primäre Objektspeicherinstanz befindet sich physisch im primären Rechenzentrum und mindestens eine sekundäre Instanz befindet sich in dem sekundären Rechenzentrum mit aktivierter Datensynchronisierung. Sie können einen Lastausgleich auf dem Objektspeicher konfigurieren, um sicherzustellen, dass beide Automation Suite-Cluster auf dieselben Endpunkte verweisen. Somit ist die Bereitstellung von der internen Konfiguration des Objektspeichers unabhängig.

Wichtig:

Bei AWS S3 unterstützt der Zugriffspunkt mit mehreren Regionen nicht alle s3-APIs, die von allen Produkten benötigt werden, die in der Automation Suite ausgeführt werden. Weitere Informationen zur Liste der unterstützten APIs finden Sie unter Verwenden von Zugriffspunkten für mehrere Regionen mit unterstützten API-Vorgängen.

Sie können zwei Buckets pro Produkt/Suite in beiden Regionen erstellen und die Synchronisierung aktivieren. Der Automation Suite-Cluster, der in derselben Region ausgeführt wird, verweist auf die Buckets in derselben Region.

Ziel der Wiederherstellungszeit

Die RTO-Richtlinie Ihres Unternehmens ist für die Konzeption Ihres Automation Suite-Clusters mit mehreren Sites entscheidend. Berücksichtigen Sie die folgenden Aspekte, um das gewünschte RTO zu erreichen:

Design des Traffic Managers;
Verfügbarkeit der Knoten im sekundären/passiven Cluster;
Dynamische Workload-Verfügbarkeit auf dem sekundären Cluster; Beispiel: MLFähigkeit;
Konfigurationsverwaltung.

Traffic Manager

Sie können die Wiederherstellungszeit reduzieren, indem Sie den Traffic Manager so konfigurieren, dass der Datenverkehr immer an den primären Cluster weitergeleitet wird, wenn verfügbar. Die Umleitung zum sekundären Cluster darf nur dann erfolgen, wenn der primäre Cluster ausgefallen ist. Dies gewährleistet, dass die Verkehrsumschaltung automatisch erfolgt und die Zeit für eine manuelle Umschaltung verkürzt wird. Sie können dazu die Integritätsendpunkte der beiden Cluster verwenden.

Knotenverfügbarkeit

Wenn alle Knoten des sekundären Clusters ausgeführt werden, können Sie die Knoten zeitsparend einschalten und warten, bis der Cluster aktiv ist. Dadurch können sich jedoch die Kosten Ihrer Infrastruktur fast verdoppeln.

Dynamische Workload-Verfügbarkeit

Einige Produkte, z. B. das AI Center, stellen die ML-Fähigkeiten dynamisch zur Laufzeit bereit. Die Bereitstellung der Fähigkeiten in einem anderen Cluster ist immer asynchron. Dadurch kann ihre Verfügbarkeit nicht garantiert werden. Um sicherzustellen, dass Ihre Automatisierungslösung innerhalb der gewünschten Zeit wieder online ist, können Sie die Fähigkeiten in einem anderen Cluster regelmäßig synchronisieren.

Konfigurationsverwaltung

Da Automation Suite-Bereitstellungen mit mehreren Sites aus zwei verschiedenen Clustern bestehen, muss jeder Vorgang, der auf einem beliebigen Cluster ausgeführt wird, rechtzeitig auf dem anderen Cluster ausgeführt werden, um die Abweichung zu verringern. Dadurch wird sichergestellt, dass beide Cluster über ähnliche Konfigurationen verfügen und während der Wiederherstellungsphase kein zusätzlicher Aufwand erforderlich ist.

Ziel des Wiederherstellungspunkts

Die Richtlinie Ihrer Organisation rund um das Ziel des Wiederherstellungspunkts (Recovery Point Objective, RPO) ist von entscheidender Bedeutung für den Entwurf eines Automation Suite-Clusters mit mehreren Sites. Um das gewünschte RPO zu erreichen, müssen Sie die folgenden Aspekte berücksichtigen:

Datensynchronisierung;
Geplante Sicherung.

Datensynchronisierung

Wenn Daten in die primäre Datenquelle geschrieben werden, müssen sie auch mit dem sekundären Cluster synchronisiert werden. Es besteht jedoch das Risiko von Datenverlusten, wenn das Rechenzentrum ausgefallen ist und die Daten nicht synchronisiert werden. Beispielhafte Netzwerkkonfigurationen, z. B. hohe Bandbreite und geringe Latenz zwischen den beiden Rechenzentren, können die Synchronisierung beschleunigen.

Geplante Sicherung

Nicht jede Disaster Recovery bietet vollständige Immunität gegen Datenverlust. Sie können jedoch eine regelmäßige und periodische Sicherungsstrategie anwenden, um die negativen Auswirkungen auf die Datenwiederherstellung zu minimieren. Weitere Informationen finden Sie unter Sichern und Wiederherstellen des Clusters.

Auf dieser Seite