クラスターをバックアップおよび復元する

Automation Suite では、バックアップと復元の機能がサポートされており、さまざまなシナリオにおいてデータが失われるのを防ぎます。インストール後にいつでもバックアップを構成できます。

バックアップと復元の機能を使用するには、NFS サーバー、バックアップクラスター、復元クラスターを有効化する必要があります。これらの概念は以下のセクションで定義されています。

用語

NFS サーバー – バックアップデータを保存し、復元を容易にするサーバーです。NFS サーバーは任意のマシン、または、クラウドプロバイダーが提供する PaaS サービス上でセットアップできます。Windows ベースの NFS および Azure BLOB ベースの NFS はサポートされませんので、ご注意ください。

バックアップクラスター – Automation Suite をインストールするために設定したクラスター。このクラスターでバックアップを有効化します。

復元クラスターは、バックアップクラスターのすべてのデータを復元するクラスターです。このクラスターが、復元プロセスの完了後に Automation Suite を実行する新しいクラスターになります。

前提条件

注: この設定では、クラスターのバックアップのみが有効化されます。これには、クラスター構成や、サーバーマシンに接続されている /datadisk 内のクラスター内ストレージの一部として保存されるデータが含まれます。

ただし、SQL データベースなどの外部データソースのバックアップは有効化されません。外部データソースのバックアップは、別途有効化する必要があります。

バックアップを有効化した後に新しいサーバーノードを追加する場合は、前提条件が満たされていることを確認し、次の手順を実行して新しいノードでバックアップを有効化します。

新しいノードへのアクセスを許可するように NFS サーバーを構成します。詳細については、「ノードに NFS マウントポイントのアクセスを許可する」をご覧ください。
新しいサーバーノードのバックアップを有効化します。

自動: クラスターのバックアップを有効化する

手動: クラスターのバックアップを有効化する

バックアップと復元の機能を設定するには、次の要件を満たす必要があります。

Linux では NFSv4 を使用する必要があります。
NFS サーバーは、バックアップおよび復元クラスターの外部でホストされた別個のマシンに設定する必要があります。
NFS サーバーと、バックアップおよび復元クラスターとの間に10 ミリ秒を超える往復時間 (RTT) のレイテンシがあってはなりません。
バックアップするクラスターと NFS サーバーは同じリージョンにある必要があります。

NFS サーバーは、次のハードウェア要件を満たす必要があります。

CPU	RAM	ディスク
4 (v-)CPU	16 GiB	10 TiB の SSD (1100 IOPS)

NFS サーバーには、すべてのクラスターノードから到達できる必要があります。

NFS サーバーと、バックアップクラスター内のすべてのノードで、以下のポートを有効化する必要があります。クラスターを復元する場合、復元クラスターのすべてのノードで同じポートを開く必要があります。

ポート	プロトコル	目的
`2049`	TCP	NFS サーバーとバックアップおよび復元クラスター間の双方向通信。これは、NFS サーバーが実行されるポートです。
`111`	TCP	NFS サーバーとバックアップおよび復元クラスター間の双方向通信。このポートは、NFS サーバーとバックアップと復元クラスター間の rpcbind に使用されます。

バックアップ構成を準備する

バックアップを有効化するには、バックアップサーバーと間隔を backup.json というファイルで構成する必要があります。

そのためには、以下の手順に従ってください。

backup.json という名前のファイルを作成します。
```
{
  "backup": {
    "etcdBackupPath": "PLACEHOLDER",
    "nfs": {
      "endpoint": "PLACEHOLDER",
      "mountpath": "PLACEHOLDER"
    }
  },
  "backup_interval": "15"
}{
  "backup": {
    "etcdBackupPath": "PLACEHOLDER",
    "nfs": {
      "endpoint": "PLACEHOLDER",
      "mountpath": "PLACEHOLDER"
    }
  },
  "backup_interval": "15"
}
```

次のフィールド定義に基づいてファイルに入力します。

パラメーター	構成
`backup.etcdBackupPath`	バックアップデータが保存される NFS サーバー上の相対パスです。クラスターの名前を指定できます。例: `cluster0`
`backup.nfs.endpoint`	NFS サーバーのエンドポイント (IP アドレスまたは DNS 名) です。これは、NFS マシンの FQDN または IP アドレスです。エンドポイントにプロトコルが存在してはなりません。例: `nfs.automationsuite.mycompany.com`、`20.224.01.66`
`backup.nfs.mountpath`	NFS サーバーのパス (エンドポイント) です。これは、クラスターのバックアップを保存するためのディスクが接続されている場所です。例: `/asbackup`
`backup_interval`	バックアップの時間間隔 (分単位)。この間隔は、2 つの連続するバックアップ間のリードタイムです。復元できるのは最後に成功したバックアップのみであるため、この間隔は慎重に決定する必要があります。バックアップ間隔は最短で 15 分に設定できます。

重要:

バックアップ間隔が短すぎると (例: 30 分)、バックアップ操作の頻度が高くなりすぎ、強制的に、直前の 30 分間にバックアップされたデータのみが保存されます。同様に、バックアップ間隔が 1 週間の場合、前回のバックアップから障害発生時までの間のデータが失われる可能性があります。したがって、バックアップ間隔は、回復ポイントの目標 (RPO) の要件に沿ったものにすることをお勧めします。
外部 SQL Server のバックアップを設定する際には、クラスターのバックアップ間隔を考慮する必要があります。外部 SQL Server と Automation Suite クラスターの両方に同じ間隔を設定することをお勧めします。
クラスター内でバックアップを有効化すると、バックアップ間隔に関係なく、Automation Suite によって即座にバックアップがトリガーされます。その後、次のバックアップのスケジュールがバックアップ間隔に基づいて設定されます。
バックアップを確認するには、NFS サーバーにログインし、パス /backup.nfs.mountpath/backup.etcdBackupPath に移動します。例: /asbackup/cluster0

Automation Suite では、AI Center のトレーニングパイプラインに接続されたボリュームなど、一部の永続ボリュームのバックアップは作成されません。バックアップが作成される永続ボリュームは、Alert Manager、Prometheus、Docker Registry、MongoDB、RabbitMQ、Ceph Objectstore、Insights など、一部だけです。

復元の構成を準備する

バックアップデータからクラスターを復元するには、復元サーバーの構成を restore.json というファイルで指定する必要があります。

そのためには、以下の手順に従ってください。

restore.json という名前のファイルを作成します。

{
  "restore": {
    "etcdRestorePath": "PLACEHOLDER",
    "nfs": {
      "endpoint": "PLACEHOLDER",
      "mountpath": "PLACEHOLDER"
    }
  }
}{
  "restore": {
    "etcdRestorePath": "PLACEHOLDER",
    "nfs": {
      "endpoint": "PLACEHOLDER",
      "mountpath": "PLACEHOLDER"
    }
  }
}

次のフィールド定義に基づいてファイルに入力します。

パラメーター	構成
`restore.etcdRestorePath`	データの復元元となる NFS サーバー上のパスです。`backup.json` で `backup.etcBackupPath` に指定した名前と同じでなければなりません。例: `cluster0`
`restore.nfs.endpoint`	NFS サーバーのエンドポイントです。これは、NFS マシンの FQDN または IP アドレスになります。エンドポイントにプロトコルが存在してはなりません。例: `nfs.automationsuite.mycompany.com`、`20.224.01.66`
`restore.nfs.mountpath`	NFS サーバーのマウントパス。これは、クラスターのバックアップを保存するためのディスクが接続されている場所です。例: `/asbackup`