AWS Elastic Disaster Recovery連携

AWS Elastic Disaster Recovery (DRS)はコスト効率の良い災害復旧ソリューションで、ダウン時間の短縮、データロスの防止、サーバーの最新バックアップの維持を行います。

概要

Site24x7のAWS DRS連携で、災害復旧操作の監視と管理を行えます。
この連携によりAWS DRS環境をリアルタイムに監視し、災害復旧設定の正常性とパフォーマンスを追跡します。

Elastic Disaster Recovery

Elastic Disaster Recovery監視には次の2つの子監視が含まれます。

  • DRSソースサーバー:全ソースサーバーを監視し、Amazon CloudWatchでサポートしているメトリックを表示します。
  • DRSリカバリーインスタンス:特定のソースサーバーとリバースレプリケーションのリカバリーインスタンスを監視します。

ユースケース

Elastic Disaster Recovery監視で複数のソースサーバーとリカバリーインスタンスが存在し、災害復旧イベントを取得したいとします。

このような場合にDRS環境とSite24x7を連携してDRSの概要を分析し、ソースサーバー、リカバリーインスタンスを監視できます。
これにより、CloudWatchメトリックを監視してアクションを行い、ダウン時間の短縮、オンプレミスとクラウドアプリケーションのデータロスの防止に繋げます。

連携の利点

この連携により利点は次のとおりです。

  • 災害復旧環境を包括的に監視し表示します。
  • 各ソースサーバーとリカバリーインスタンスレベルでの監視を行えます。
  • メトリックにしきい値を設定し、しきい値違反が発生した際にアラートを通知します。
  • 災害復旧プロセスの管理、最適化を行えます。

設定

  1. Site24x7にログインします。
  2. [Cloud]→[AWS]→[AWSアカウントの連携]に移動し、IAMロールの作成してAWSリソースへのアクセス権をSite24x7に付与します。
  3. AWSアカウントの連携ページで、ディスカバリーするサービスリストの[Elastic Disaster Recovery]にチェックが入力されていることを確認します。

権限

DRSを監視にするには、Site24x7 IAMロールに次の権限が必要です。

  • "drs:DescribeSourceServers"
  • "drs:ListStagingAccounts"
  • "drs:ListTagsForResource"
  • "drs:GetReplicationConfiguration"
  • "drs:GetLaunchConfiguration"
  • "drs:DescribeRecoveryInstances"

チェック間隔

Site24x7が設定ポーリング間隔(1分から1日)ごとにCloudWatch APIにクエリし、リソースのパフォーマンスメトリックを収集します。

サポートしているメトリック

Elastic Disaster Recovery

Elastic Disaster Recovery監視でサポートしているメトリックは次のとおりです。

メトリック名 説明 統計 単位
ソースサーバー数の合計 ソースサーバー数の合計です。 最大
アクティブソースサーバー数 アクティブソースサーバー数の合計です。 最大

DRSソースサーバー

DRSソースサーバー監視でサポートしているメトリックは次のとおりです。

メトリック名 説明 統計 単位
バックログ まだ同期されていないデータ量です。 平均 バイト
レプリケーション経過期間 直近のドリルまたはリカバリーインスタンスの起動から経過した時間です。 平均
直近のリカバリー起動からの期間 サーバーのレプリケーション処理時間の累積量です。 平均
レプリケーション中 レプリケーションに成功したサーバーストレージのパーセンテージです。 平均 パーセント
遅延期間 直近のスナップショットからの経過時間です。 平均

DRSリカバリーインスタンス

DRSリカバリーインスタンス監視でサポートしているメトリックは次のとおりです。

メトリック名 説明 統計 単位
遅延期間 直近のスナップショットからの経過時間です。 平均
バックログ 起動したリカバリーインスタンスに書き込まれたが、まだターゲットサーバーにコピーされていないデータ量です。 平均 バイト
レプリケーション経過期間 レプリケーション開始からの経過時間です。 平均
レプリケーション中 リカバリーインスタンスのレプリケーション進捗度です。 平均 パーセント

しきい値設定

Elastic Disaster Recovery監視のしきい値設定方法は次のとおりです。

  1. Site24x7にログインし、[管理]→[設定プロファイル]→[しきい値と可用性]に移動します。
  2. [しきい値プロファイルの追加]→[しきい値プロファイル]をクリックします。
  3. 監視タイプを選択し、表示名にプロファイル名を入力します。監視タイプは[Elastic Disaster Recovery]、[DRSソースサーバー]、[DRSリカバリーインスタンス]が該当します。
  4. しきい値の設定項目にサポートしているメトリックが表示されます。
  5. [保存]をクリックします。

ライセンス

  • Elastic Disaster Recovery:Elastic Disaster Recovery監視につき、1ベーシック監視ライセンスを消費します。
  • DRSソースサーバー:DRSソースサーバー監視につき、1ベーシック監視ライセンスを消費します。
  • DRSリカバリーインスタンス:DRSリカバリーインスタンス監視につき、1ベーシック監視ライセンスを消費します。

DRSデータの表示

Site24x7にログインし、[Cloud]→[AWS]→[AWSアカウント名]→[Elastic Disaster Recovery]に移動します。

監視データ

Elastic Disaster Recovery監視とその子監視で表示できるデータは次のとおりです。

Elastic Disaster Recovery

Elastic Disaster Recovery監視データは次のタブで表示されます。

[サマリー]

概要のイベントタイムラインとグラフ形式のメトリックを表示します。リージョン、ソースサーバー数合計、アクティブソースサーバー数などの情報が表示されます。

[ソースサーバー]

ソースサーバーの可用性とDRSソースサーバー監視の名前、遅延期間、バックログなどの情報が表示されます。[しきい値設定]をクリックして、DRSソースサーバー監視のしきい値を設定できます。

各監視名をクリックすることで、DRSソースサーバー監視情報を表示します。

[リカバリーインスタンス]

DRSリカバリーインスタンスの可用性と名前、遅延期間、バックログなどの情報を表示します。[しきい値設定]をクリックして、DRSリカバリーインスタンス監視のしきい値を設定できます。

各監視名をクリックすることで、DRSリカバリーインスタンス監視情報を表示します。

[障害]

障害の開始時間、終了時間、期間、コメントの情報を表示します。

[インベントリー]

リソース名、リージョン、監視ライセンスカテゴリーなどの情報を表示します。しきい値と可用性プロファイル、通知プロファイルの設定などもここから行えます。

ログレポート

Elastic Disaster Recovery監視のステータスに関するレポートを表示します。CSVファイルとしてダウンロードも可能です。

DRSソースサーバー

DRSソースサーバー監視データは次のタブで表示されます。

[サマリー]

概要のイベントタイムライン、遅延期間などのグラフ形式メトリックを表示します。

[リカバリーインスタンス]

DRSリカバリーインスタンス監視の可用性や名前、遅延期間、バックログを表示します。[しきい値設定]をクリックし、DRSリカバリーインスタンス監視のしきい値を設定できます。各監視名をクリックすることで、DRSリカバリーインスタンス監視情報を表示できます。

[設定詳細]

リージョン、AWSソースサーバーID、エージェントバージョン、AWSインスタンスIDなどの情報を表示します。

レプリケーション設定

リージョン、AWSソースサーバーID、サブネット、レプリケーションサーバーインスタンスタイプといったDRSソースサーバー監視のレプリケーション設定情報を表示します。

[起動設定]

リージョン、AWSソースサーバーID、インスタンスタイプサイジング情報などの情報を表示します。

[障害]

障害の開始時間、終了時間、期間、コメントといった情報を表示します。

[インベントリー]

リソース名、リージョン、監視ライセンスカテゴリーなどの情報を表示します。しきい値と可用性プロファイル、通知プロファイルの設定などもここから行えます。

ログレポート

Elastic Disaster Recovery監視のステータスに関するレポートを表示します。CSVファイルとしてダウンロードも可能です。

DRSリカバリーインスタンス

DRSリカバリーインスタンス監視データは次のタブで表示されます。

[サマリー]

概要のイベントタイムライン、遅延期間などのグラフ形式メトリックを表示します。

[監視リソース]

監視リソースタブで、Site24x7で監視しているリソースを表示します。

[設定詳細]

リージョン、AWSリカバリーインスタンスID、リカバリーインスタンスARN、エージェントバージョンなどの情報を表示します。

[障害]

障害の開始時間、終了時間、期間、コメントといった情報を表示します。

[インベントリー]

リソース名、リージョン、監視ライセンスカテゴリーなどの情報を表示します。しきい値と可用性プロファイル、通知プロファイルの設定などもここから行えます。

ログレポート

Elastic Disaster Recovery監視のステータスに関するレポートを表示します。CSVファイルとしてダウンロードも可能です。