1 / 75

Exchange Server 2010 の高可用デザイン及び 障害時回復手順のポイント

セッション ID: T5-402. Exchange Server 2010 の高可用デザイン及び 障害時回復手順のポイント. 富士通 株式会社 プラットフォーム技術本部 MS ミドルウェア技術センター 堀内 啓士. セッションの目的 Exchange Server の高可用性機能を理解して頂く 障害発生時の振舞い、復旧手順を理解して頂く セッションのゴール 可用性の高い Exchange Server 2010 のシステムを構築する上で必要となる機能について説明 できるようになる。

javen
Download Presentation

Exchange Server 2010 の高可用デザイン及び 障害時回復手順のポイント

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. セッション ID: T5-402 Exchange Server 2010 の高可用デザイン及び障害時回復手順のポイント 富士通 株式会社 プラットフォーム技術本部 MS ミドルウェア技術センター 堀内 啓士

  2. セッションの目的 Exchange Server の高可用性機能を理解して頂く 障害発生時の振舞い、復旧手順を理解して頂く セッションのゴール 可用性の高い Exchange Server 2010 のシステムを構築する上で必要となる機能について説明できるようになる。 可用性要件を満たす Exchange Server 2010 システムを設計できるようになる。 障害が発生した場合のシーケンス、復旧手順を説明できるようになる。 セッションの目的とゴールSessionObjectives and Takeaways

  3. 自己紹介アライアンス チームでの SI 商談をバックアップ お客様 マーケティング 本部 MS ソリューション 推進部 プラットフォーム 技術本部 ISV センター 営業 部門 MSミドルウェア技術センター 最適ソリューション • テクニカル支援/情報提供 • 技術者育成支援 活動推進 施策実施 戦略協議・ 立案・遂行 SE 部門 業種/地域 営業 富士通アライアンス 営業本部

  4. アジェンダ Exchange Server 2010 の可用性 DAG 設定ポイント DAG 設定手順 障害発生時の動作 SP1 可用性機能 参考: バックアップ

  5. アジェンダ Exchange Server 2010 の可用性 • 各ロールの可用性 • Database Availability Group DAG 設定ポイント DAG 設定手順 障害発生時の動作 SP1 可用性機能 参考: バックアップ

  6. 各ロールの高可用性機能/1 • メールボックス(MBX) • サーバー ロール • Database Availability Group (DAG) • MSFC をベースとした非共有の冗長化 • ログ レプリケーション、最大 16 多重化 ハブトランスポート (HUB) サーバー ロール • 複数設置することで自動的に冗長化 • 負荷分散 • クライアント アクセス (CAS)サーバー ロール • NLB またはハードウェア ロード バランサー による IP ベースの冗長化方式を利用

  7. 各ロールの高可用性機能/2 • エッジトランスポート (EDGE)サーバー ロール • NLB • MX レコード • 複数の UM サーバーを展開し、VoIP ゲートウェイからラウンド ロビン • ユニファイドメッセージング サーバー ロール

  8. Exchange Server 2007 の高可用性機能 DB の 2 重化 サーバーの 2 重化 • 内蔵 HDD 利用前提 • 安価にシステム 全体を 2 重化 • Cluster ContinuousReplication • DB 部分のみ 2 重化 • LocalContinuousReplication サーバーの 2 重化 災害対策 • 構成に制限がない • 手動切り替え • StandbyContinuousReplication • 高信頼ストレージ 利用前提 • 一般的な 2 重化構成 • SingleCopyCluster SiteA SiteB

  9. DAG (Database Availability Group) • シードと呼ぶ DB フルコピー • トランザクション ログ ファイルの複製 • コピー先への再生 アクティブ パッシブ 1. シード処理 3. 再生 2. 複製

  10. シャドウ リダンダンシー • メール転送経路の冗長化 • 送信が完了するまでキューを保持 • 送信先の機能対応が必要 EDGE1 [NG] HUB SMTP シャドウキュー にコピー EDGE 2 [OK] 送信確認後、コピーを削除

  11. MBX オンライン 移動 • MBX の移動中でもメールの送受信が可能 • Exchange Server 2010 単独、もしくは Exchange Server 2007SP2 混在環境で利用可能 • 負荷再配分、メンテナンス等で利用可能 クライアント MBX 1 CAS MBX 2

  12. Exchange Server 2010 の可用性 DAG 設計ポイント • 仕様の確認 • Quorum モデル • DAG 設計のポイント • 構成例 DAG 設定手順 障害発生時の動作 SP1 可用性機能 参考: バックアップ

  13. DAG 構成条件 • ハードウェア要件なし • MSFC を利用するため、OS は EnterpriseEdition 以上 • Windows Server 2008 (SP2) Enterprise Edition 以上 • Windows Server 2008 R2 Enterprise Edition 以上 • Exchange Server の Edition はどちらでも可 • メンバー数が偶数の場合、ミラーリング監視サーバーを設置する • DAG 名=クラスター名=コンピューター名 • 250 msec以下のレイテンシ

  14. DAG 仕様 • 特徴 • 最大 16 多重 (アクティブ DB × 1 + パッシブ DB × 15) • データベース単位のフェールオーバー (≠サーバー単位) • 多重度/最大構成 • 16 MBX サーバー/DAG • 16 MBX サーバー × 100 DB/Member = 1,600 DB/DAG • トランザクション ログ コピー方法 • 高可用データベース コピー (HA database copies) • 時間差データベース コピー (Lagged database copies) • トランザクション ログ転送オプション • 経路指定、圧縮、暗号

  15. 関連オプション ReplicationEnabled NetworkCompression NetworkEncryption ReplicationPort MBX 1 MBX 2 LOG 1 アクティブ LOG 1 パッシブ TruncationLagTime ReplayLagTime DB 1 アクティブ DB 1 パッシブ Set-MailboxDatabaseCopy~ ReplayLagTime/TruncatelagTime Set-DatabaseAvailabilityGroup~ NetworkCompression/NetworkEncryption/ReplicationPort

  16. Quorum モデル • 奇数台の MBX サーバーで DAG を構成 • (MBX サーバー数–1) ÷ 2 台までの耐性 • ノード マジョリティ • 偶数台の MBX サーバーで DAG を構成 • MBX サーバー以外のファイル共有をノードとして扱う • MBX サーバー数 ÷ 2 台までの耐性 • ノード 及びファイル共有 マジョリティ 【ノードマジョリティ】 【ノード 及びファイル共有 マジョリティ】 ファイル共有 DAG DAG

  17. Quorum モデル • MBX サーバーの残存数が過半数以上の場合継続稼働 • 許容される障害数を超える DB コピー数が必要

  18. 設計のポイント サマリー 1 • ユーザー数等の要件から基本構成を決定 2 • 高可用性要件から集約度、冗長度を調整する 3 • 運用要件を構成に反映させる 4 • 冗長度によるサイジングの影響を把握する

  19. 基本構成の決定 • ユーザー数、MBX クォータ、プロファイルの決定 • MBX 数>アクティブ ユーザー数を意識する • MBX サーバーの CPU とメモリ、DAS を利用する場合はストレージ搭載量を確認 • MBX サーバーのスペックが決まれば、比率でHUB サーバー、CAS サーバーのスペックが決まる

  20. 高可用成要件の反映 • 耐 MBX サーバー故障台数の確認 • →許容させる MBX サーバー障害数の 2 倍以上の台数で構成 • → DB のコピー数は許容台数 + 1 • MBX サーバー故障時のユーザーへの影響度 • →集約しすぎると影響大、逆はコスト大 • 災害対策システムを構成する場合 • →想定する災害を明確にする • →災害後の要件を明確にする • →サイト内の冗長化 + サイト間冗長化が基本

  21. サーバー 1 台の故障に耐える構成サーバー 2 台、DB2 コピー MBX 1 MBX 2 DB 1 DB 1 ミラーリング 監視サーバー DB 2 DB 2 アクティブ データベース パッシブ データベース

  22. サーバー 2 台の故障に耐える構成サーバー 4 台、DB3 コピー MBX 1 MBX 2 MBX 3 MBX 4 DB 1 DB 1 DB 1 DB 2 DB 2 DB 2 ミラーリング 監視サーバー DB 3 DB 3 DB 3 DB 4 DB 4 DB 4 アクティブ データベース パッシブ データベース

  23. サーバー 3 台の故障に耐える構成サーバー 6 台、DB4 コピー MBX 1 MBX 2 MBX 3 MBX 4 MBX 5 MBX 6 DB 1 DB 1 DB 1 DB 1 DB 2 DB 2 DB 2 DB 2 DB 3 DB 3 DB 3 DB 3 ミラーリング 監視サーバー DB 4 DB 4 DB 4 DB 4 DB 5 DB 5 DB 5 DB 5 DB 6 DB 6 DB 6 DB 6 アクティブ データベース パッシブ データベース

  24. 運用要件の反映 • バックアップ製品の選択 • →要件が先か、バックアップ製品が先か? • バックアップ製品の特長把握 • →パッシブ DB からバックアップが可能な製品、ストレージの機能を制御できる製品 • バックアップ方法の選択 • → 2 次媒体への保管が必要か、D2D で良いか? • リカバリ • →リカバリできる粒度と方法を要件と合わせるDB 単位・MBX 単位・アイテム単位

  25. サイジングの注意点/1 • アクティブ/パッシブによる必要 CPU リソースの理解 • パッシブ DB は アクティブ DB の 15% の CPU リソースを要求 • パッシブ DB1 つにつき、アクティブ DB に 10% の CPU リソースを追加 • 障害発生後の最大リソースを想定する

  26. サイジングの注意点/2 • 縮退運転時 (= 最大リソース) を考慮する A A A A P P P コピー 処理用 (10%) CPU 待機 DB 処理用 (15%)

  27. 最小構成の DAG/1 • マルチロール× 2 • 負荷分散機構の外出し、FSW アクティブ データベース 負荷分散装置 パッシブ データベース AD サイト DAG HUB CAS MBX HUB CAS MBX DC/DNS • 複製 • 複製

  28. 最小構成の DAG/2 • シングル ロール or コンバインド ロール + MBX • 仮想化によるロールの分散、外部負荷分散装置不要 AD サイト DC/DNS HUB HUB NLB CAS CAS DAG MBX MBX

  29. 中規模 DAG • 多重度増により複数台故障の耐性 アクティブ データベース パッシブ データベース AD サイト ミラーリング 監視サーバー CAS アレイ HUB DC/DNS DAG MBX MBX MBX MBX

  30. 災害対策システム • プライマリ サイト単体、サイト間での冗長化 • 切り替えは手動 プライマリ データセンター セカンダリ データセンター ミラーリング 監視サーバー WAN DC/DNS DC/DNS CAS アレイ CAS アレイ HUB HUB DAG 1 MBX MBX MBX

  31. 大規模 災害対策システム • 各サイト単独、及びサイト間での冗長化 • サイト間切り替えは手動操作 プライマリ データセンター セカンダリ データセンター DAG 1 用ミラーリング監視サーバー DAG 2 用ミラーリング監視サーバー WAN DC/DNS DC/DNS CAS アレイ CAS アレイ HUB HUB DAG 1 Active Active Passive Passive MBX MBX MBX MBX DAG 2 Active Active Passive Passive MBX MBX MBX MBX

  32. Exchange Server 2010 の可用性 DAG 設計ポイント DAG 設計手順 • 確認項目 • 設定方法と手順 障害発生時の動作 SP1 可用性機能 参考: バックアップ

  33. DAG の設定手順 • 以下の項目を事前に決定しておく

  34. DAG の設定手順

  35. 設定画面と確認画面/DAG 作成

  36. 設定画面と確認画面/DAG 用 IP 指定

  37. 設定画面と確認画面/ノード追加

  38. 設定画面と確認画面/DB コピーの追加

  39. 設定画面と確認画面/参考

  40. ネットワーク アダプターの設定/1 • MAPI 用ネットワークを最優先にする

  41. ネットワーク アダプターの設定/2 • MAPI 用の構成

  42. ネットワーク アダプターの設定/3 • レプリケーション用の構成

  43. Exchange Server 2010 の可用性 DAG 設計ポイント DAG 設計手順 障害発生時の動作 • 障害時の動作 • 復旧手順 • 災害対策システム SP1 可用性機能 参考: バックアップ

  44. アクティブ マネージャー • DAG メンバー全ての MBX サーバーで実行されるコンポーネント • DB コピー間での移動、サーバー障害の検出 • クラスター グループを所有する ノード が役割を持つ • アクティブ化、パッシブ化の決定 • トポロジの変更通知の受信 • SAM の役割 • プライマリ • アクティブ マネージャー (PAM) スタンバイ アクティブ マネージャー (SAM) • PAM 以外のノード • ローカル データベース、IS の障害検出 • PAM への情報通知

  45. コピー キューと再生キュー

  46. コピー キューと再生キュー • アクティブ DB コピーからパッシブ DB コピーへのコピー待ちのキュー数 • 長さが 10 未満であることが優先アクティブ化条件 • コピー キュー • パッシブ DB コピーへの再生を待つキュー数 • 長さが 50 未満であることが優先アクティブ化条件 • 再生 キュー

  47. コピー キューと再生キュー • DB コピーの状態が以下の 4 つの場合に、 アクティブ化するパッシブ DB コピーを優先順位から選定 • 同優先順位が複数ある場合、アクティブ化優先順位番号 (Activation Preference) で決定する

  48. ディスク/サーバー障害時の振舞い • アクティブ マネージャーによる障害の検出 • PAM によるアクティブ化する DB の選出 • 障害の発生した DB から未コピー ログを抽出 • 消失ログが設定値 (AutoDatabaseMountDial) 以下であればマウントされる • 消失ログが設定値外の場合、自動的にマウントされない

  49. ディスク障害時フロー MBX 1 MBX 2 MBX 1 MBX 2 • データベースに • 障害発生 アクティブ マネージャーが障害を検知 DB 1 DB 1 DB 1 DB 2 アクティブ マネージャーがアクティブ化するデータベースを選択 消失ログ 同期・ 再シード DB 2 DB 2 DB 2 DB 2 DB 3 DB 3 DB 3 DB 3 失敗 障害の発生したデータベースから 消失ログをコピー 成功 許容範囲外 消失ログの許容量を確認 失敗 許容範囲内 手動でマウント 消失ログの回復 メールボックス データベースの マウント (障害復旧) 成功 障害が発生したデータベースの回復 同期または再シードにより データベース コピーを復旧

More Related