1 / 22

Exchange Server 白手起家系列 Down 机了怎么办 ?

Exchange Server 白手起家系列 Down 机了怎么办 ?. 喻 勇 , PMP/MCSE 微软最有价值专家,特约讲师 yy@yuyong.net 讲义下载: www.yuyong.net. 系列课程内容. 万事开头难 进行企业 IT 架构评估 做一个 Exchange 管理员必须掌握的技术 - 软件篇 做一个 Exchange 管理员必须掌握的技术 - 硬件篇 邮件系统设计和选型的原则 如何执行压力测试? 软件安装和服务器管理的规范化 用户和系统迁移过程中的注意事项 大规模的用户帐号管理、组管理中采用的常见策略 客户端部署和管理

salena
Download Presentation

Exchange Server 白手起家系列 Down 机了怎么办 ?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Exchange Server白手起家系列Down机了怎么办? 喻 勇, PMP/MCSE 微软最有价值专家,特约讲师 yy@yuyong.net 讲义下载:www.yuyong.net

  2. 系列课程内容 • 万事开头难 • 进行企业IT架构评估 • 做一个Exchange管理员必须掌握的技术-软件篇 • 做一个Exchange管理员必须掌握的技术-硬件篇 • 邮件系统设计和选型的原则 • 如何执行压力测试? • 软件安装和服务器管理的规范化 • 用户和系统迁移过程中的注意事项 • 大规模的用户帐号管理、组管理中采用的常见策略 • 客户端部署和管理 • 邮件系统日常维护的要点 • 系统SLA和监控流程 • 邮件安全、反病毒和反垃圾邮件 • 存储备份策略 • 你的系统可靠性有几个9? • Down机了怎么办? • 常见问题汇总和答疑

  3. 今日议程 • 本讲主要讨论如何制定针对系统突发事件和问题的解决对策,通过案例分析的形式,来讨论在制定应急预案时需要注意的问题以及如何贮备有助于快速解决问题的关键资源。 • 案例分析 • 经验总结

  4. 案例情景 • XYZ的公司邮件服务器在深夜发生故障,我们通过回顾两位工程师Tom和Jerry解决问题的不同经过和途径,来分析在系统发生灾难性故障时,应该如何从容应对 本故事纯属虚构,如果雷同,实属巧合 Tom and Jerry 动画形象版权归其公司所有

  5. Tom的故事

  6. Tom的故事(续)

  7. Tom的故事(续)

  8. Tom的故事(续)

  9. Tom案例数据汇总 • 从发生问题到发现问题:六个半小时 • 从发现问题到定位问题原因:一个半小时 • 从定位问题到恢复故障:两个小时零15分钟 • 从恢复故障到恢复数据:五个半小时 • 故障共持续:十五个半小时 • 直接经济损失:公司的千万订单 • 间接经济损失: • 公司的声誉 • Tom的工作

  10. Jerry的故事

  11. Jerry的故事(续)

  12. Jerry的故事(续)

  13. Jerry案例数据汇总 • 从发生问题到发现问题:3分钟 • 从发现问题到定位问题原因:7分钟 • 从定位问题到恢复故障:55分钟 • 从恢复故障到恢复数据:两个小时 • 故障共持续:三个小时 • 直接经济损失:无 • 间接经济损失:无

  14. 数据比对

  15. 服务器故障时间的组成部分 Mean Time to Repair (MTTR) “总的停机时间" 故障发生 检测到问题 诊断 修复 恢复服务 问题解决 下一次故障 检测时间 修复时间 Time Between Failures (MTBF) 响应时间 恢复时间 Time Between System Incidents (MTBSI)

  16. Mean Time to Repair (MTTR) “总的停机时间" 故障发生 3:00 检测到问题 9:30 诊断 11:00 修复 13:15 恢复服务 18:30 问题解决 18:30 故障发生 3:00 检测到问题 3:02 诊断 3:!5 修复 4:05 恢复服务 6:10 问题解决 6:10 Tom/Jerry的技术统计分析

  17. Tom/Jerry的技术统计分析

  18. 如何缩短停机故障时间(down机之前) • 训练有素的IT人员 • 保障有力的厂商支持服务 • 服务器参数和相关技术维护信息的可获得性 • 切实有效的灾难恢复预案和准确的预案实施

  19. 如何缩短停机故障时间(down机之后) • 沉着应对,避免二次故障 • 全面的判断故障的状况和受影响的范围 • 在必需时,及时进行技术提升(Escalation) • 理性的估算故障可能持续的时间 • 决定服务优先还是数据优先 • 对IT内部和用户的有效沟通 • 故障期间的平行任务 (Fast Tracking) • 在短时间无法恢复的情况下,为特定用户或服务启用备用方案

  20. TechNet是什么? • 只需轻轻点击,答案就在您的指尖 • 对于IT 专业人员来说,TechNet 是一个知识的宝库,你可以找到关于如何规划,部署和管理微软产品的的技术资源 订阅TechNet • 每月发放包含最新信息的 DVD或者CD • 这是最权威的资源,可以帮助你评估、配置和维护微软产品。 TechNet 网站 • 可以访问该站点 www.microsoft.com/china/technet • 在线资源和社区 • 订户--仅仅提供在线服务 TechNet 中文电子快报 • 两周发放一次的中文电子快报 • 安全更新, 新的资源等等 TechNet 活动 和网站消息 有关最新微软产品介绍和技术的简报 上机试验, “如何操作”等信息 中文社区 用户群 可管理的新闻组

  21. 我们从哪里可以了解到 TechNet? • 访问TechNet的官方网站www.microsoft.com/China/technet • 注册TechNet快报 www.microsoft.com/china/technet/abouttn/subscriptions/flash.mspx • 加入到中文在线论坛http://www.microsoft.com/china/community/ • 成为 TechNet的订户 • www.microsoft.com/china/technet • 参与到更多的TechNet活动中或者在线了解www.microsoft.com/china/technet

More Related