510 likes | 684 Views
金融业 IT 运维新视角. IT 运维发展与现况. 客户 / 用户看到的、接触的是 什么 ?. 一旦出现问题 ……. 结果是 ATM 机、 柜台取 不到 钱、电话银行打不通、网银无法交易, 所有业务不能 办理. 其实问题是 ……. 无完整 业务视图. 无法明确定位问题. 业务 服务关系不明. 单 点工 具 监 控事 件 局部优化的问题 全局业务观. 用户 <> 监 控设 备 问题分配困难 精 确定 位问题. 业 务和 IT 进行可视化建模 业务服务和 IT 元 素关系 过时的 IT 资源和业务关系视图.
E N D
一旦出现问题…… 结果是 ATM机、柜台取不到钱、电话银行打不通、网银无法交易,所有业务不能办理
其实问题是…… 无完整业务视图 无法明确定位问题 业务服务关系不明 • 单点工具监控事件 • 局部优化的问题 • 全局业务观 • 用户<>监控设备 • 问题分配困难 • 精确定位问题 • 业务和IT进行可视化建模 • 业务服务和IT元素关系 • 过时的IT资源和业务关系视图 “43% 服务台故障工单来自于终端用户.” 80% 的服务中断是由计划外的或者执行不当的变更造成的. 80% 的平均故障修复时间(MTTR)花在查找最近发生了什么变更上.
完美的布局? Meets SLA Breaks SLA 05:00 06:00 07:00 08:00 09:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 Web服务器 Web管理员 J2EE服务器 应用管理员 目录服务 系统管理员 DBA 数据库 虚拟化及OS 系统管理员 网络管理员 网络 应急故障处理组 服务 终端用户/客户
以用户的体验为出发点才是王道 Web Server App Server DB Server End Users Internet WAN OS OS OS VM VM VM Network Network Network
要求关键业务交易快速响应,保证营运效率,促进业务营收增长要求关键业务交易快速响应,保证营运效率,促进业务营收增长 业务多样,数据量大,操作失败和灾难发生风险高,系统连续与可用性受影响 要求服务及应用高连续、可用性,降低维护运营成本,提高最终客户满意度 针对业务应用交易,管理每一笔关键交易,分析所有潜客与客户行为与偏好 无法提供端对端、全程跟踪业务交易,对于未交易行为,更是无法掌控 应用架构复杂,难以对系统性能进行监控和管理,并对可能问题进行分析和处理 IT 面临的挑战 满足不断增长变化多端的业务需求 业务目标 缺乏共同语言 时间和资源 约束 IT运营
新一代监控方法论 ─ APM • APM是 Application Performance monitoring 的缩写,中文翻译为应用性能监控 • APM是一种现代监控方法,通过发现和解决软件系统的问题,来达到提高用户体验的目的 • 它从终端用户的视角监控软件应用的性能 • 完整的APM解决方案通常包含最终用户体验,应用交易过程和底层的相关技术组建(如物理与虚拟服务器,数据库,操作系统,网络组件)三个方面的性能数据。
APM对于用户的价值 有了 APM 软件,应用再发生故障时,就可以避免维护团队间责任难辨的问题,减少问题的平均解决时间(MTTR),这是因为APM软件会帮助他们快速解答如下的问题:
所以 … IT管理也需 与时俱进
录制浏览器或客户端交易脚本 “一处录制,多处播放” —— 交易模拟机器人 交易/步骤可用性监控与告警 交易/步骤执行时间分析 建立交易性能基线 WEB WEB 业务化:最终用户模拟 主机 Apache WebSphere 中间件 数据库 CICS 防火墙 WebLogic
业务化:真实用户交易 监听设备 实际 最终用户 广 州 Web服务器 应用服务器 数据库 网关 北 京 实际 最终用户 • 实时捕捉全部真实用户Web交易 • 提取交易性能指标:频次、响应时间、访问速度、网络流量…… • 多视角分析交易:页面、页面元素、会话、应用、地域、浏览器类型……
真实用户交易 ─ 用户行为了解 • 统计用户后继操作(页面请求)的频次,定位最经常的后继请求 • 发现用户常用的页面访问序列,提取特征业务/服务 • 按地域统计页面下载性能
业务化:用户会话录制 扩展录制 监听设备 实际 最终用户 广 州 Web服务器 应用服务器 数据库 网关 北 京 实际 最终用户 • 即时存储实际用户的完整交易内容 • 真实再现用户所见所得的页面、元素、信息 • 实时活动会话监控,历史会话回放 • 提供用户行为分析
业务化:业务服务影响模型 • BSM建模方法论 • 业务流程 • 业务模型 • 服务模型编辑器 • 业务服务影响模型
戴尔 IT 运维管理1.业务导向2.支撑模型3.多层分析
运营终端 层次化:业务 ─ 应用 ─ 系统 监控服务器 运维人员 监控平台 业务监控 交易监控 J2EE .Net SAP …… J2EE深度监控 应用监控 主机 网络 存储 …… 扩展监控 系统监控
监控应用及应用服务器 • Java container & JVM 监控 • 内存泄漏侦测 • 不间断监控 Java 请求 • Web 服务器监控 • 按需对交易深入追踪、诊断 • 对指定方法进行监控
监控与深入诊断分析:数据库级 • 监控数据库 • 数据库状态监控 • 数据库指标监控 • 告警 • Oracle告警日志中的ORA-错误 • 表空间快满 • 某个等待事件百分比超标 • 某SQL占用CPU或I/O很多 • 无效对象 • 专家建议 数据库负载与TopSQL多维分析 SQL语句自动优化 监控企业中所有数据库 自动化性能建议! 仪表板式监控数据库
监控与深入诊断分析:虚拟化环境 • 监控虚拟机环境 • 管理虚拟化环境所有组件的关系及其交互 • 针对事件以及问题的DDR提供 • 保证性能及可用性 • 容量规划 • Chargeback流程
戴尔 IT 运维管理1.业务导向2.支撑模型3.多层分析4.决策支持
决策分析 ─ 在线交易业务应用分析 分析用户进行什么操作。 业务交易报警。 几乎每个用户都运到同样的问题,对业务产生严重影响。 用户放弃操作,是什么原因导致?
决策分析 --- 来自业务化数据 • 了解最终用户的真正感知? • 分析各地域最终用户的使用喜好、购买模式? • 找出复杂且广泛的应用系统中最大的压力点。 • 利用数据分析针对性地提供改正措施 • 留住客户?
戴尔 IT 运维管理1.业务导向2.支撑模型3.多层分析4.决策支持5.灵活展现
灵活展现 ─ 多维分析查询 依照类SQL查询条件进行客制化分析
J2EE报告 服务器汇总 性能 … 数据库报告 负载 Top SQL RAC均衡 存储空间 … 主机报告 事件分析 CPU 内存 … 灵活展现 ─ 更多定制报表
人治 • 凭借个人经验 • 完全依靠员工意识 • 做什么怎么做都由领导定 • 条块分割,各自为政 • 科学管理 • 科学的管理体系 • 有效的管理流程 • 面向业务的IT管理观念 • 统一的管理模式 • 被动运行 • 兵来将挡,水来土掩; • 头痛医头,脚痛医脚; • 工具一堆,问题仍在 • 安全运行 • 主动发现问题和隐患 • 完善的监管手段 • 加强预防,快速反应 • 生命周期管理 管理与变革
业务管理 戴尔 IT 运维管理解决方案 Dell IT运维管理模块化 IT管理 应用性能管理 数据库性能管理 物理与虚拟化架构管理 服务等级管理 最终用户体验管理 • 基于角色的仪表板 • 服务定义 • SLA / OLA 策略 • 依赖关系映射 • 组件发现 • 第三方集成 • 应用系统服务器监控 • 组件级监控 • 事务跟踪 • Web 服务器监控 • 消息队列监控 • 合成用户记录和回放 • 真实用户性能监控 • 真实用户会话捕获和回放 • 业务分析数据集市 • 数据库监控 • 实时数据库诊断 • 数据库工作负载分析 • 数据库优化 • 操作系统监控 • 虚拟服务器监控 • 虚拟机生命周期管理
戴尔 IT 运维解决方案价值体现 灵活的模块化架构 • 通过整合或删除领域专门监控和诊断工具降低维护和续订成本,而不损失任何功能 • 将 APM 添加到现有的事件管理工具,以保持广阔的资源覆盖度 – 无需“淘汰和更换” • 弥补与管理关键应用系统和最终用户相关的功能空缺 卓越的用户体验监控 • 通过提高用户和客户满意度推动网站活动发展 • 通过提高可用性和易用性提高收入 • 搜索并采用直观的方式回放每位用户与您网站之间的交互情况,以便“了解他们查看的信息” 加强各利益干系方之间的协作 • 将 IT 部门的工作重点从运营转变为创新 • 各利益干系方共享通用监控环境模型,运用角色特定的显示内容和跨团队工作流程加速问题了解和解决 • 消除各分散团队之间的责任风暴,大幅缩短问题解决时间 诊断和解决问题 — 端到端 • 预测技术使用情况,帮助实现业务增长 • 市场上最完善的企业 APM 解决方案,在数据库、通信软件、管理系统、网络和存储中应用系统和最终用户监控与应用系统感知的深入诊断
戴尔在软件领域的领先地位 超过15亿美元 超过6,000名 1,600 + 软件工程师 软件收入 (根据销售额估计) 团队成员 2,500 + 软件销售 200万 90% + 100万 全球1000 强客户是戴尔软件的客户 客户基础 用户社区成员 EMA Gartner NSS Labs Boomi 在云整合雷达报告中被列入“价值领导者” 综合防护能力最强的 下一代防火墙 9 大魔力象限名列前茅
戴尔软件解决方案 移动办公管理 信息数据管理 数据中心和云计算 • 数据库管理 • 商业智能/分析 • 应用系统及数据集成 • 大数据分析 • 客户端管理 • 系统性能监控及管理 • 虚拟化及云管理 • Windows 服务器管理 • 移动设备管理 • 桌面虚拟化 • 应用及数据访问 • 安全的远程访问 安全 数据保护 • 身份识别及访问授权管理 • 网络安全 • 终端安全 • 电子邮件安全 • 企业级备份及恢复 • 虚拟化下的安全 • 应用系统保护 • 灾难恢复