390 likes | 590 Views
美国 飞康 软件 公司 环境适应性容灾 解决方案 中 国 区 技术总监 颜军. 美国 飞康 公司 简介. 成立于 2000 ,主要成员来自 原 美国 Cheyenne Software ( 夏恩软件)的 专业团队 成功 创 立 ARCserve 为 基于 服务器备份软件的第一品牌 1996 年被 Computer Associates (CA) 以 12 亿美金 (US$1.2Billion) 收购 公司总部设在美国纽约州的 Melville 全球销售及支持体系,在十五个主要国家设有办事机构 全球超过 300 名员工 中国分部近七十人,分布北京及上海
E N D
美国飞康软件公司环境适应性容灾解决方案中国区技术总监颜军美国飞康软件公司环境适应性容灾解决方案中国区技术总监颜军
美国飞康公司简介 • 成立于 2000,主要成员来自原美国 Cheyenne Software (夏恩软件)的专业团队 • 成功创立 ARCserve 为基于服务器备份软件的第一品牌 • 1996年被 Computer Associates (CA) 以12亿美金 (US$1.2Billion) 收购 • 公司总部设在美国纽约州的Melville • 全球销售及支持体系,在十五个主要国家设有办事机构 • 全球超过300名员工 • 中国分部近七十人,分布北京及上海 • 基于网络存储的架构,为企业数据的高可用性提供最佳解决方案 • 已拥有全球近千家企业级用户 • 创新的数据保护技术获得业界的公认并被广泛采纳 • 美国NASDAQ 上市公司,市值 超过 3亿美金,股票代码为: FALC • 2005 年销售额增长 69%
业务连续性管理 一个危机应急的框架,涵盖 --风险管理 --供应链管理 --IT容灾和恢复 --环境设施管理 --安全管理
重要的业务连续性指标 • (1). 数据恢复点目标RPO(RECOVERY POINT OBJECTIVE):体现为该流程在灾难 发生后,恢复运转时数据丢失的可容忍程度;如丢失1小时数据称RPO=1小时。 • (2). 恢复时间目标RTO(RECOVERY TIME OBJECTIE):体现为该流程在灾难发生后,需要恢复的紧迫性也即多久能够得到恢复的问题;如业务停止1小时称RTO=1小时
IT系统潜在的系统风险评估 • 主机系统故障 • 存储设备故障 • 突然断电 • 计划内停机 • 人为误操作导致数据丢失 • 自然灾害 • 火灾 • 恐怖活动 • 。。。。 容灾系统
容灾的一种分级方式 • 数据级容灾 • --确保RPO的有效性,确保数据的完整性 • 应用级容灾 • --确保RPO和RTO的有效性,确保交易的连续性 • 远程备份 • --通过vaulting等方式实现磁带远程存放
容灾的几种模式 • 同步 • 异步 • --连续异步方式 • --Delta增量异步方式
% Uptime IAI 30 seconds 99.9999 5 minutes 99.999 52 minutes 99.99 8.75 hours 99.9 A V A I L A B I L I T Y 43.7 hours 99.5 87.6 hours 99.0 180+ hours 98.0 450+ hours 95.0 IT系统高可用HA的级别 每年宕机时间 Savings ($)
常规容灾的技术手段 Offsite tape storage • 难于管理 • 耗费人工 • 需要漫长的恢复手段 • 磁带恢复的可靠性? Host-to-host replication • 多个管理点 • OS内需要专用软件 • 影响主机的处理能力 • 缺少数据库的特别支持体系 • 主机必须为同一系统 Disk array-to-disk array replication • 无法跨设备复制,形成设备瓶颈 • 需要加接远程传输设备 • 缺少数据库的特别支持体系
一个典型的用户现有环境和DR环境 LAN LAN Backup Server +Backup Software SQL Cluster Windows Exchange Oracle RAC Oracle Linux SQL Windows SAN Backup Stream FC Switch IP远程连接 FC Switch P 远程复制 Tape Library 磁盘阵列B 磁盘阵列A
问题 • 容灾中心设备选择 --容灾中心的设备选择能否开放? --生产中心的原有主机系统和存储系统能否保留? • 恢复指标 --数据库数据一致性如何保证? --人为的误操作能够恢复吗? --本地恢复的速度有多快?
问题 • 建置本地系统的HA时,主机与存储之间没有依赖关系,但建置容灾(DR时,是否也能如同 HA 般无相关性?还是被强置要求一定要连同主机、存储设备一起进行对称性建设? ---(异构设备间的容灾) • 除了部署异地灾备系统以避免火灾,水灾,地震,停电等天灾外,能否保护长期潜在的病毒、黑客、人员误操作等带来的人祸呢? ---(渐变式灾难的保护)
问题 • 能否满足我的环境和我的要求? • 能否一劳永逸,建立全部灾难的防御系统? • 能够通过本地系统就能解决大量的故障恢复?
Hostnot on SAN(DASD) C: D: 飞康公司的CDP+DR解决方案 DiskSafe C: D: C: D: TM-1 TM-2 Key Benefits • 任意存储之间 • 增量级别的复制(时间增量、数据增量) • 重点在于最佳的 RTO (minutes) • 连续复制,并且提供256个快照拷贝能力
飞康公司的几种保护模式 • In-band • 很小的性能影响,释放主机和存储负荷 • 提供强大的服务功能 • 智能cache提速 • Side-band 旁路型 • 不占用数据通路 • 使用低级别存储 • 保护生产系统,最小改动 In-Band Side-Band Host DiskSafe IPStor SANFabric Replication Replication Cache P PrimaryStorage P S SecondaryStorage
飞康公司的复制模式 --连续复制模式 --Delta增量复制模式 --同步mirror --异步mirror
面向高速恢复的快照技术 LD1 LD2 * LD1 Group1 数据影像 10:00 11:00 12:00 12:15 09:30 10:00 10:30 11:00 * * * * M-LD1 M-LD1 M-LD1 M-LD1 M-LD1 IP Switch
9am 1 2 3 4 5 6 7 8 9 10 11 12 9:00-9:59 12pm 11am 10am New Data Blocks added 1 2 3 4 5 6 7 8 9 10 11 12 10:00-10:59 New Data Blocks added 1 2 3 2 4 5 6 6 7 8 9 7 10 11 12 11:00-11:59 New Data Blocks added 1 2 2 3 4 5 6 6 9 7 7 8 9 10 10 11 12 不同时间点的自动快照 Original Source Data Volume Automatic Hourly Snapshots Snapshot Storage Area Initial Snapshot (contains no data) Storage Blocks Contain data 2 6 7 2 6 7 Old data blocks are stored in the Snapshot Storage Area 9 10 9 10 1 12 1 12
* LD1 Group1 * * * * * * * M-LD1 M-LD1 T-11 M-LD1 T-11 M-LD1 M-LD1 如何恢复? • 检查11:00 快照保护的数据 • 直接选择时间点数据 LD1 Snapshot Time-View Disk T-11 LD2 Ethernet Switch 10:00 11:00 12:00 12:15 10:00 12:00 14:00 16:00 M-LD1 M-LD1 M-LD1 M-LD1 M-LD1 M-LD2 M-LD2 M-LD2 M-LD2 M-LD2
典型用例:各分公司的应用服务器保护系统 Internet/WAN 备份服务器 分公司服务器 D1 每天同步 一次 DiskSafe 两小时同步一次 D1 D1 DiskSafe D2 DiskSafe 持续同步 网络流量控制 IP Switch Periodic Mode MD2 MD1 MD1 MD1 Continuous Mode AM09:00 M2-1 M1-1 AM10:30 AM10:30 M1-1 M2-2 AM11:00 M1-2 M1-2 AM11:00 Hyper Trac M2-3 PM01:00 M1-3 M1-3 AM11:30 TM1 MD1 Periodic Mode M1-1 MON DiskSafe Mirror Disk DAS Dn MDn M1-2 TUE M1-3 WED Mirror Disk Snapshot TM1 Mn-s
飞康公司DiskSafe 保护体系 • 避免服务器负荷 • 占用最小CPU • System Kernel Filter Driver–,3-5% CPU • 最小的内存占用 • 保护1TB 磁盘约使用32MB内存 • 适用于各种网络带宽 • 可控制使用的网络流量
IP Network 远程复制 over IP DB Snapshot Agent FC-SAN @ DR Site FC-SAN @ Primary Site Delta Replication Delta Replication IPStorAppliance IPStorAppliance • 连续复制和增量复制模式 • 任意的存储设备 • 快照技术确保瞬间恢复 • 能够适应现有环境
飞康采用的MicroScan 技术,极少的传输量 Application Small-block Writes(2x512 byte sectors) File-system Writes4K Block Size Block级,较多的传输量 Microscan,最小的传输量 MicroScan Transfers2x512 Bytes
IPStor DR解决方案概览 Service Provider Application Host ApplicationHost Local mirror Primary Local-Cache Primary Application Host Application Host with DiskSafe or FileSafe IP Network Primary Primary Local-Cache Application Host Application Host Backup Server Application Host with DiskSafe or FileSafe Cisco SANtap FC/iSCSI SAN Split-Mirror e.g. BCV Primary Local-Cache Primary VTL Storage Primary Local-Cache
IPStor 企业级网络存储解决方案 • 存储整合 • 存储的集中管理 • 异构存储设备的整合 • SAN & NAS 的统一 • 数据容灾及业务持续性 • 渐变式灾难后的快速数据恢复 • 灾难恢复 • 备份的整合与加速 • VTL虚拟磁带库
Exchange 服务OK • 三台Exchange 服务器,超过1000 个信箱,130GB以上数据量 • 原有的Exchange 的灾难恢复经验 • 备份软件 • 恢复时间无法保障 • 从原先的五小时缩短到15分钟 • 操作系统五分钟启动 • 不需要数据恢复,系统直接上线运行 • 架构简单 • IT 人员可在短时间自行维护 英华达的分享 “既然无法避免邮件服务器宕机的可能,我们希望至少在宕机发生后,可以在最短的时间内恢复回来,恢复正常运行。”
台湾中华电信--存储整合及容灾 IDC A IDC B Oracle/Sybase/SQL/DB2 Solaris/NT/AIX Router Router
澳洲教育网( Catholic Education Office )– 80 个应用主机到SAN 的远程备份/容灾
飞康的容灾解决方案为您的环境而设计 • 任意的存储设备和传输协议 • 涵盖风险防御的所有方面 • 节省主机开销 • 无与伦比的存储服务能力,有限的资金获得无限的能力 • 不仅针对生产主机,同时可以为整个办公系统服务 • 轻松的单点图形管理,容灾不再是难事 • 瞬间恢复能力