Weitere ähnliche Inhalte
Ähnlich wie 分会场二赛门铁克灾备系统项目经验分享 (20)
分会场二赛门铁克灾备系统项目经验分享
- 3. 建设篇
SYMANTEC VISION 2010 3
- 4. 容灾系统建设阶段考虑的问题
With
What? How?
What?
要做成 怎么去
用什么
什么样? 数据级、应用 做?
容灾规范? 来做? 技术选型?
级和业务级?
RPO、RTO? 策略制定? 建设成本?
SYMANTEC VISION 2010 4
- 5. What-要做成什么样?-容灾级别
• 政策、法律法规
公司战略 • 业务持续管理
• 危机管理
• 风险管理
s1 s2 s3 s4 sn • 与相关机构的沟通
业务级
• 组织结构
组织和人员 • 职责和责任
• 人员的意识和技能
• 业务应急和恢复流程
业务和IT流程 • IT应急和恢复流程
• 运维管理
应用级
• 应用系统架构
Site A Site B • 数据库系统设计
应用和数据 • 数据安全
• 数据保存
• 备份和恢复
• IP网络架构
FC, FDDI, 10/100, ATM, switches, • 存储区域网络
hubs
IT架构和技术 • 安全区域划分
• 系统架构设计
• 功能区域划分
• 办公场地
• 电力系统设计
数据级 基础设施 • 空调系统设计
• 消防系统设计
• 环境监控
• 物理安全
SYMANTEC VISION 2010 5
- 6. What-要做成什么样?- RPO与RTO
RTO 回切完成
备份点
灾难发生点 系统在备中心 系统回切
恢复运行
时间线
不可用或性能低 不可用或性能低
备份 最近的一
周期 次备份点
RPO
事件发现
和通知
紧急状态 临时运行
运作和决 恢复操作 状态
策 回切
SYMANTEC VISION 2010 动作 6
6
- 7. 《
How-怎么去做?-容灾规范
实现远程数据实时备份,实现零丢失
信
息
6级-数据零丢失和
远程集群支持 应用软件可以实现实时无缝切换 系
远程集群系统的实时监控和自动切换能力 (
原 统
5级-实时数据传输 实现远程数据复制技术
《 灾
及完整设备支持 备用网络也具备自动或集中切换能力 重 难
要 恢
信
配置所需要的全部数据和通讯线路及网络设备,并处于就绪 息 复
4级-电子传输及
完整设备支持 状态 系 规
7*24 运行;更高的技术支持和运维管理 统 范
灾 》
配置部分数据,通信线路和网络设备 难
3级-电子传输和
每天实现多次的数据电子传输 恢
--GB/T 20988-2007
部分设备支持
备用场地配置专职的运行管理人员 复
指
预定时间调配数据,通信线路和网络设备 南
2级-备用场地支持 备用场地管理制度 》
设备及网络紧急供货协议 )
每周至少做一次完全数据备份
1级-基本支持 制定介质存取、验证和转储的管理制度
完整测试和演练的灾难恢复计划
SYMANTEC VISION 2010 7
- 8. 第一级:基本支持
备份介质场外存放
有符合介质存放条件的场地
SYMANTEC VISION 2010 88
8
- 9. 第二级:备用场地支持 (红色表示较上一级别增加的部分)
备份介质场外存放
有符合介质存放条件的场地
SYMANTEC VISION 2010 9
- 10. 第三级:电子传输和部分设备支持 (红色表示较上一级别增加的部
分)
备份介质场外存放
有符合介质存放条件的场地
SYMANTEC VISION 2010 10
10
- 11. 第四级:电子传输及完整设备支持 (红色表示较上一级别增加的部
分)
备份介质场外存放
有符合介质存放条件的场地
7x24小时运作
就绪或运行状态
就绪状态 SYMANTEC VISION 2010 11
11
- 14. 行业法规
• 银行业
《银行业金融机构信息系统风险管理指引》
制定部门:银监会
颁布时间:2006年11月1日
生效时间:2006年11月1日
《商业银行操作风险管理指引》
制定部门:银监会
颁布时间:2007年5月14日
生效时间:2007年5月14日
• 证券业
《证券公司集中交易安全管理技术指引》
制定部门:证监会
颁布时间:2006年8月2日
生效时间:2006年8月2日
• 保险业
《保险业信息系统灾难恢复管理指引》
制定部门:保监会
颁布时间:2007年11月10日
生效时间:2008年3月21日
SYMANTEC VISION 2010 14
- 17. With What?-用什么来做?-建设成本
• 建设成本体现在两方面:
成本 损失
(收益)
– 刚性成本 花费越大
损失越小 花费越少
根据容灾系统建设的级别,以 事件发生 损失越大
及对RPO、RTO的要求的不同,
money
其建设成本也不同--无削减 计划控制的
余地 最大成本
time
– 弹性成本
根据所选的容灾解决方案不同,
其建设成本也不同--有削减
余地
SYMANTEC VISION 2010 17
- 18. 案例分析1:
某移动公司OA/ERP系统全国容灾项目
• What-要做成什么样?
– 应用级容灾系统
容灾中心能够同时接管3个省分公司的业务,建设阶段:第一阶段先建数据级
容灾系统;第二阶段在数据级容灾系统的基础上建设应用级容灾系统。
– ERP数据RPO <2小时,OA数据RPO<6小时,RTO<24小时。
• How-怎么去做?
– 建立集中式容灾中心,31个地方公司的数据中心向北京进行数据复制,替代
各省自建的方式,以节省成本
– 采用国标5级容灾标准(实时数据复制模式)
– 实现标准的DRP管理,定期演习
– 尽可能地采用软件工具实现自动化管理,减少人工干预
SYMANTEC VISION 2010 18
- 20. 案例分析1:
某移动公司OA/ERP系统全国容灾项目
• 技术选型-存储系统复制模式
extended FC
or IP links
Remote
Mirroring Disk Array
Software
– 容灾站点的存储需要和生产中心同构,硬件设备没有选择余地,意味着需要在北
京的集中式容灾中心配置各地方公司所有型号的存储系统
– 成本较高(存储设备投资、传输设备投资)
– 仅仅是数据复制方案,且维护管理成本巨大
– 无应用接管方案,无法实现应用级容灾
– 无灾备系统运维方案
SYMANTEC VISION 2010 20
- 22. 案例分析1:
某移动公司OA/ERP系统全国容灾项目
• 技术选型-逻辑卷复制模式(赛门铁克实时容灾解决方案)
生产中心 灾备中心
通过 IP network (WAN)
实现远距离的数据复制
Storage Storage
Foundation +VVR IP Network Foundation +VVR
SYMANTEC VISION 2010 22
- 24. 案例分析1:
某移动公司OA/ERP系统全国容灾项目
备份 数据库 数据库 应用 应用
15对1复制关系,
数据库
不存在单点失效,
VERITAS Storage Foundation/VVR
精简配置关系
VERITAS Storage Foundation/VVR
VERITAS Volume Replicator
磁带库
基于IP网络传输,无需附
数据库
加FC-IP硬件设备
采用卷复制与 WAN
应用无关 via IP
支持反向切换、接管 应用
备份 数据库 数据库 应用 应用
VERITAS Storage Foundation/VVR 一致性应用复制组关系, 磁带库
确保精确数据的写一致
性!
VERITAS Volume Replicator 应用
磁带库
省公司
支持异构硬件存 备份
储EMC/HDS/… 总公司
SYMANTEC VISION 2010 24
- 25. 案例分析1:
某移动公司OA/ERP系统全国容灾项目
• With What-建设成本(弹性成本)
– 节省硬件成本
• 存储系统:无需购置所有品牌系列的存储系统
• 主机系统:由于VVR实际只消耗5%的系统资源(CPU/Mem),因此在大大节省了容
灾中心的主机配置
• 容灾链路设备:由于VVR传输的协议是最为普通的IP协议,因此无需从31个节点到
北京的FC-IP router硬件设备
– 节省实施成本
• Storage Foundation存储软件的良好兼容性决定了工程实施可以采用分省逐步实现的
原则
• 赛门铁克严密的项目管理流程,最大限度的保障项目实施的成功率
– 节省管理成本
• 管理队伍在总部,15人,实现远程管理
• 实现过容灾切换演练,虽然流程已简化很多,但仍有简化空间(未来需要赛门铁克
VCS的firedrill)
SYMANTEC VISION 2010 25
- 26. 案例分析2:
某信用卡交易系统同城容灾项目
• What-要做成什么样?
– 应用级容灾系统
生产中心在浦东,容灾中心在浦西,链路距离64Km。
– RPO=0,RTO<30分钟。
• How-怎么去做?
– 建立同城容灾中心
– 采用国标6级容灾标准(零数据丢失模式)
– 数据变化量大,数据库每天的数据变化量在300G左右,总数据量在14 T,数
据交易量为每秒5000笔
– 容灾系统对交易系统的性能、稳定性和可靠性的影响尽可能的小
SYMANTEC VISION 2010 26
- 28. 案例分析2:
某信用卡交易系统同城容灾项目
• 技术选型-存储系统同步复制模式
(1) Write I/O (2) Remote Copy
P-VOL S-VOL
(4) Write Complete (3) Remote Copy Complete
Host Priamry disk array Remote disk array
– RTO过很长,一般>4小时(剔除故障存储+备份存储加载+数据库恢复+应
用测试+额外--原厂工程师到场时间)
– 串行写入模式,数据写入延迟时间累加,对生产系统的性能影响较大
SYMANTEC VISION 2010 28
- 29. 案例分析2:
某信用卡交易系统同城容灾项目
• With What-赛门铁克逻辑卷镜像方案
同城容灾 灾备中心
生产中心
Storage
Storage Foundation HA/DR
Foundation HA/DR
心跳
数
据
写 数据写入
入
FC
数
据
写
入
SYMANTEC VISION 2010 29
- 31. 案例分析2:
某信用卡交易系统同城容灾项目
• With What-建设成本
– 增加了Storage Foundation存储管理软件(刚性成本,不可削减)
– 节省管理成本(弹性成本)
• 在存储系统发生故障时,业务系统不中断,无需维护管理工作
• 在生产系统主机发生故障时,可采用“一键式”切换,将系统切至容灾中心,大大
简化切换流程,降低了维护管理成本
SYMANTEC VISION 2010 31
- 33. 赛门铁克数据级灾备方案--运输介质模式
Offering名称 数据级灾备解决方案--运输介质模式
适用范围 国标1、2级
技术方案 利用Symantec NetBackup备份软件+Vault选项功能,将
客户生产中心的业务数据和应用系统数据定时备份到本地,
再运送至灾备中心。
涉及产品 Symantec NetBackup备份软件+Vault选项功能,磁带库
或虚拟磁带库
服务模块 Symantec数据复制服务,灾备相关设备实施服务,灾备相
关系统管理服务
SYMANTEC VISION 2010 33
- 35. 赛门铁克数据级灾备方案--链路传输模式
Offering名称 数据级灾备解决方案--链路传输模式
适用范围 国标3、4级
技术方案 客户生产中心和灾备中心之间有电子通讯链路连接,利用
Symantec NetBackup备份软件将客户生产中心的业务数
据和应用系统数据定时备份到灾备中心。
涉及产品 Symantec NetBackup备份软件,磁带库或虚拟磁带库
服务模块 Symantec数据复制服务,灾备相关设备实施服务,灾备相
关系统管理服务
SYMANTEC VISION 2010 35
- 37. 赛门铁克应用级灾备方案--实时复制模式
Offering名称 应用级灾备解决方案--实时复制模式
适用范围 国标5级
技术方案 客户生产中心和灾备中心之间有电子通讯链路连接,利用
Veritas Storage Foundation HA/DR存储套件+Volume
Replicator选项功能将客户生产中心的业务数据和应用系
统数据实时传送到灾备中心,在生成系统故障时,提供
“一键式”切换功能。
涉及产品 Veritas Storage Foundation HA/DR存储套件+Volume
Replicator选项功能
服务模块 Symantec数据复制服务,灾备相关设备实施服务,灾备相
关系统管理服务
SYMANTEC VISION 2010 37
- 38. 赛门铁克应用级灾备方案--实时复制模式(工作
原理)
生产中心 灾备中心
通过 IP network (WAN)
实现远距离的数据复制
Storage Storage
Foundation +VVR IP Network Foundation +VVR
SYMANTEC VISION 2010 38
- 39. 赛门铁克应用级灾备方案--零丢失模式
Offering名称 应用级灾备解决方案--零丢失模式
适用范围 国标6级
技术方案 客户生产中心和灾备中心之间有电子通讯链路连接,利用
Veritas Storage Foundation HA/DR存储套件的镜像功能
实现同时在生产中心和灾备中心写数据的功能,从而保证
客户数据零丢失,并提供系统自动切换能力和实时监控的
功能,在生成系统故障时,提供“一键式”切换功能。
涉及产品 Veritas Storage Foundation HA/DR存储套件+GCO选项
功能
服务模块 Symantec数据复制服务,灾备相关设备实施服务,灾备相
关系统管理服务
SYMANTEC VISION 2010 39
- 40. 赛门铁克应用级灾备方案--零丢失模式(工作原
理)
城域集群 灾备中心
生产中心
Storage
Storage Foundation HA/DR
Foundation HA/DR
心跳
数
据
写 数据写入
入
FC
数
据
写
入
SYMANTEC VISION 2010 40
- 41. 赛门铁克应用级灾备方案--双活中心模式
Offering名称 应用级灾备解决方案--双活中心模式
适用范围 高于国标6级
技术方案 客户生产中心和同城灾备中心之间有光纤链路连接,利用
Symantec Storage Foundation HA/DR for Oracle RAC套
件构建双数据中心架构,以支持客户系统的业务连续性,
可实现系统零丢失零停机及双活中心的目标。
涉及产品 Symantec Storage Foundation HA/DR for Oracle RAC
服务模块 Symantec数据复制服务,灾备相关设备实施服务,灾备相
关系统管理服务
SYMANTEC VISION 2010 41
- 43. Symantec 灾备方案
灾备数据中心
基础结构
国标1~4级 国标5~6级
NetBackup Storage Foundation HA/DR
SYMANTEC VISION 2010 43
- 44. 运维篇
SYMANTEC VISION 2010 44
- 45. 容灾系统运维阶段考虑的问题
灾难恢
系统变 运维成
复流程 各种厂商的产
更管理 系统的变更如 本控制
的演练 如何验证灾难 品组成的复杂
何对业务系统 环境,如何实
恢复流程?
影响最小? 现经济有效的
管理?
生产系统环境
灾难恢复流程 怎样做到对现
变更,容灾系
的演练是否会 有系统资源的
统如何做出相
影响生产系统? 充分利用,从
应变更?
而达到控制总
如何实现容灾 体成本的目的?
系统的适用性
的主动监控?
SYMANTEC VISION 2010 45
- 50. 原有系统问题
生产中心 容灾中心
• 演习时常常发现:
业务应用
HA软件 – 数据不一致,需要修复
OS
– 系统缺少patch, 或配置有
问题
– 应用启动非常复杂
演习一次时间长,很难满足业务的
RTO或RPO要求!
EMC SRDF/S Replication
SYMANTEC VISION 2010 50
- 51. 部署Storage Foundation for RAC/DR
站点间的容灾“一键式”切换
GCO
公网 启动容灾演习
演习结束
快照加载
应用测试
容灾演练 上地 陶然亭
SFRAC SFRAC
在线添加节点
陶然亭
上地
复制
容灾的管理更加简单
盘阵间的数据复制(自动的反向复制)
SRDF/S
EMC EMC SF 快照
在线存储及路
径维护
51
SYMANTEC VISION 2010 51
- 52. VCS提供快速灾难恢复
生产中心 容灾中心
业务应用 业务应用
!
VCS
Storage Foundation
VCS VCS
Volume
HP-UX
Replicator HP-UX HP-UX
Replication
SYMANTEC VISION 2010
- 53. VCS简化恢复过程:一键灾难恢复
生产中心 容灾中心
业务应用 业务应用
!
VCS
Storage Foundation
VCS VCS
Volume
HP-UX
Replicator HP-UX HP-UX
! Replication
SYMANTEC VISION 2010
- 54. VCS简化恢复过程:一键灾难恢复
生产中心 容灾中心
业务应用 业务应用
!
VCS VCS 一键式容灾切换 VCS
Storage Foundation
Volume
HP-UX
Replicator HP-UX HP-UX
管理员启动容灾
! Replication
SYMANTEC VISION 2010
- 57. 大集群环境下的站点间逻辑切换实现
生产中心 “一键式”的容灾切换
容灾中心 多层高可用性解决方案
P1 P1 P1 P1
Web
• 针对业务系统复杂度增加
– 降低分布式
业务应用程序的 RTO
P1 P1 P1 P1
APP • 针对容灾切换难度增加
– 通常都需要手工来起停各
个应用
– 由于涉及多个应用层,对
于容灾的维护带来挑战
DBMS
P1 P1 P1 P1
• VCS创新的架构
– 把业务系统当作众多应用
系统的有机结合体
– 容灾切换按照定义的逻辑
结构进行起停,提高了灾
难恢复的可靠性,同事大
大减少了维护工作量
SYMANTEC VISION 2010
- 60. 案例分析5:某银行
实现零停机的阵列数据迁移
•2007年中,原有阵列性能不能适
应业务增长,需要换成EMC DMX
•利用Symantec软件完全在线将旧
阵列上的3T数据迁移到新阵列上
来,没有停机时间
该行称原来这种迁移根本不可能完成!一般都是要新建一套系统
SYMANTEC VISION 2010 60
- 67. 存储系统的利用率
未配置 “到2012年,用户所安装的字节将会是2008年的
6.5倍”。
“优化基础架构与运营成本”,Ray Paquet,
Gartner,2008年10月
“平均应用利用率为35%”
TheInfoPro Storage Wave 11调查,2008年
30 TB
100% 所属不明
未使用
15 TB
50% 过度供应
10 TB 错误使用
33% 8 TB 26% 5 TB 16%
6 TB 20%
物理环境 非物理环境 所属明确 消耗 主机使用率 应用使用率
SYMANTEC VISION 2010 67
- 68. 采用Symantec CCStorage软件存储优化投资回报率分
析
CommandCentral Storage 投资回报率分析 预计节省类别
CommandCentral Storage 三年投资回报率分析
利用率节省(53%)
孤立存储减少(16%)
人力节省(28%)
自动化风险降低(3%)
SYMANTEC VISION 2010 68
- 70. 案例分析7
大型金融机构存储管理-Symantec CCStorage
成效
通过一个集中化控制台对全球存储架
构实现端到端的可视性
辨别并回收服务器与存储中的孤立存
储 “Veritas CommandCentral
Storage通过帮助我们识别未能充
将利用率由2006年的12%提高至41% 分使用的资产并对其加以回收,从
(节约成本达9千万美元)
而实现了2008年存储的零增长。”
各部门均可通过物理及非物理设备进
行业务报告
SYMANTEC VISION 2010 70
- 71. Symantec数据中心运维解决方案的多重价值
主机层面 存储设备层面
应用体验 部署体验
日常运维
集中控制平台 存储服务管理
应用到资源的映射 端到端的可视性
灵活配置 提高利用效率
动态调整 优化服务流程
创新的存储基础架构
规划设计
标准化的软件层
文件系统, 逻辑卷管理 确保性能的存储虚
统一的链路管理 拟化
企业存储服务化
架构设计 未来发展
SYMANTEC VISION 2010 71
71
- 72. 发展篇
SYMANTEC VISION 2010 72
- 73. 容灾系统发展阶段考虑的问题
发展方向1: 发展方向2:
容灾中心的 新的收入增
角色? 长点?
容灾中心角色转变? 灾备服务外包?
角色转变所应具备的条
服务实现及SLA保障?
件?
SYMANTEC VISION 2010 73
- 75. 容灾中心角色的转变
转变后的角色 实现方式 转变目的
充分利用所有资源(包括
与原生产中心定期角色互 人员),定期实际切换系
第二生产中心
换,轮流提供服务 统,以达到演练队伍和规
避风险的目的
利用容灾系统项目建设实
生产中心 原生产中心转为容灾中心 现生产中心IT系统的更新
换代
SYMANTEC VISION 2010 75
- 78. VCS可实现迅速的业务级的一键式切换
生产中心 “一键式”的容灾切换
容灾中心 多层高可用性解决方案
P1 P1 P1 P1
Web
• 针对业务系统复杂度增加
– 降低分布式
业务应用程序的 RTO
P1 P1 P1 P1
APP • 针对容灾切换难度增加
– 通常都需要手工来起停各
个应用
– 由于涉及多个应用层,对
于容灾的维护带来挑战
DBMS
P1 P1 P1 P1
• VCS创新的架构
– 把业务系统当作众多应用
系统的有机结合体
– 容灾切换按照定义的逻辑
结构进行起停,提高了灾
难恢复的可靠性,同事大
大减少了维护工作量
SYMANTEC VISION 2010
- 82. 典型的灾备服务外包收费模式(年费,不含初装费)
收费标准1 收费标准2 收费标准3 收费标准4
数据级灾备服 按租用存储档 按存储系统访 - -
务 次和空间 问频率(计算
流量)
应用级灾备服 按租用存储档 按存储系统访 按租用主机档 按订购演练次
务 次和空间 问频率(计算 次和数量 数
流量)
SYMANTEC VISION 2010 82
- 83. 服务实现
• 技术保障
– 可以按用户灵活分配存储空间,且需要在线分配,不能停机
– 可提供不同档次的“存储资源池”,做到存储分级
– 可统计用户访问存储的频率与流量
– 可实现用户仿真演练
SYMANTEC VISION 2010 83
- 84. Storage Foundation
层级存储管理--有效控制存储设备投资
静态分级 动态分级 拷贝服务
/FileSystem
Tier 2 Tier 1
Tier 1 Tier 2 Tier 1 Tier 2 Tier 2
• 基于应用的分级 • 基于数据的分级 • 基于数据拷贝的分级
• 一次性映射 • 实时映射 • 与盘阵无关
• 静态的 • 基于策略 • 本地快照拷贝
• 动态的 • 远程容灾拷贝
SYMANTEC VISION 2010 84
84
- 88. 灾备服务外包数据中心基础架构
跨越数据中心的高可靠管理
按最优性价
比部署的服
务器单元 跨越服务器的,整合、集中的服务器资源管理及应用调度和迁移
跨越服务器的共享文件系统
跨越整个存储资源网络的一致的存储服务:数据克隆、复制、
在线备份和迁移
跨越整个存储资源网络的统一的存储资源管理、调度
层次化部署的硬件存
储单元:
提供容量及性能资源
SYMANTEC VISION 2010 88
- 89. 灾备服务外包数据中心基础架构
容灾演练
跨越数据中心的高可靠管理
端到端容量、性
能的管理
按最优性价
比部署的服
务器单元 跨越服务器的,整合、集中的服务器资源管理及应用调度和迁移
跨越服务器的共享文件系统
群集
跨越整个存储资源网络的一致的存储服务:数据克隆、复制、
异
构 在线备份和迁移
在线数据迁移
资
源
灾备系统保护
在线备份与恢复
池 分
跨越整个存储资源网络的统一的存储资源管理、调度
:
服
级
在线容量管理 存
层次化部署的硬件存 务 储
器
储单元: 、
提供容量及性能资源 存
储 在线性
能调优
SYMANTEC VISION 2010 89
- 90. 赛门铁克灾备中心解决方案总结
建设阶段 运维阶段 发展阶段
Storage Foundation +NetBackup+CCStorage
SYMANTEC VISION 2010 90
- 91. Thank you!
Copyright © 2010 Symantec Corporation. All rights reserved. Symantec and the Symantec Logo are trademarks or registered trademarks of Symantec Corporation or its affiliates in
the U.S. and other countries. Other names may be trademarks of their respective owners.
This document is provided for informational purposes only and is not intended as advertising. All warranties relating to the information in this document, either express or implied,
are disclaimed to the maximum extent allowed by law. The information in this document is subject to change without notice.
91