SlideShare ist ein Scribd-Unternehmen logo
1 von 32
Downloaden Sie, um offline zu lesen
1
这里讲的“存储”不只是传统意义上的专业存储设备。
一般意义上讲的“存储”,是指数据库用的专业存储设备,而现下的存储服务
器、云存储应用场景越来越多,此其一
在维护、优化方面来讲,管理存储也并不仅限于对存储本身的配置、调整,需
要结合应用甚至其他系统综合分析,此其二




                                     2
非常简单的单台服务器结构




               3
非常简单的单台服务器结构→多台服务器的集群




                        4
数据库、各种功能增多、剥离,出现了独立的应用集群,与图片服务器共享数
据
(共享存储经历了PC-Server、PC+DAS、NAS的过程)




                                     5
前端负载 增加——增加了Cache层




                     6
服务器数量多到一定的规模,出现File-Server,统一文件操作接口,避免过多
mount,还作为云存储的网关




                                           7
特点:
文件量众多,数以十亿计
并发访问大,10W+ connections
应用环境杂,项目多,文件共享需求多
要求低成本,高可靠


这个时候,各种各样的问题就出现了




                         8
数据混合导致空间被耗尽,存储空间上限瓶颈:拆分目录
随单个目录文件数量爆满、子目录数爆满导致写失败
意的软链接是日后运维的地雷,存储迁移、数据拆分的隐患


存储性能瓶颈:scale-up/应用层面分卷 → 集群 → 云存储




                                    9
文件系统的组织:
业务规模小时,没有任何问题:随意创建目录、往一个目录中随意堆放文件……
规模扩大,积重难返:目录有上限(用满子目录限制、文件数限制导致无法新
建文件)
实例:cnfenjie001→ memberid_to_path 之后,cn/fe/nj/… cn这个目录爆满


缓存的影响:例如随机小IO运行得非常好,出现了一个顺序大数据量IO的需求
,必然导致存储性能意料之外的表现——
中端存储一套,测试满足18000 IOPS,符合DB的需求,实际使用中发现IO影响慢
→Cache持续满→后端磁盘忙←发现实际使用中有另一个顺序读写定时跑;
NAS在搬迁时,磁盘利用率50%,两台NAS临时并到一台进行搬迁,发现元数据
存取缓慢;
FC→SATA copy备份数据,缓存被占满,导致FC IO响应缓慢


降级:GreenPlum集群,用SATA盘+ZFS的raidz2 ,初期非常顺利,第三年,SATA
盘故障率升高,业务增长导致IO负荷增加 → 每周坏盘
FS3,SATA实现了低廉的成本,唯一的问题就是坏盘后RTO非常长




                                                          10
大图+分卷是主要目标,缩短文件路径是补充要求,但是最终缩短文件路径取得
了很好的成效




                                      11
12
两个三位数的目录是以 id 做了某种取余数算法后得到的,避免目录分布不均匀
Nfs性能统计:access占比44% → 25%




                                        13
正常情况下,blade1挂FC磁盘,提供NFS服务,blade2挂SATA磁盘,不对外服务
,仅用于将blade1的数据复制备份,运行得非常好;
异常情况:blade2的SATA盘故障,①rebuild时间长达二十小时 ②data copy调
度运行 ③由于rebuild,导致copy拥塞 → block storage的控制器缓存被copy
的大数据流堵满,blade1的NFS服务异常缓慢,只能停止copy




                                                     14
目标:大容量、低成本、可扩展的存储
场景:备份、数据集中营,非on-line需求
考虑过方案:LVM mirror、DRBD+multipath→LVM
教训:SATA降级IO慢,rebuild时间长、寿命有限
市场上类似产品:ONStor Pantera LS 2100




                                      15
16
17
18
19
数据布局的影响 主要是文件系统方面的效率问题,另外特定的设备如Netapp的
WAFL特性也是要注意的
硬件降级不仅限于SATA盘,还包括存储的控制器、电源等,不要看中端存储
+SSD盘就有了匹敌高端存储的性能,一旦出现硬件降级,中端存储的先天不足
就出现了。




                                         20
在项目还在需求调研阶段的时候,运维人员介入能够产生最佳效果,把运维的
思想与代码结合,产生最优的效果
但是实际操作中,往往到项目到了测试阶段或上线之前,运维人员才会得到消
息,此时,已经是箭在弦上,不得不发,离项目上线仅有10天?15天?不合理
的设计也不可能修改了


DB的存储基本上不会遇到这类问题。




                                       21
没有在方案设计之初介入,只有通过平时的积累+合适的机会推动改进。
与具体业务结合:
图片清晰化项目,同时完成产品数据拆分+路径改造——不是一提出来就会有人
有资源支持,功夫做在平时,机会来了成功率才高


Cache命中率统计:降低流量




                                      22
全球数据复制+同步的应用特点:会在当地扫描文件的元数据,元数据读写需要
的是内存,两台设备上的数据合成一台之后,内存相对“变小”了,导致磁盘
IO爆涨




                                      23
捕捉到Cache命中率下降→开accesslog→发现MISS特征
由此可见,开发代码的人并不关心运维,大多数人只是实现了自己想要的功能
就万事大吉了,没有运维的sense




                                     24
开发为了达到图片更新即可见的效果,专门做成 ?r=0.6438864282476 形式
取数据120Mbps→10Mbps,两台服务器,共节约流量220Mbps,NAS存储吞吐量
大约300多M,相当于存储性能提升了一倍多
发数据150Mbps→70Mbps,两台Cache服务器,共节约流量160Mbps,保守估计
带宽费用>10000RMB




                                                 25
26
27
28
有了SSD之后,存储厂商的日子比较难过;经历了开源+SSD替代小机+高端存储
的替换潮,虽然单机+SSD能够匹敌传统的高端存储性能,但由此带来的维护成
本是上升的:多机集群的可靠性、数据一致性、运维投入的人力……虽然不一定
是经济的选择,存在的意义在于:我们有、我们能。
开源+intel+SSD可以处理大多数互联网公司的需求
存储服务器的广泛应用,要求更加了解OS及OS的存储管理


人力成本低 → 重视CAPAX,忽视OPEX




                                         29
对云存储供应商的考查 → 对性能的评估 → 对运维方面的需求
OS如何更好地使用存储




                                 30
31
32

Weitere ähnliche Inhalte

Was ist angesagt?

利用新硬件提升数据库性能
利用新硬件提升数据库性能利用新硬件提升数据库性能
利用新硬件提升数据库性能Feng Yu
 
Jkcn MySQLDB 架构
Jkcn MySQLDB 架构Jkcn MySQLDB 架构
Jkcn MySQLDB 架构Louis liu
 
了解内存
了解内存了解内存
了解内存Feng Yu
 
了解集群
了解集群了解集群
了解集群Feng Yu
 
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Shaoning Pan
 
美团点评技术沙龙010-点评RDS系统介绍
美团点评技术沙龙010-点评RDS系统介绍美团点评技术沙龙010-点评RDS系统介绍
美团点评技术沙龙010-点评RDS系统介绍美团点评技术团队
 
Redis 常见使用模式分析
Redis 常见使用模式分析Redis 常见使用模式分析
Redis 常见使用模式分析vincent253
 
NoSQL误用和常见陷阱分析
NoSQL误用和常见陷阱分析NoSQL误用和常见陷阱分析
NoSQL误用和常见陷阱分析iammutex
 
redis 适用场景与实现
redis 适用场景与实现redis 适用场景与实现
redis 适用场景与实现iammutex
 
美团点评技术沙龙14:美团云对象存储系统
美团点评技术沙龙14:美团云对象存储系统美团点评技术沙龙14:美团云对象存储系统
美团点评技术沙龙14:美团云对象存储系统美团点评技术团队
 
OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案freezr
 
Exadata那点事
Exadata那点事Exadata那点事
Exadata那点事freezr
 
Linux内存管理
Linux内存管理Linux内存管理
Linux内存管理zijia
 
TomCat迁移步骤简述以及案例
TomCat迁移步骤简述以及案例TomCat迁移步骤简述以及案例
TomCat迁移步骤简述以及案例maclean liu
 
2018 普安 EonStor GSe Pro 产品线介绍 (簡中版)
2018 普安 EonStor GSe Pro 产品线介绍 (簡中版)2018 普安 EonStor GSe Pro 产品线介绍 (簡中版)
2018 普安 EonStor GSe Pro 产品线介绍 (簡中版)infortrendgroup
 
浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华zhuozhe
 
数据库Sharding专题
数据库Sharding专题数据库Sharding专题
数据库Sharding专题清平 张
 
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...Ceph Community
 

Was ist angesagt? (20)

利用新硬件提升数据库性能
利用新硬件提升数据库性能利用新硬件提升数据库性能
利用新硬件提升数据库性能
 
Jkcn MySQLDB 架构
Jkcn MySQLDB 架构Jkcn MySQLDB 架构
Jkcn MySQLDB 架构
 
了解内存
了解内存了解内存
了解内存
 
了解集群
了解集群了解集群
了解集群
 
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照
 
美团点评技术沙龙010-点评RDS系统介绍
美团点评技术沙龙010-点评RDS系统介绍美团点评技术沙龙010-点评RDS系统介绍
美团点评技术沙龙010-点评RDS系统介绍
 
Redis 常见使用模式分析
Redis 常见使用模式分析Redis 常见使用模式分析
Redis 常见使用模式分析
 
NoSQL误用和常见陷阱分析
NoSQL误用和常见陷阱分析NoSQL误用和常见陷阱分析
NoSQL误用和常见陷阱分析
 
Redis介绍
Redis介绍Redis介绍
Redis介绍
 
redis 适用场景与实现
redis 适用场景与实现redis 适用场景与实现
redis 适用场景与实现
 
美团点评技术沙龙14:美团云对象存储系统
美团点评技术沙龙14:美团云对象存储系统美团点评技术沙龙14:美团云对象存储系统
美团点评技术沙龙14:美团云对象存储系统
 
OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案
 
Exadata那点事
Exadata那点事Exadata那点事
Exadata那点事
 
Linux内存管理
Linux内存管理Linux内存管理
Linux内存管理
 
TomCat迁移步骤简述以及案例
TomCat迁移步骤简述以及案例TomCat迁移步骤简述以及案例
TomCat迁移步骤简述以及案例
 
内存数据库[1]
内存数据库[1]内存数据库[1]
内存数据库[1]
 
2018 普安 EonStor GSe Pro 产品线介绍 (簡中版)
2018 普安 EonStor GSe Pro 产品线介绍 (簡中版)2018 普安 EonStor GSe Pro 产品线介绍 (簡中版)
2018 普安 EonStor GSe Pro 产品线介绍 (簡中版)
 
浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华浅析分布式存储架构—设计自己的存储- 58同城徐振华
浅析分布式存储架构—设计自己的存储- 58同城徐振华
 
数据库Sharding专题
数据库Sharding专题数据库Sharding专题
数据库Sharding专题
 
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
 

Andere mochten auch (9)

Danielle pres.ppt
Danielle pres.pptDanielle pres.ppt
Danielle pres.ppt
 
20101220-ekoplan
20101220-ekoplan20101220-ekoplan
20101220-ekoplan
 
Danielle pres.ppt
Danielle pres.pptDanielle pres.ppt
Danielle pres.ppt
 
ADD 2011 Make3D
ADD 2011 Make3DADD 2011 Make3D
ADD 2011 Make3D
 
History of horror films
History of horror filmsHistory of horror films
History of horror films
 
History of horror films
History of horror filmsHistory of horror films
History of horror films
 
Danielle pres.ppt
Danielle pres.pptDanielle pres.ppt
Danielle pres.ppt
 
Danielle pres.ppt
Danielle pres.pptDanielle pres.ppt
Danielle pres.ppt
 
Danielle pres.ppt
Danielle pres.pptDanielle pres.ppt
Danielle pres.ppt
 

Ähnlich wie 网站存储经验谈pdf

利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多ITband
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践Wensong Zhang
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践lovingprince58
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践drewz lin
 
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务drewz lin
 
Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务Wensong Zhang
 
稳定、高效、低碳 -淘宝软件基础设施构建实践
稳定、高效、低碳  -淘宝软件基础设施构建实践稳定、高效、低碳  -淘宝软件基础设施构建实践
稳定、高效、低碳 -淘宝软件基础设施构建实践Wensong Zhang
 
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局Alex Lau
 
李战怀 大数据环境下数据存储与管理的研究
李战怀 大数据环境下数据存储与管理的研究李战怀 大数据环境下数据存储与管理的研究
李战怀 大数据环境下数据存储与管理的研究jins0618
 
Python小团队不妨知道的技术
Python小团队不妨知道的技术Python小团队不妨知道的技术
Python小团队不妨知道的技术jie.wang
 
Hp Storage
Hp StorageHp Storage
Hp Storageamulopan
 
数据库与ssd的实践与探索-2011数据库技术大会
数据库与ssd的实践与探索-2011数据库技术大会数据库与ssd的实践与探索-2011数据库技术大会
数据库与ssd的实践与探索-2011数据库技术大会freezr
 
豆瓣网技术架构变迁
豆瓣网技术架构变迁豆瓣网技术架构变迁
豆瓣网技术架构变迁reinhardx
 
浅谈 My sql 性能调优
浅谈 My sql 性能调优浅谈 My sql 性能调优
浅谈 My sql 性能调优thinkinlamp
 
MySQL应用优化实践
MySQL应用优化实践MySQL应用优化实践
MySQL应用优化实践mysqlops
 
賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報Wales Chen
 
How do we manage more than one thousand of Pegasus clusters - backend part
How do we manage more than one thousand of Pegasus clusters - backend partHow do we manage more than one thousand of Pegasus clusters - backend part
How do we manage more than one thousand of Pegasus clusters - backend partacelyc1112009
 

Ähnlich wie 网站存储经验谈pdf (20)

利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多利用统一存储获得无与伦比的速度,简化系统,并节省更多
利用统一存储获得无与伦比的速度,简化系统,并节省更多
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
 
Taobao base
Taobao baseTaobao base
Taobao base
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
 
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务
 
Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务
 
稳定、高效、低碳 -淘宝软件基础设施构建实践
稳定、高效、低碳  -淘宝软件基础设施构建实践稳定、高效、低碳  -淘宝软件基础设施构建实践
稳定、高效、低碳 -淘宝软件基础设施构建实践
 
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局
 
MySQL调优
MySQL调优MySQL调优
MySQL调优
 
李战怀 大数据环境下数据存储与管理的研究
李战怀 大数据环境下数据存储与管理的研究李战怀 大数据环境下数据存储与管理的研究
李战怀 大数据环境下数据存储与管理的研究
 
Python小团队不妨知道的技术
Python小团队不妨知道的技术Python小团队不妨知道的技术
Python小团队不妨知道的技术
 
Hp Storage
Hp StorageHp Storage
Hp Storage
 
数据库与ssd的实践与探索-2011数据库技术大会
数据库与ssd的实践与探索-2011数据库技术大会数据库与ssd的实践与探索-2011数据库技术大会
数据库与ssd的实践与探索-2011数据库技术大会
 
豆瓣网技术架构变迁
豆瓣网技术架构变迁豆瓣网技术架构变迁
豆瓣网技术架构变迁
 
浅谈 My sql 性能调优
浅谈 My sql 性能调优浅谈 My sql 性能调优
浅谈 My sql 性能调优
 
MySQL应用优化实践
MySQL应用优化实践MySQL应用优化实践
MySQL应用优化实践
 
Dell
DellDell
Dell
 
賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報賽門鐵克 Storage Foundation 6.0 簡報
賽門鐵克 Storage Foundation 6.0 簡報
 
How do we manage more than one thousand of Pegasus clusters - backend part
How do we manage more than one thousand of Pegasus clusters - backend partHow do we manage more than one thousand of Pegasus clusters - backend part
How do we manage more than one thousand of Pegasus clusters - backend part
 

网站存储经验谈pdf