SlideShare a Scribd company logo
1 of 16
Download to read offline
云存储:三分开发,七
分运维
李道兵 <lidaobing@gmail.com>
七⽜牛云存储
2014-11 北京
七⽜牛为什么要做云存储?
• 客户是谁?
• 有存储需求的⼈人(典型情况: 图⽚片,⾳音频,视频应
⽤用,⽇日志存储和分析)
• 价值如何体现?
• 他们⾃自⼰己搞定这个事情的成本是多少?
• 前景如何?
• 世界上的新增数据以每年66%的速度增⻓长,。。。
我们为什么需要⼀一个公
有云?
• 我把数据放在磁盘⾥里,磁盘做RAID5 是不是就可以
了?
• 单点故障,如果机器损坏或者需要停机,这些数据
就下线了
• IOPS和吞吐量都很有限
• 容量有限,放满了这个⽅方案就不合适了
• 听说 glusterfs 不错,是否可以解决这个问题
glusterfs 的问题
• 优点
• POSIX兼容,很多程序不⽤用修改就可以直接⽤用
• ⽆无中⼼心的架构,机器数量不受限制
• 缺点
• ⽆无中⼼心的架构天⽣生的两个缺点: a. 扩容时rehash导致⼤大量数据迁移 b. 对称
盘的形式导致修复速度太慢
• 数据链路过⻓长,所以⼩小⽂文件性能超差
• 实现的API过多,导致实现复杂度很⾼高
• 适⽤用领域: ⼩小规模集群,容量可预估,没有⼩小⽂文件,程序很难改造成⽤用 API 来
访问存储
mogilefs 的问题
• 优点
• 有中⼼心,扩容和修复更⽅方便
• 缺点
• 有中⼼心的缺点:
• 总条⺫⽬目数受中⼼心限制
• 读写速度受中⼼心限制
• ⼤大⽂文件上传不⽅方便
• 适⽤用领域
• 中⼩小型⺴⽹网站,⽂文件数量不超过⼏几千万,1PB左右的规模,访问频率不超过⼏几千
QPS,不⽤用考虑⼤大⽂文件上传的问题。
Hadoop 的问题
• 优点
• 超强的伸缩性,1000台规模⽆无压⼒力,5000台阿⾥里也有⼀一些实践
• 缺点
• Hadoop 是按照离线数据分析服务来设计的
• 可⽤用性低: Java语⾔言本⾝身的问题,Hadoop 数据平衡时数据访问超
时
• ⼩小⽂文件⽀支持不好,hadoop 的数据块太⼤大
• 适⽤用领域:
• 离线数据分析:各类⽇日志分析,数据报表类的业务
混搭模型
• HBase
• Hadoop+HBase/MySQL
• RawDisk+MySQL
• …
• 简单来说,做⼀一个⽀支持 1PB 的云存储已经不是什么
难事了,剩下的⼤大问题只有⼀一个: 运维
你有⾜足够强的运维么?
• 为什么需要运维
• 机器坏,磁盘坏
• 磁盘满,⺴⽹网络满,磁盘过载,内存不⾜足
• ⺴⽹网络不稳,交换机死机,。。。
• 安全更新
• 为什么哪些软件不把这些全部做到业务逻辑⾥里边去
• 有些很难做(⽐比如⺴⽹网络,交换机,磁盘满,安全更新)
• 防⽌止系统过敏(⽐比如上次亚⻢马逊机房事故就是⼀一次过敏)
• 研发和稳定期很⻓长
• 不想⼤大幅度增加架构的复杂度
你需要更多基于云存储
的服务
• 图⽚片:缩放,⽔水印,原图保护
• ⾳音视频:转码,切⽚片,合成,快速预览
• 你的⾃自定义需求: 美颜相机,⼈人脸识别,数据统计
• ⽽而这些需求在跟私有云整合时开发⼯工作量很⼤大,⽽而对
于很多云存储这些功能都是现成的
七⽜牛为什么要做云存储?
• 客户+价值+前景 // 公司的⽴立⾝身之本
• 有技术⻔门槛 // 不会变成红海
• 很酷 // ⼤大家干得很开⼼心
• 创业加速器 // 看到⼀一堆新公司在⾃自⼰己的平台成⻓长起
来很开⼼心
单机房100PB的挑战
• 4000台存储机,不考虑冗余每台要承担 25TB 的容
量
• 200KB的⽂文件平均⼤大⼩小情况下,如何去⽀支持 5000亿
条元数据
• 元数据集群如何去⽀支持1Mqps 的请求频率
• 除了这些还有...
单机房100PB的挑战
• 架构也许不是那么难
• 保持每个组件都是⾼高可⽤用,可伸缩的
• 保持每个远程调⽤用都是可重⼊入的
• ⺴⽹网络传输需要校验
• 。。。
• 难得是规模⼤大了之后的⼀一个问题
• 墨菲定律:凡是可能发⽣生的,就⼀一定会发⽣生
单机房100PB的挑战
• 墨菲定律的诅咒
• 多磁盘故障
• 交换机故障
• ⼈人为失误
单机房100PB的挑战
• 我们能做什么?
• 多预案,并且喜欢处理流程
• 多演习,让事故处理常态化
• 常规事故处理⼀一键化,⾃自动化
Summary
• ⾃自建云存储的缺点
• 运维成本⾼高,相⽐比购买云服务,并不划算
• 常规解决⽅方案存在适⽤用领域狭窄的问题,不够通⽤用
• 七⽜牛云存储的优点
• 运维外包,成本更低,安全性可⽤用性更好
• 更多的扩展功能
Thanks for your
attention

More Related Content

Similar to 云存储: 三分开发,七分运维

寫出高性能的服務與應用 那些你沒想過的事
寫出高性能的服務與應用 那些你沒想過的事寫出高性能的服務與應用 那些你沒想過的事
寫出高性能的服務與應用 那些你沒想過的事Chieh (Jack) Yu
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座NTC.im(Notch Training Center)
 
Flash存储设备在淘宝的应用实践
Flash存储设备在淘宝的应用实践Flash存储设备在淘宝的应用实践
Flash存储设备在淘宝的应用实践Feng Yu
 
七牛云存储详解
七牛云存储详解七牛云存储详解
七牛云存储详解niuer7
 
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法Jazz Yao-Tsung Wang
 
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New翀 刘
 
海通证券数据库备份恢复云平台实践(OTN Tour Shanghai 2017)
海通证券数据库备份恢复云平台实践(OTN Tour Shanghai 2017)海通证券数据库备份恢复云平台实践(OTN Tour Shanghai 2017)
海通证券数据库备份恢复云平台实践(OTN Tour Shanghai 2017)Zhaoyang Wang
 
淘宝双11双12案例分享
淘宝双11双12案例分享淘宝双11双12案例分享
淘宝双11双12案例分享vanadies10
 
百度前端技术交流会--搜搜前端架构演变与优化
百度前端技术交流会--搜搜前端架构演变与优化百度前端技术交流会--搜搜前端架构演变与优化
百度前端技术交流会--搜搜前端架构演变与优化tiantianli
 
[Baidu web frontend_conference_2010]_[soso_frontend_architecture]
[Baidu web frontend_conference_2010]_[soso_frontend_architecture][Baidu web frontend_conference_2010]_[soso_frontend_architecture]
[Baidu web frontend_conference_2010]_[soso_frontend_architecture]思念 青青
 
Hawk Lin 「進擊的巨量」-- 2013 有物科技論壇,台灣科技業的轉型
Hawk Lin 「進擊的巨量」-- 2013 有物科技論壇,台灣科技業的轉型Hawk Lin 「進擊的巨量」-- 2013 有物科技論壇,台灣科技業的轉型
Hawk Lin 「進擊的巨量」-- 2013 有物科技論壇,台灣科技業的轉型yowureport
 
2013 有物科技論壇 - 台灣科技業的轉型之路,「巨量的進擊」
2013 有物科技論壇 - 台灣科技業的轉型之路,「巨量的進擊」2013 有物科技論壇 - 台灣科技業的轉型之路,「巨量的進擊」
2013 有物科技論壇 - 台灣科技業的轉型之路,「巨量的進擊」Hawk Lin
 
Divein ceph objectstorage-cephchinacommunity-meetup
Divein ceph objectstorage-cephchinacommunity-meetupDivein ceph objectstorage-cephchinacommunity-meetup
Divein ceph objectstorage-cephchinacommunity-meetupJiaying Ren
 
Ceph中国社区9.19 Some Ceph Story-朱荣泽03
Ceph中国社区9.19 Some Ceph Story-朱荣泽03Ceph中国社区9.19 Some Ceph Story-朱荣泽03
Ceph中国社区9.19 Some Ceph Story-朱荣泽03Hang Geng
 
Introduction to big data
Introduction to big dataIntroduction to big data
Introduction to big data邦宇 叶
 
大规模数据库存储方案
大规模数据库存储方案大规模数据库存储方案
大规模数据库存储方案XiaoJun Hong
 
阿里CDN技术揭秘
阿里CDN技术揭秘阿里CDN技术揭秘
阿里CDN技术揭秘Joshua Zhu
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseJack Gao
 
张勇 搜搜前端架构
张勇 搜搜前端架构张勇 搜搜前端架构
张勇 搜搜前端架构isnull
 
Taobao casestudy-yufeng-qcon
Taobao casestudy-yufeng-qconTaobao casestudy-yufeng-qcon
Taobao casestudy-yufeng-qconYiwei Ma
 

Similar to 云存储: 三分开发,七分运维 (20)

寫出高性能的服務與應用 那些你沒想過的事
寫出高性能的服務與應用 那些你沒想過的事寫出高性能的服務與應用 那些你沒想過的事
寫出高性能的服務與應用 那些你沒想過的事
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
 
Flash存储设备在淘宝的应用实践
Flash存储设备在淘宝的应用实践Flash存储设备在淘宝的应用实践
Flash存储设备在淘宝的应用实践
 
七牛云存储详解
七牛云存储详解七牛云存储详解
七牛云存储详解
 
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
 
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New
 
海通证券数据库备份恢复云平台实践(OTN Tour Shanghai 2017)
海通证券数据库备份恢复云平台实践(OTN Tour Shanghai 2017)海通证券数据库备份恢复云平台实践(OTN Tour Shanghai 2017)
海通证券数据库备份恢复云平台实践(OTN Tour Shanghai 2017)
 
淘宝双11双12案例分享
淘宝双11双12案例分享淘宝双11双12案例分享
淘宝双11双12案例分享
 
百度前端技术交流会--搜搜前端架构演变与优化
百度前端技术交流会--搜搜前端架构演变与优化百度前端技术交流会--搜搜前端架构演变与优化
百度前端技术交流会--搜搜前端架构演变与优化
 
[Baidu web frontend_conference_2010]_[soso_frontend_architecture]
[Baidu web frontend_conference_2010]_[soso_frontend_architecture][Baidu web frontend_conference_2010]_[soso_frontend_architecture]
[Baidu web frontend_conference_2010]_[soso_frontend_architecture]
 
Hawk Lin 「進擊的巨量」-- 2013 有物科技論壇,台灣科技業的轉型
Hawk Lin 「進擊的巨量」-- 2013 有物科技論壇,台灣科技業的轉型Hawk Lin 「進擊的巨量」-- 2013 有物科技論壇,台灣科技業的轉型
Hawk Lin 「進擊的巨量」-- 2013 有物科技論壇,台灣科技業的轉型
 
2013 有物科技論壇 - 台灣科技業的轉型之路,「巨量的進擊」
2013 有物科技論壇 - 台灣科技業的轉型之路,「巨量的進擊」2013 有物科技論壇 - 台灣科技業的轉型之路,「巨量的進擊」
2013 有物科技論壇 - 台灣科技業的轉型之路,「巨量的進擊」
 
Divein ceph objectstorage-cephchinacommunity-meetup
Divein ceph objectstorage-cephchinacommunity-meetupDivein ceph objectstorage-cephchinacommunity-meetup
Divein ceph objectstorage-cephchinacommunity-meetup
 
Ceph中国社区9.19 Some Ceph Story-朱荣泽03
Ceph中国社区9.19 Some Ceph Story-朱荣泽03Ceph中国社区9.19 Some Ceph Story-朱荣泽03
Ceph中国社区9.19 Some Ceph Story-朱荣泽03
 
Introduction to big data
Introduction to big dataIntroduction to big data
Introduction to big data
 
大规模数据库存储方案
大规模数据库存储方案大规模数据库存储方案
大规模数据库存储方案
 
阿里CDN技术揭秘
阿里CDN技术揭秘阿里CDN技术揭秘
阿里CDN技术揭秘
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
 
张勇 搜搜前端架构
张勇 搜搜前端架构张勇 搜搜前端架构
张勇 搜搜前端架构
 
Taobao casestudy-yufeng-qcon
Taobao casestudy-yufeng-qconTaobao casestudy-yufeng-qcon
Taobao casestudy-yufeng-qcon
 

More from LI Daobing

好东西是聪明人下苦功夫做出来的
好东西是聪明人下苦功夫做出来的好东西是聪明人下苦功夫做出来的
好东西是聪明人下苦功夫做出来的LI Daobing
 
分布式存储的元数据设计
分布式存储的元数据设计分布式存储的元数据设计
分布式存储的元数据设计LI Daobing
 
高可用和可伸缩架构
高可用和可伸缩架构高可用和可伸缩架构
高可用和可伸缩架构LI Daobing
 
短视频和云存储
短视频和云存储短视频和云存储
短视频和云存储LI Daobing
 
出了问题不要靠猜
出了问题不要靠猜出了问题不要靠猜
出了问题不要靠猜LI Daobing
 
如何实现登出按钮
如何实现登出按钮如何实现登出按钮
如何实现登出按钮LI Daobing
 
重整工具箱-从开源软件到开放服务
重整工具箱-从开源软件到开放服务重整工具箱-从开源软件到开放服务
重整工具箱-从开源软件到开放服务LI Daobing
 
从开发到上线-实战持续交付
从开发到上线-实战持续交付从开发到上线-实战持续交付
从开发到上线-实战持续交付LI Daobing
 
HTTP协议相关的若干安全问题
HTTP协议相关的若干安全问题HTTP协议相关的若干安全问题
HTTP协议相关的若干安全问题LI Daobing
 
Debian & Packaging
Debian & PackagingDebian & Packaging
Debian & PackagingLI Daobing
 
如何学习Bash Shell
如何学习Bash Shell如何学习Bash Shell
如何学习Bash ShellLI Daobing
 
glusterfs 文件系统
glusterfs 文件系统glusterfs 文件系统
glusterfs 文件系统LI Daobing
 

More from LI Daobing (13)

好东西是聪明人下苦功夫做出来的
好东西是聪明人下苦功夫做出来的好东西是聪明人下苦功夫做出来的
好东西是聪明人下苦功夫做出来的
 
分布式存储的元数据设计
分布式存储的元数据设计分布式存储的元数据设计
分布式存储的元数据设计
 
高可用和可伸缩架构
高可用和可伸缩架构高可用和可伸缩架构
高可用和可伸缩架构
 
短视频和云存储
短视频和云存储短视频和云存储
短视频和云存储
 
出了问题不要靠猜
出了问题不要靠猜出了问题不要靠猜
出了问题不要靠猜
 
如何实现登出按钮
如何实现登出按钮如何实现登出按钮
如何实现登出按钮
 
重整工具箱-从开源软件到开放服务
重整工具箱-从开源软件到开放服务重整工具箱-从开源软件到开放服务
重整工具箱-从开源软件到开放服务
 
从开发到上线-实战持续交付
从开发到上线-实战持续交付从开发到上线-实战持续交付
从开发到上线-实战持续交付
 
HTTP协议相关的若干安全问题
HTTP协议相关的若干安全问题HTTP协议相关的若干安全问题
HTTP协议相关的若干安全问题
 
Debian & Packaging
Debian & PackagingDebian & Packaging
Debian & Packaging
 
Git 简介
Git 简介Git 简介
Git 简介
 
如何学习Bash Shell
如何学习Bash Shell如何学习Bash Shell
如何学习Bash Shell
 
glusterfs 文件系统
glusterfs 文件系统glusterfs 文件系统
glusterfs 文件系统
 

云存储: 三分开发,七分运维