SlideShare ist ein Scribd-Unternehmen logo
1 von 26
Downloaden Sie, um offline zu lesen
林钰
阿里巴巴-运维部




Alibaba.com
• 存储不仅仅是存储
– 评估规划

– 维护优化

– 未来趋势
web共享系统发展
                                                 REQ-80

                                               loadbalance


                          FAS3020



                                                           FAS3020
                   activity   status   power




                                                                                       FAS3020




cache-server
                                                    activity   status   power




                                                                                activity   status   power




                                                  loadbalance
                                                     REQ-80                                                       App-server



               server

                                                                                                                      NFS
云存储                                                                                                         NFS
                                                                                                                         NAS




                                                  file-server
典型网站web共享系统
                                                REQ-80

                                              loadbalance


                         FAS3020



                                                          FAS3020
                  activity   status   power




                                                                                      FAS3020




cache-server
                                                   activity   status   power




                                                                               activity   status   power




                                               loadbalance
                                                                                                                     App-server


         Image-server

                                                                                                                        NFS
云存储                                              loadbalance                                                NFS
                                                                                                                           NAS




                                                 file-server                                               File-server集群,目标是作为所有
                                                                                                           应用的共享文件读写接口。
存在的问题
• 无规划
  •   不同应用的数据混合在一个目录中
  •   660000—— 单个目录文件数无控制
  •   100000—— 子目录数量过多
  •   随意的软链接
• 数据增长导致共享空间达上限(16TB)
• 访问增长导致存储性能成瓶颈
评估规划的经验
• 共享文件系统的组织
  • 不要等到积重难返:目录数量、层次、切分规则、
    文件数量


• 不同类型IO的相互影响

• 硬件降级的影响
  • RTO ↑
  • 方案评估时鲜有涉及但非常重要
案例:共享目录规划
• /app/[0-9]{2}/[0-9]{2}/[0-9]{2}/[0-9]{2}/[0-9]/
• 总空间接近NAS设备单卷上限

• /app/2010/[0-9]{3}/[0-9]{3}/

• 解决单卷容量受限问题
• NAS的IO负荷下降明显
改造前后对比

• 路径形式
http://i02.c.aliimg.com/img/offer/53/03/11/32/5/530311325.summ.jpg
改造前后对比 cont.

• 路径形式
http://i02.c.aliimg.com/img/offer2/2011/028/411/114820_656187364.gif
案例:硬件降级影响分析
• 正常的主备复制方案
 – 性能 √                          Data copy

 – 成本 √              blade1        GE              blade2

 – 可靠性 √
                                 Fabric Channel
                       switchA                    switchB

• 硬件降级之后?
                                  Block storage
  • RTO≈20h
  • Cache occupied
                                   FC     SATA
  • NFS slowly
案例: FS3存储的尝试
            NFS                                            NFS
           iSCSI                                          iSCSI
            CIFS                                           CIFS
             FC                                             FC
     Node A (solaris+ZFS)                          Node B (solaris+ZFS)

OS    SSD (R)       SSD (R)   SSD (R)   HA    OS    SSD (R)   SSD (R)     SSD (R)
OS    SSD (R)       SSD (R)   SSD (R)         OS    SSD (R)   SSD (R)     SSD (R)




                i                                             i
                S                                             S
                                                                        LAN switch
                C                                             C
                S                                             S
                I                                             I

        Disk server                                  Disk server
           Disk server                                  Disk server
OS   SSD (W) server (Linux)HD
         Disk HD HD                          OS   SSD (W) server (Linux)HD
                                                      Disk HD HD
 OS SSD (W)
OS                HD HD HD
      SSD (W) HD HD HD                        OS SSD (W)
                                             OS                HD HD HD
                                                   SSD (W) HD HD HD
 OSOS SSD (W)       HD HD HD
        SSD (W) HD HD HD                      OSOS SSD (W)       HD HD HD
                                                     SSD (W) HD HD HD
   OS   SSD (W)     HD HD HD                    OS   SSD (W)     HD HD HD
小结
• 除了考虑高端中端、磁盘数量、raid规划之
  外……

 – 数据布局影响存储的IO效率

 – IO类型小变化导致大影响

 – 硬件降级一直不受重视
XX项目流程

需求调研   立项   设计    代码开发



 运
 维           运维    测试



             运维    上线
维护优化的经验
• 功夫在存储之外
 – 积累不合理、滥用的现象
 – 了解具体的业务
 – 天时、地利


• 逆向推动
 – 设备性能统计
 – 周边关联系统的表现
案例:为什么要了解业务
• 设备搬迁场景,1+1<2
   • A、B、C硬件性能完全一致
   • A、B数据迁移至异地C的不同磁盘组


• 发现迁移之后读缓慢
   • 唯一的遗漏点:内存
   • A应用特点是大量的元数据读

      NAS A      NAS B      NAS C


     cpu 20%    cpu <5%    cpu >40%
     disk 60%   disk<10%   disk 90%
案例:关联系统影响
• 存储IO量、流量增加
 – 从存储本身无从查找增量来源


• Web-cache系统出现高频次MISS特征
   • http://img.china.alibaba.com/img/mysite/42/54/27/b3_hulingli0802_124
     7022222728.jpg?r=0.6438864282476


• 原因:为“所见即所得”,绕过Cache
url优化前后对比
优化结果




• 流量下降160Mbps+,相应NAS存储总吞吐量大约
  300多Mbps,相当于存储性能提升一倍
• 带宽费用效益 > 10000/月
• 用户体验改善
小结
• 除了“磁盘数不够了、Cache要扩容了”之
  外……

 – 了解业务积累素材

 – 抓住机会搭顺风车

 – 周边关联系统的异常
存储场景
高性能
       OLTP DB

                 非结构共享
                                                          cloud
                       Big data

                         分布式           云

                            Nearline

                                       Back & Arch


      GB          TB              PB                 ZB
                                                              海量
未来存储趋势
• SSD带来的变革

• 存储服务器流行

• 云存储、云计算
云存储时代的思考
• 云看起来很美 ≠ 撒手不管
 – 可靠性
  • 网络、电源、运维水平
  • 集群设计结构
 – 性能:并非所有场景适用
 – 可维护性
  • 用户可视可控
  • 可量化衡量
  • 数据可安全导出
回顾
• 评估规划阶段
   • 文件系统的组织
   • 注意不同IO类型的相互影响
   • 考虑硬件降级后的表现
• 维护、优化措施
   • 注意积累
   • 了解业务
   • 周边系统
• 存储趋势
   • PC+SSD:运维成本、可靠性
   • 云存储:运维人员仍有可为,对OS本身的研究
Thanks.
           Q&A

• 欢迎关注运维领域的同学们共同探讨

Weitere ähnliche Inhalte

Ähnlich wie 阿里巴巴 林钰 网站存储经验谈

淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
Wensong Zhang
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
lovingprince58
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
drewz lin
 
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
Enlight Chen
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
智杰 付
 
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统
Dai Jun
 
Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02
lovingprince58
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
Michael Zhang
 
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务
drewz lin
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
Wensong Zhang
 
淘宝网的架构演进
淘宝网的架构演进淘宝网的架构演进
淘宝网的架构演进
丁 宇
 
Pm 04 华胜天成openstack实践汇报-20120808
Pm 04 华胜天成openstack实践汇报-20120808Pm 04 华胜天成openstack实践汇报-20120808
Pm 04 华胜天成openstack实践汇报-20120808
OpenCity Community
 
Java线上应用问题排查方法和工具(空望)
Java线上应用问题排查方法和工具(空望)Java线上应用问题排查方法和工具(空望)
Java线上应用问题排查方法和工具(空望)
ykdsg
 

Ähnlich wie 阿里巴巴 林钰 网站存储经验谈 (20)

淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
 
Taobao base
Taobao baseTaobao base
Taobao base
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
 
稳定、高效、低碳 -淘宝软件基础设施构建实践
稳定、高效、低碳  -淘宝软件基础设施构建实践稳定、高效、低碳  -淘宝软件基础设施构建实践
稳定、高效、低碳 -淘宝软件基础设施构建实践
 
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
 
Taobao海量图片存储与cdn系统 v2-系统架构师
Taobao海量图片存储与cdn系统 v2-系统架构师Taobao海量图片存储与cdn系统 v2-系统架构师
Taobao海量图片存储与cdn系统 v2-系统架构师
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务
 
Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
 
淘宝网的架构演进
淘宝网的架构演进淘宝网的架构演进
淘宝网的架构演进
 
Pm 04 华胜天成openstack实践汇报-20120808
Pm 04 华胜天成openstack实践汇报-20120808Pm 04 华胜天成openstack实践汇报-20120808
Pm 04 华胜天成openstack实践汇报-20120808
 
Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照Ocean base 千亿级海量数据库-日照
Ocean base 千亿级海量数据库-日照
 
Java线上应用问题排查方法和工具(空望)
Java线上应用问题排查方法和工具(空望)Java线上应用问题排查方法和工具(空望)
Java线上应用问题排查方法和工具(空望)
 
應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局應用Ceph技術打造軟體定義儲存新局
應用Ceph技術打造軟體定義儲存新局
 

Mehr von colderboy17

Sery lvs+keepalived
Sery lvs+keepalivedSery lvs+keepalived
Sery lvs+keepalived
colderboy17
 
Lvs手册中文加目录版
Lvs手册中文加目录版Lvs手册中文加目录版
Lvs手册中文加目录版
colderboy17
 
My sql procedure
My sql procedureMy sql procedure
My sql procedure
colderboy17
 
Mysqlexplain 执行计划解读
Mysqlexplain 执行计划解读Mysqlexplain 执行计划解读
Mysqlexplain 执行计划解读
colderboy17
 
新浪 李晓栋 非商业网络设备的新浪应用之路
新浪 李晓栋 非商业网络设备的新浪应用之路新浪 李晓栋 非商业网络设备的新浪应用之路
新浪 李晓栋 非商业网络设备的新浪应用之路
colderboy17
 
网易 王磊 网易海量数据存储平台的构建和运维
网易 王磊 网易海量数据存储平台的构建和运维网易 王磊 网易海量数据存储平台的构建和运维
网易 王磊 网易海量数据存储平台的构建和运维
colderboy17
 
网易 李弈远 网易服务集成框架的构建与运维
网易 李弈远 网易服务集成框架的构建与运维网易 李弈远 网易服务集成框架的构建与运维
网易 李弈远 网易服务集成框架的构建与运维
colderboy17
 
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
colderboy17
 
淘宝 任卿 打造高效能的Cdn系统
淘宝 任卿 打造高效能的Cdn系统淘宝 任卿 打造高效能的Cdn系统
淘宝 任卿 打造高效能的Cdn系统
colderboy17
 
搜狐畅游 叶金荣 游戏数据库运维经验分享
搜狐畅游 叶金荣 游戏数据库运维经验分享搜狐畅游 叶金荣 游戏数据库运维经验分享
搜狐畅游 叶金荣 游戏数据库运维经验分享
colderboy17
 
搜狐 窦喆 Sohu-sagent
搜狐 窦喆 Sohu-sagent搜狐 窦喆 Sohu-sagent
搜狐 窦喆 Sohu-sagent
colderboy17
 
神州数码 Jason pan future_clouddatacenterv2
神州数码 Jason pan future_clouddatacenterv2神州数码 Jason pan future_clouddatacenterv2
神州数码 Jason pan future_clouddatacenterv2
colderboy17
 
华为 余洲 定制化服务器
华为 余洲 定制化服务器华为 余洲 定制化服务器
华为 余洲 定制化服务器
colderboy17
 
互联网运维大会 刘洋-2011-jul 1
互联网运维大会 刘洋-2011-jul 1互联网运维大会 刘洋-2011-jul 1
互联网运维大会 刘洋-2011-jul 1
colderboy17
 
新浪 杨海朝 Redis运维之道
新浪 杨海朝 Redis运维之道新浪 杨海朝 Redis运维之道
新浪 杨海朝 Redis运维之道
colderboy17
 
阿里巴巴 肖劲青 阿里巴巴运维自动化的探索与规划
阿里巴巴 肖劲青 阿里巴巴运维自动化的探索与规划阿里巴巴 肖劲青 阿里巴巴运维自动化的探索与规划
阿里巴巴 肖劲青 阿里巴巴运维自动化的探索与规划
colderboy17
 
Okbuy 李小红 好乐买自动化运维实践
Okbuy 李小红 好乐买自动化运维实践Okbuy 李小红 好乐买自动化运维实践
Okbuy 李小红 好乐买自动化运维实践
colderboy17
 

Mehr von colderboy17 (20)

MySQL SQL规范
MySQL SQL规范MySQL SQL规范
MySQL SQL规范
 
Redis
RedisRedis
Redis
 
linux安装以及LAMP 环境安装详细
linux安装以及LAMP 环境安装详细linux安装以及LAMP 环境安装详细
linux安装以及LAMP 环境安装详细
 
Sery lvs+keepalived
Sery lvs+keepalivedSery lvs+keepalived
Sery lvs+keepalived
 
Lvs手册中文加目录版
Lvs手册中文加目录版Lvs手册中文加目录版
Lvs手册中文加目录版
 
My sql procedure
My sql procedureMy sql procedure
My sql procedure
 
Mysqlexplain 执行计划解读
Mysqlexplain 执行计划解读Mysqlexplain 执行计划解读
Mysqlexplain 执行计划解读
 
新浪 李晓栋 非商业网络设备的新浪应用之路
新浪 李晓栋 非商业网络设备的新浪应用之路新浪 李晓栋 非商业网络设备的新浪应用之路
新浪 李晓栋 非商业网络设备的新浪应用之路
 
网易 王磊 网易海量数据存储平台的构建和运维
网易 王磊 网易海量数据存储平台的构建和运维网易 王磊 网易海量数据存储平台的构建和运维
网易 王磊 网易海量数据存储平台的构建和运维
 
网易 李弈远 网易服务集成框架的构建与运维
网易 李弈远 网易服务集成框架的构建与运维网易 李弈远 网易服务集成框架的构建与运维
网易 李弈远 网易服务集成框架的构建与运维
 
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
腾讯 马志强 虚拟化环境下 网络 朋务器 平台的协作经验
 
淘宝 任卿 打造高效能的Cdn系统
淘宝 任卿 打造高效能的Cdn系统淘宝 任卿 打造高效能的Cdn系统
淘宝 任卿 打造高效能的Cdn系统
 
搜狐畅游 叶金荣 游戏数据库运维经验分享
搜狐畅游 叶金荣 游戏数据库运维经验分享搜狐畅游 叶金荣 游戏数据库运维经验分享
搜狐畅游 叶金荣 游戏数据库运维经验分享
 
搜狐 窦喆 Sohu-sagent
搜狐 窦喆 Sohu-sagent搜狐 窦喆 Sohu-sagent
搜狐 窦喆 Sohu-sagent
 
神州数码 Jason pan future_clouddatacenterv2
神州数码 Jason pan future_clouddatacenterv2神州数码 Jason pan future_clouddatacenterv2
神州数码 Jason pan future_clouddatacenterv2
 
华为 余洲 定制化服务器
华为 余洲 定制化服务器华为 余洲 定制化服务器
华为 余洲 定制化服务器
 
互联网运维大会 刘洋-2011-jul 1
互联网运维大会 刘洋-2011-jul 1互联网运维大会 刘洋-2011-jul 1
互联网运维大会 刘洋-2011-jul 1
 
新浪 杨海朝 Redis运维之道
新浪 杨海朝 Redis运维之道新浪 杨海朝 Redis运维之道
新浪 杨海朝 Redis运维之道
 
阿里巴巴 肖劲青 阿里巴巴运维自动化的探索与规划
阿里巴巴 肖劲青 阿里巴巴运维自动化的探索与规划阿里巴巴 肖劲青 阿里巴巴运维自动化的探索与规划
阿里巴巴 肖劲青 阿里巴巴运维自动化的探索与规划
 
Okbuy 李小红 好乐买自动化运维实践
Okbuy 李小红 好乐买自动化运维实践Okbuy 李小红 好乐买自动化运维实践
Okbuy 李小红 好乐买自动化运维实践
 

阿里巴巴 林钰 网站存储经验谈