SlideShare ist ein Scribd-Unternehmen logo
1 von 24
SOSO 访问速度优化
Calvinli
2007-12-04
SOSO 产品线简单介绍
综合搜索
问问
看看我们都优化了哪些部分
• 服务器布局优化
• 减少页面 HTTP 请求
• 启用服务器端压缩
• 调整 DNS TTL
• CDN 外包
• 第三方评测服务
• … …
服务器布局优化
• SOSO 用户分布
通过对用户来源的统
计分析, soso 用户主
要分布在南方沿海省
份及人口大省,南北
方分布比例大致为
7 : 3 ,其中广东超过
200 万独立用户,江
苏、浙江分别超过
100 万独立用户。
服务器布局优化
• SOSO 理想服务器布局
服务器布局优化
• 按照用户的运营商及地域分布, SOSO 用户大致可以分
为五个区域:
服务器布局优化
服务器布局优化
• 根据用户数据分析及公司对 IDC 的建设重点, SOSO 最
终部署的 IDC 为:
– 天津  北京(北方用户)
– 西安(西南、西北用户)
– 深圳(南方用户)
– 上海  南京(华东、华南用户)
服务器布局优化
• 案例 一
www.soso.com网页搜索频道
网页搜索之前仅在天津和深圳部署服务器,调整后网页搜
索前台分布在北京、上海、深圳、成都。
这样的分布照顾了各地用户的体验,尤其可以改善北京、
上海、江浙一带、四川等地的用户,这些地区用户数超过
SOSO 用户的 30% 。
网页前台从天津迁移至北京后,北京用户访问速度提升
29% ,
增加上海服务器部署后,上海用户访问速度提升 25% ,
增加成都服务器部署后,四川用户访问速度提升 27% 。
最大限度的减少 HTTP 请求
• 用户装载页面过程中 85% 以上的时间花费在装载图像、
CSS 、 JS 等,而浏览器在同一个域名下默认只支持两个
并发请求,所以最大限度的减少 HTTP 请求是网页快速装
载的关键。
最大限度的减少 HTTP 请求
• 在不影响产品表现的情况下尽量精简页面元素
• 使用 CSS 图像拼合技术
• 将原有页面中由 JS 实现的部分功能迁移到后台实现,页
面中只保留必要的 JS
• 页面大小尽量在控制在 MTU 的整数倍,充分利用每一次
包传输
最大限度的减少 HTTP 请求
• 案例 二
• SOSO 音乐搜索首页应用了 css 图像拼合技术,将页面中
用到的小图片拼合成一张大图片在 css 中调用
• 图像拼合前需要 7 次 http 请求才可以将图片下载完,拼合
后只需要 1 次
• 图像拼合后减少了页面代码中的重复部分
最大限度的减少 HTTP 请求
启用服务器端压缩
• 针对 apache 1.3 + mod_gzip 和 apache-2.0.59 +
mod_deflate 等多种配置进行响应时间、压缩率、服务器负载
的测试。
• 测试结果表明在压缩率基本相同的情况下,由于
mod_deflate ( C )模块造成的负载远低于
mod_gzip ( A ) , 最终选定 apache2.0.59+mod_deflate
启用服务器端压缩
• 案例三
• Apache 打开 mod_deflate 后流量较之前节省了 30-40%.
以 12 月 22 日和 12 月 19 日流量数据对比,打开 mod_deflate 后流量较
之前节省了约 35%.
调整 DNS TTL
• DNS TTL
通过对用户访问过程的监测,发现在用户访问过程
中, DNS 解析时间占用了较大的比例,通过与管工的沟通
,将 DNS TTL 由 10 分钟修改为 30 分钟。
延长 DNS TTL 时间可以减少用户到根服务器解析 A 纪录
的次数,从而减少 DNS 解析时间,同时也降低了用户到
DNS 访问出错的几率,提高服务可用性。
TTL 修改后每天的根域查询量降低了 40% 。
CDN 外包
• 今年 4 月初,公司启动了 CDN 外包项目, SOSO 对各厂
商进行测试,在对试点数据进行了多次测试和分析的基础
上, 5 月底开始逐步将线上内容切换至 CDN ,虽然 CDN
的推进带来了一些额外的工作,但是静态内容切换至
CDN 后,速度较切换前提升 15% ,同时节省了大量服
务器和运营管理的成本。
第三方评测服务
• 为了客观得到用户访问的体验数据,我们在部门自己架设
监测服务器的基础上,引入了第三方评测服务, 5 月初购
买了 gomez 评测服务,通过 gomez 在全国的节点对现有
服务进行监测,可以知道不同地区、不同接入带宽的最终
用户实际访问效果,对业务的改进很有帮助。
第三方评测服务
• Gomez 测试数据展示。
可以通过最终用户的访问纪
录到用户请求每一个页面元
素的
DNS 、 Connect 、 1stByte
、 Download 等时间
• 还可以看到按省份、运营商
等分类的统计数据。
优化成果
• 2007 年 14 期《互联网周刊》刊登了一篇名为《中国热门
网站用户体验排行榜》的文章,文中 SOSO 在响应时间
、可靠性、稳定性三个方面分列第三、第二和第三;在国
内搜索类网站中排名第二。
• 这个排行榜是《互联网周刊》与网络服务机构 gomez 共同
推出的, 5 月底,测试方根据中国互联网协会( http://
www.chinarank.org.cn/)上热门网站的排行,通过部署在
北京、上海、广州的测试节点对热门网站进行了为期一个
月的监测。
后续的性能优化相关工作
• 利用 toolbar 客户端优势,搭建产品测速平台。
• 网页搜索结果页静态化。
谢谢大家

Weitere ähnliche Inhalte

Mehr von George Ang

腾讯大讲堂05 面向对象应对之道
腾讯大讲堂05 面向对象应对之道腾讯大讲堂05 面向对象应对之道
腾讯大讲堂05 面向对象应对之道George Ang
 
腾讯大讲堂06 qq邮箱性能优化
腾讯大讲堂06 qq邮箱性能优化腾讯大讲堂06 qq邮箱性能优化
腾讯大讲堂06 qq邮箱性能优化George Ang
 
腾讯大讲堂07 qq空间
腾讯大讲堂07 qq空间腾讯大讲堂07 qq空间
腾讯大讲堂07 qq空间George Ang
 
腾讯大讲堂08 可扩展web架构探讨
腾讯大讲堂08 可扩展web架构探讨腾讯大讲堂08 可扩展web架构探讨
腾讯大讲堂08 可扩展web架构探讨George Ang
 
腾讯大讲堂09 如何建设高性能网站
腾讯大讲堂09 如何建设高性能网站腾讯大讲堂09 如何建设高性能网站
腾讯大讲堂09 如何建设高性能网站George Ang
 
腾讯大讲堂01 移动qq产品发展历程
腾讯大讲堂01 移动qq产品发展历程腾讯大讲堂01 移动qq产品发展历程
腾讯大讲堂01 移动qq产品发展历程George Ang
 
腾讯大讲堂10 customer engagement
腾讯大讲堂10 customer engagement腾讯大讲堂10 customer engagement
腾讯大讲堂10 customer engagementGeorge Ang
 
腾讯大讲堂11 拍拍ce工作经验分享
腾讯大讲堂11 拍拍ce工作经验分享腾讯大讲堂11 拍拍ce工作经验分享
腾讯大讲堂11 拍拍ce工作经验分享George Ang
 
腾讯大讲堂14 qq直播(qq live) 介绍
腾讯大讲堂14 qq直播(qq live) 介绍腾讯大讲堂14 qq直播(qq live) 介绍
腾讯大讲堂14 qq直播(qq live) 介绍George Ang
 
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍George Ang
 
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍George Ang
 
腾讯大讲堂16 产品经理工作心得分享
腾讯大讲堂16 产品经理工作心得分享腾讯大讲堂16 产品经理工作心得分享
腾讯大讲堂16 产品经理工作心得分享George Ang
 
腾讯大讲堂17 性能优化不是仅局限于后台(qzone)
腾讯大讲堂17 性能优化不是仅局限于后台(qzone)腾讯大讲堂17 性能优化不是仅局限于后台(qzone)
腾讯大讲堂17 性能优化不是仅局限于后台(qzone)George Ang
 
腾讯大讲堂18 让我们戴上有色眼镜--qzone前台架构的优化分享
腾讯大讲堂18 让我们戴上有色眼镜--qzone前台架构的优化分享腾讯大讲堂18 让我们戴上有色眼镜--qzone前台架构的优化分享
腾讯大讲堂18 让我们戴上有色眼镜--qzone前台架构的优化分享George Ang
 
腾讯大讲堂19 系统优化的方向
腾讯大讲堂19 系统优化的方向腾讯大讲堂19 系统优化的方向
腾讯大讲堂19 系统优化的方向George Ang
 
腾讯大讲堂21 搜索引擎优化(seo)简介
腾讯大讲堂21 搜索引擎优化(seo)简介腾讯大讲堂21 搜索引擎优化(seo)简介
腾讯大讲堂21 搜索引擎优化(seo)简介George Ang
 
腾讯大讲堂24 qq show2.0重构历程
腾讯大讲堂24 qq show2.0重构历程腾讯大讲堂24 qq show2.0重构历程
腾讯大讲堂24 qq show2.0重构历程George Ang
 
腾讯大讲堂25 企业级搜索托管平台介绍
腾讯大讲堂25 企业级搜索托管平台介绍腾讯大讲堂25 企业级搜索托管平台介绍
腾讯大讲堂25 企业级搜索托管平台介绍George Ang
 
腾讯大讲堂26 带宽优化之道
腾讯大讲堂26 带宽优化之道腾讯大讲堂26 带宽优化之道
腾讯大讲堂26 带宽优化之道George Ang
 
腾讯大讲堂28 用户与产品的桥梁
腾讯大讲堂28 用户与产品的桥梁腾讯大讲堂28 用户与产品的桥梁
腾讯大讲堂28 用户与产品的桥梁George Ang
 

Mehr von George Ang (20)

腾讯大讲堂05 面向对象应对之道
腾讯大讲堂05 面向对象应对之道腾讯大讲堂05 面向对象应对之道
腾讯大讲堂05 面向对象应对之道
 
腾讯大讲堂06 qq邮箱性能优化
腾讯大讲堂06 qq邮箱性能优化腾讯大讲堂06 qq邮箱性能优化
腾讯大讲堂06 qq邮箱性能优化
 
腾讯大讲堂07 qq空间
腾讯大讲堂07 qq空间腾讯大讲堂07 qq空间
腾讯大讲堂07 qq空间
 
腾讯大讲堂08 可扩展web架构探讨
腾讯大讲堂08 可扩展web架构探讨腾讯大讲堂08 可扩展web架构探讨
腾讯大讲堂08 可扩展web架构探讨
 
腾讯大讲堂09 如何建设高性能网站
腾讯大讲堂09 如何建设高性能网站腾讯大讲堂09 如何建设高性能网站
腾讯大讲堂09 如何建设高性能网站
 
腾讯大讲堂01 移动qq产品发展历程
腾讯大讲堂01 移动qq产品发展历程腾讯大讲堂01 移动qq产品发展历程
腾讯大讲堂01 移动qq产品发展历程
 
腾讯大讲堂10 customer engagement
腾讯大讲堂10 customer engagement腾讯大讲堂10 customer engagement
腾讯大讲堂10 customer engagement
 
腾讯大讲堂11 拍拍ce工作经验分享
腾讯大讲堂11 拍拍ce工作经验分享腾讯大讲堂11 拍拍ce工作经验分享
腾讯大讲堂11 拍拍ce工作经验分享
 
腾讯大讲堂14 qq直播(qq live) 介绍
腾讯大讲堂14 qq直播(qq live) 介绍腾讯大讲堂14 qq直播(qq live) 介绍
腾讯大讲堂14 qq直播(qq live) 介绍
 
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
 
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
腾讯大讲堂15 市场研究及数据分析理念及方法概要介绍
 
腾讯大讲堂16 产品经理工作心得分享
腾讯大讲堂16 产品经理工作心得分享腾讯大讲堂16 产品经理工作心得分享
腾讯大讲堂16 产品经理工作心得分享
 
腾讯大讲堂17 性能优化不是仅局限于后台(qzone)
腾讯大讲堂17 性能优化不是仅局限于后台(qzone)腾讯大讲堂17 性能优化不是仅局限于后台(qzone)
腾讯大讲堂17 性能优化不是仅局限于后台(qzone)
 
腾讯大讲堂18 让我们戴上有色眼镜--qzone前台架构的优化分享
腾讯大讲堂18 让我们戴上有色眼镜--qzone前台架构的优化分享腾讯大讲堂18 让我们戴上有色眼镜--qzone前台架构的优化分享
腾讯大讲堂18 让我们戴上有色眼镜--qzone前台架构的优化分享
 
腾讯大讲堂19 系统优化的方向
腾讯大讲堂19 系统优化的方向腾讯大讲堂19 系统优化的方向
腾讯大讲堂19 系统优化的方向
 
腾讯大讲堂21 搜索引擎优化(seo)简介
腾讯大讲堂21 搜索引擎优化(seo)简介腾讯大讲堂21 搜索引擎优化(seo)简介
腾讯大讲堂21 搜索引擎优化(seo)简介
 
腾讯大讲堂24 qq show2.0重构历程
腾讯大讲堂24 qq show2.0重构历程腾讯大讲堂24 qq show2.0重构历程
腾讯大讲堂24 qq show2.0重构历程
 
腾讯大讲堂25 企业级搜索托管平台介绍
腾讯大讲堂25 企业级搜索托管平台介绍腾讯大讲堂25 企业级搜索托管平台介绍
腾讯大讲堂25 企业级搜索托管平台介绍
 
腾讯大讲堂26 带宽优化之道
腾讯大讲堂26 带宽优化之道腾讯大讲堂26 带宽优化之道
腾讯大讲堂26 带宽优化之道
 
腾讯大讲堂28 用户与产品的桥梁
腾讯大讲堂28 用户与产品的桥梁腾讯大讲堂28 用户与产品的桥梁
腾讯大讲堂28 用户与产品的桥梁
 

腾讯大讲堂13 soso访问速度优化

Hinweis der Redaktion

  1. SOSO从开始运营起,速度性能优化工作一直在持续不断的进行,看看我们都做了哪些工作。
  2. 按照用户分布,按理想状态做服务器的布属,在独立用户超过50万的地区部署服务器。右图为chinacache在全国的服务器分布,目前chinacache在国内拥有350个节点,可服务的互联网用户超过全国总数的95%。(2006年全国上网人数为1.23亿)
  3. 由于运营成本等诸多问题,我们不可能按照理想分布部署服务器,所以我们按照用户的分布,把全国分为四个区域,既北方用户(指北方十省)、华东华南用户(主要指江浙、福建等东南沿海省份)、南方用户(指广东等南方省份)、西北西南用户(主要指西部省份)。其他用户约占全部用户的10.16%。*其他用户为教育网、铁通、移动、联通或未知地域、运营商的用户。
  4. 全国的四个区域,这个区域的划分参考了SOSO的用户分布以及公司的IDC测速平台对现有IDC的速度测试数据。
  5. 上述全国四个区域的划分正好符合了公司对全国IDC的建设重点,既北方用户(天津、北京)、西南、西北用户(西安)、南方用户(深圳)、华东、华南用户(南京、上海)
  6. A:apache 1.3 + mod_gzip C:apache-2.0.59 + mod_deflate D:apache-2.0.59 + mod_defalte + mod_file_cache Aapche 2.0.59中开启mod_file_cache后,对访问成功率、总消耗时间、服务器端负载均稍有改善,但改善幅度很小。同时,由于目前标准mod_file_cache配置是通过配置文件中的文件列表完成,不够灵活,如果启用,会增加内容发布更新的难度,所以未选用。
  7. 国内没有DNS根服务器,所有根域的查询要到国外的根服务器进行,增加了出错的几率及解析时间。浏览器在域名解析完成前无法下载任何内容。