SlideShare ist ein Scribd-Unternehmen logo
1 von 85
运维工具让你的开发运营更轻松 架构平台部 - 运营平台中心 Aresliang
[object Object],[object Object],[object Object],[object Object],个人介绍
[object Object],[object Object],[object Object],Agenda
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],我们为什么要建ITIL 还将以每年 80% 的速度增长
[object Object],[object Object],[object Object],我们为什么要建ITIL
我们为什么要建ITIL 30 多个亿 100 亿 我们的规模会有多大? 我们需要多强大的支持能力?
[object Object],[object Object],[object Object],Agenda
IT 管理国际规范 --ITIL ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Change Config Help Desk Problem Cost SLM Avail Contingency Operations Capacity Security http://www.itil.co. uk
[object Object],[object Object],[object Object],[object Object],[object Object],ITIL 的好处
HP - ITSM 方法论
如何实施 ITIL 客 户 服务台 突发事件管理 问题管理 变更管理 发布管理 专家建议:应用 ITIL ,一般从服务支持环节着手。服务支持环节包括包含 5 个流程:事件管理、问题管理、变更管理、配置管理和软件发布管理,它们之间互为补充。 ITIL 的实施过程中,配置管理是核心。 配置管理 CMDB
传统的 IT 管理和 ITSM 比较
 
[object Object],[object Object],[object Object],[object Object],IT 服务管理的核心思想
[object Object],[object Object],[object Object],Agenda
服务目录介绍 质量 基础 数据 运营平 台中心 成本 4个产品线 31个子产品 效率
运营环境基础数据 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],质量 基础 数据 200 7 成本 效率
运营质量 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],基础 数据 成本 200 7 效率 质量
运营效率 效率 ,[object Object],[object Object],[object Object],[object Object],基础 数据 成本 200 7 质量
控制运营成本 ,[object Object],[object Object],基础 数据 成本 200 7 效率 质量
产品线体系
价值 - 运维的工作及重心转变 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],重心 日常操作 救火 运营分析 优化改进 监控预防 工具化、智能化及自动化 持续优化和规范环境,降低复杂度 举措 进化
[object Object]
[object Object],[object Object],什么是配置管理 服务台 突发事件管理 问题管理 变更管理 发布管理 配置管理 CMDB
定位
[object Object],[object Object],[object Object],[object Object],价值
系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高级配置管理模块 接口
系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 配置核心支撑平台 (包括配置系统核心的数据库 (CMDB) 和管理模型、接口、管理工具 ( 定义及配置管理、用户管理、角色权限管理、日志管理、通用增删改、通用查询检索)
系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 基于场景的配置管理模块 (为了提高批量操作,简化配置管理的复杂性,而引入的基于场景的配置管理模块)
系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 高层配置管理模块 (以配置数据的管理为核心的高层增值管理模块,如综合管理试图)
系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 Auto Discovery System (用于数据的自动发现、自动采集、自校验和诊断的系统)
系统结构 配置管理支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 周边配套系统 (主要不是用于配置管理的系统,但需要存取 CMDB 中的数据的系统)
系统界面  http://Server.itil.com
[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],3 个 W
用户分析 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],发现快、定位准 直观、全面的了解业务情况 业务情况量化了解
[object Object],[object Object],[object Object],定位和价值
逻辑结构
监控层次 产品 业务 模块组 模块 业务功能 用例 用例操作 组件  (具体到IP) 基础资源 外部监控 业务内监控 基础监控
产品体系架构(三横两纵) 用户体验监控系统 用户体验定位系统 业务特性监控系统 外部 监控 业务逻辑监控系统 模块间调用监控系统 业务模块监控系统 业务内部 监控 基础环境监控 基础设备监控系统 基础网络监控系统 统一告警平台 告警关联模型库 统一告警渠道 智能分析平台
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],基础设备监控系统
基础网管架构层次 Agent 数据接入层 数据 Cache 层 数据逻辑运算层 DB, 文件存储层 数据访问接口层 Web 展示层 采集的网络 , 主机数据 , 业务插件接入数据 最近访问数据内存缓冲 告警分析 , 数据分析 , 叠加运算等 主机性能数据 , 告警等历史数据 各种数据访问方法 , 访问协议适配方法 基于 iis 的 aps.net 和 apache cgi web 应用展示 网管公共组件库 (.so)
数据流
核心价值 - 故障主动发现和定位能力
核心价值 - 故障主动发现和定位能力
核心价值 - 采集的数据挖掘展现
核心价值 - 挖掘展现:服务器负载分析
[object Object],[object Object],[object Object],模块间调用监控系统
模块间调用监控系统现状及原状对比 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],原状 原状 : 现状 :
模块间调用原状特点 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
模块间调用原状特点 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
模块间调用原状特点 ,[object Object],[object Object],[object Object],[object Object],[object Object]
模块间调用原状特点 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
产品架构
日志集中平台 ---local LogApi
日志预处理机制 ,[object Object],[object Object],[object Object],[object Object],Log files ,[object Object],处理插件 处理插件 Result files ,[object Object],[object Object]
日志预处理机制说明 ,[object Object],[object Object],[object Object],[object Object]
消灭隐患 - 提升业务可用率和产品质量 ,[object Object]
质量提升案例 ,[object Object],[object Object],[object Object],[object Object]
快速、准确的定位 - 提升运营效率 ,[object Object],[object Object],[object Object]
效率提升案例 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
为业务发展和决策提供数据支持 ,[object Object],[object Object]
对不达标 CGI 业务潜在隐患的实时跟踪 ,[object Object]
后续建设计划  ,[object Object]
后续建设计划  ,[object Object]
[object Object]
服务支持流程 事件管理流程用于记录 跟踪和监控事件 ,[object Object],[object Object],[object Object],[object Object],反应公司平均故障解决时长、计算各个业务的可用率
单据类型 标 红色 是为目前未实现 被动 主动 事件 维护单 客服 自动监控 / 运维发现 突发事件 监控单 投诉单 服务请求 (管工事件) 有影响  无影响  管工 BU 处理 部门?
产品关联图 变更实施解决故障 事件管理 问题管理 变更管理 配置管理 服务台 变更请求 提供配置信息 配置变化通知  提供配置信息 提供配置信息 趋势分析 避免故障重复出现 监控告警 客服工单 投诉单
事件系统的价值和定位 SLA 确定及签署 事件的记录及处理 SLA 的阶段核算及监控 绩效及评价考核 SLA 优化及改进措施 年度系统建设及优化规划 系统建设及优化实施 SLA 偏离整改及行动方案 系统改进及优化 系统建设项目评估评价 图:可用性管理与项目建设的推进协作
解决方案及成果 解决方案 项目收益 事件记录 公司统一事件录入平台,记录跟踪事件处理直至最终解决 1. 将原来分散在工单系统、事件系统和 BU 内部的运维数据录入统一的事件管理平台中 2. 公司只建设一套系统,各部门不用投入重复开发 3. 将 ISD/IED 对事件管理的管理和规范推广到其他部门 管理支持 建立服务目录和级别管理模块 1. 在统一平台上展现管工 SLA 以及 BU 可用性统计等重要运营数据和报表,可以纵向对比运营质量 2. 支持管工、客服、 BU 针对数据分析,进行管理决策 3. 支持对运维人员的服务质量和运维质量考评 ITIL 其他系统建设 统一后续问题管理,知识库管理的建设,减少重复投入 1. 通过各相关系统提供的接口,预留变更管理、问题管理接口,并在统一平台上展现管工 SLA 以及 BU 可用性统计等重要运营数据和报表 2. 已支持与 ISD 问题管理系统接口,实现初步的问题管理升级模式
阶段目标 08Q1 08Q2 08Q4 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],08Q3 ,[object Object],[object Object],[object Object],V3.2 V3.3 V4.0 夯实基础 精耕细作 拓展 整合
系统界面  http://helper.itil.com
[object Object]
公司发布工作以前存在的问题 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
发布管理解决方案的层面 发布管理 发布工具及管理系统 ICT 基础架构 从发布管理、发布工具及系统、 ICT 架构三个层面去改进发布管理。 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],价值
ARS 发布推广情况 红色代表基本覆盖所有产品 蓝色代表部分产品覆盖 白色代表正在试用中 部门 对象业务 接口人 现状 ISD Qzone waynewang 1 、已经覆盖 ISD80 %的发布工作; 2 、剩余 20 %的 ISD 发布计划在 Q2 实现覆盖(主要是包的增量发布); QQ 秀 QQ 会员 QQ 相册 QQ 交友 QQ 音乐 Imagecache IED 寻仙 leoxiong 、 felixwang 1 、飞行岛发布稳定。 2 、 PET 1.0 正常进行了多次正式环境发布。 3 、 CF 进行了多次正式发布。 4 、其它多个产品处于试用中。 QQ 宠物 1.0 飞行岛 QQ 宠物 2.0 CF QQ 幻想 无线 手机 QQ amyli,yen,steveqiao,wingzhou 1 、手机 QQ 发布稳定。 2 、 VOIP 进行了多次正式发布。 3 、其它多个产品处于试用中。 无线音乐 无线平台服务 VOIP 创新中心 QQ 客服 jackye 1 、频道应用发布稳定。 网站部 频道应用 国际产品中心 美国 QQGame 广告部 QQlive 运营支持部 pay.qq.com hairyxie 发布数量稳定。 电子商务部   eagle 已完成部署,试用中 在线支付部 财富通 aaronzheng 完成了新环境的部署,试用中。
ARS 发布数据 注明: 1 、图表中所示为发布次数,不是发布版本数,因为一个版本可能会发布多次; 2 、互动娱乐和无线产品部的发布次数中包含试用次数。
ARS  版本计划 V3.2 Mar 2008 V3.2  Beta02  Apr 6,2008 V3.0 Dec 2007 V3.1 Jan 2008 ARS  V3.2 主要进行 windows 移植开发、 Linux 整改、包发布、 task 完善。 V3.2 Beta03 Apr 22,2008 V3.3 Jul 2008 V3.2 Beta04 May 15,2008 V3.2 Beta05 May 23,2008 V3.2 Beta06 Jun 6,2008 V3.2 Beta07 Jun 17,2008 V3.2 Beta08 Jun 27,2008
公共运维平台的规划 安全管理 公共运维平台 发布管理 任务管理 TSH 监控管理 用户管理 权限管理 操作日志管理 发布自动化 发布平台化 发布审批 发布计划管理 版本管理 公共软件的发布管理 命令 / 脚本集中管理(编辑 / 查看 / 保存) 任务的权限管理 任务手工 / 定时自动调用 任务执行结果查看 进程状态监控; 版本状态查询; 自动 / 手工重启进程; 用户分权分组管理 操作进行分类管理 记录 / 查看用户在公共运维平台的所有操作
公共运维平台的拓扑图 Rnet Dnet IDC ARS  服务器 编译机池 生产机 生产机 办公网 测试机池 预发布机池 ARS  备份服务器 …… … … …
公共运维平台定位 IDC RNet 办公网 控制以及 审计对生 产环境的 访问 … … ……
[object Object]
 

Weitere ähnliche Inhalte

Was ist angesagt?

易仁Mes解决方案介绍 website-20120228
易仁Mes解决方案介绍 website-20120228易仁Mes解决方案介绍 website-20120228
易仁Mes解决方案介绍 website-20120228azhe
 
Se2009 ch8
Se2009 ch8 Se2009 ch8
Se2009 ch8 浒 刘
 
易仁Mes解决方案介绍 website
易仁Mes解决方案介绍 website易仁Mes解决方案介绍 website
易仁Mes解决方案介绍 websiteazhe
 
Web系统性能测试方案浅谈
Web系统性能测试方案浅谈Web系统性能测试方案浅谈
Web系统性能测试方案浅谈beiyu95
 
集群运维管理平台
集群运维管理平台集群运维管理平台
集群运维管理平台mysqlops
 
盛大游戏运维体系
盛大游戏运维体系盛大游戏运维体系
盛大游戏运维体系Ken Liu
 
tasmc Mason Liu SAP Teched@Shanghai
tasmc Mason Liu SAP Teched@Shanghaitasmc Mason Liu SAP Teched@Shanghai
tasmc Mason Liu SAP Teched@Shanghaitasmc
 
Brochure acl solutions_new_version
Brochure acl solutions_new_versionBrochure acl solutions_new_version
Brochure acl solutions_new_versionDavid Chuang
 
議題三:政府網站常見弱點與分析
議題三:政府網站常見弱點與分析議題三:政府網站常見弱點與分析
議題三:政府網站常見弱點與分析Nicolas su
 
IBM PureFlex (Traditional Chinese)
IBM PureFlex (Traditional Chinese)IBM PureFlex (Traditional Chinese)
IBM PureFlex (Traditional Chinese)Jerry Huang
 
V mware 业务连续性和灾难恢复
V mware 业务连续性和灾难恢复V mware 业务连续性和灾难恢复
V mware 业务连续性和灾难恢复ITband
 
Itil资料(好资料)
Itil资料(好资料)Itil资料(好资料)
Itil资料(好资料)betaspirit
 
Oracle 性能优化
Oracle 性能优化Oracle 性能优化
Oracle 性能优化james tong
 
阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路mysqlops
 

Was ist angesagt? (17)

Mocha Bsm
Mocha BsmMocha Bsm
Mocha Bsm
 
易仁Mes解决方案介绍 website-20120228
易仁Mes解决方案介绍 website-20120228易仁Mes解决方案介绍 website-20120228
易仁Mes解决方案介绍 website-20120228
 
Se2009 ch8
Se2009 ch8 Se2009 ch8
Se2009 ch8
 
易仁Mes解决方案介绍 website
易仁Mes解决方案介绍 website易仁Mes解决方案介绍 website
易仁Mes解决方案介绍 website
 
Web系统性能测试方案浅谈
Web系统性能测试方案浅谈Web系统性能测试方案浅谈
Web系统性能测试方案浅谈
 
Symantec Endpoint Protection 12.1
Symantec Endpoint Protection 12.1Symantec Endpoint Protection 12.1
Symantec Endpoint Protection 12.1
 
集群运维管理平台
集群运维管理平台集群运维管理平台
集群运维管理平台
 
零壹科技 個人資料管理系統 (PIMS) WorkShop
零壹科技 個人資料管理系統 (PIMS) WorkShop零壹科技 個人資料管理系統 (PIMS) WorkShop
零壹科技 個人資料管理系統 (PIMS) WorkShop
 
盛大游戏运维体系
盛大游戏运维体系盛大游戏运维体系
盛大游戏运维体系
 
tasmc Mason Liu SAP Teched@Shanghai
tasmc Mason Liu SAP Teched@Shanghaitasmc Mason Liu SAP Teched@Shanghai
tasmc Mason Liu SAP Teched@Shanghai
 
Brochure acl solutions_new_version
Brochure acl solutions_new_versionBrochure acl solutions_new_version
Brochure acl solutions_new_version
 
議題三:政府網站常見弱點與分析
議題三:政府網站常見弱點與分析議題三:政府網站常見弱點與分析
議題三:政府網站常見弱點與分析
 
IBM PureFlex (Traditional Chinese)
IBM PureFlex (Traditional Chinese)IBM PureFlex (Traditional Chinese)
IBM PureFlex (Traditional Chinese)
 
V mware 业务连续性和灾难恢复
V mware 业务连续性和灾难恢复V mware 业务连续性和灾难恢复
V mware 业务连续性和灾难恢复
 
Itil资料(好资料)
Itil资料(好资料)Itil资料(好资料)
Itil资料(好资料)
 
Oracle 性能优化
Oracle 性能优化Oracle 性能优化
Oracle 性能优化
 
阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路
 

Ähnlich wie 腾讯大讲堂30 运维工具让你的开发运营更轻松

Actuate presentation 2011
Actuate presentation   2011Actuate presentation   2011
Actuate presentation 2011Luke Han
 
民间秘方
民间秘方民间秘方
民间秘方dynasty
 
数据采集中间件技术交流
数据采集中间件技术交流数据采集中间件技术交流
数据采集中间件技术交流jerry tom
 
Sybase Analytic Appliance
Sybase Analytic ApplianceSybase Analytic Appliance
Sybase Analytic Appliancefocusbi
 
Compliance & IT
Compliance & ITCompliance & IT
Compliance & ITBilly Lee
 
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境drewz lin
 
C A W D A J O P
C A W D A J O PC A W D A J O P
C A W D A J O P51 lecture
 
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林corlin chen
 
版本控制系统进阶
版本控制系统进阶版本控制系统进阶
版本控制系统进阶killmyday
 
baidu fuye
baidu fuyebaidu fuye
baidu fuyedachmx
 
百度 fuye
百度 fuye百度 fuye
百度 fuyedachmx
 
阿里云 张旭 集群运维管理平台
阿里云 张旭 集群运维管理平台阿里云 张旭 集群运维管理平台
阿里云 张旭 集群运维管理平台guiyingshenxia
 
赛诺朗基全局事件管理
赛诺朗基全局事件管理赛诺朗基全局事件管理
赛诺朗基全局事件管理Mktg
 
盛大游戏运维体系
盛大游戏运维体系盛大游戏运维体系
盛大游戏运维体系Ken Liu
 
Easy flowprofile
Easy flowprofileEasy flowprofile
Easy flowprofileazhe
 
淘宝网架构变迁和挑战(Oracle架构师日)
淘宝网架构变迁和挑战(Oracle架构师日)淘宝网架构变迁和挑战(Oracle架构师日)
淘宝网架构变迁和挑战(Oracle架构师日)vanadies10
 
從零開始做架構圖
從零開始做架構圖從零開始做架構圖
從零開始做架構圖Philip Zheng
 

Ähnlich wie 腾讯大讲堂30 运维工具让你的开发运营更轻松 (20)

Actuate presentation 2011
Actuate presentation   2011Actuate presentation   2011
Actuate presentation 2011
 
民间秘方
民间秘方民间秘方
民间秘方
 
数据采集中间件技术交流
数据采集中间件技术交流数据采集中间件技术交流
数据采集中间件技术交流
 
Sybase Analytic Appliance
Sybase Analytic ApplianceSybase Analytic Appliance
Sybase Analytic Appliance
 
Compliance & IT
Compliance & ITCompliance & IT
Compliance & IT
 
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
Top100summit 腾讯-周健-服务化与体系化解决大量定制小项目开发困境
 
C A W D A J O P
C A W D A J O PC A W D A J O P
C A W D A J O P
 
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林E tom ngoss规范及siebel系统在电信行业的应用 陈永林
E tom ngoss规范及siebel系统在电信行业的应用 陈永林
 
版本控制系统进阶
版本控制系统进阶版本控制系统进阶
版本控制系统进阶
 
baidu fuye
baidu fuyebaidu fuye
baidu fuye
 
百度 fuye
百度 fuye百度 fuye
百度 fuye
 
阿里云 张旭 集群运维管理平台
阿里云 张旭 集群运维管理平台阿里云 张旭 集群运维管理平台
阿里云 张旭 集群运维管理平台
 
赛诺朗基全局事件管理
赛诺朗基全局事件管理赛诺朗基全局事件管理
赛诺朗基全局事件管理
 
盛大游戏运维体系
盛大游戏运维体系盛大游戏运维体系
盛大游戏运维体系
 
Easy flowprofile
Easy flowprofileEasy flowprofile
Easy flowprofile
 
淘宝网架构变迁和挑战(Oracle架构师日)
淘宝网架构变迁和挑战(Oracle架构师日)淘宝网架构变迁和挑战(Oracle架构师日)
淘宝网架构变迁和挑战(Oracle架构师日)
 
從零開始做架構圖
從零開始做架構圖從零開始做架構圖
從零開始做架構圖
 
明昕版式
明昕版式明昕版式
明昕版式
 
Java@taobao
Java@taobaoJava@taobao
Java@taobao
 
SWsoft_Prim@Telecom
SWsoft_Prim@TelecomSWsoft_Prim@Telecom
SWsoft_Prim@Telecom
 

Mehr von Michael Zhang

廣告系統在Docker/Mesos上的可靠性實踐
廣告系統在Docker/Mesos上的可靠性實踐廣告系統在Docker/Mesos上的可靠性實踐
廣告系統在Docker/Mesos上的可靠性實踐Michael Zhang
 
HKIX Upgrade to 100Gbps-Based Two-Tier Architecture
HKIX Upgrade to 100Gbps-Based Two-Tier ArchitectureHKIX Upgrade to 100Gbps-Based Two-Tier Architecture
HKIX Upgrade to 100Gbps-Based Two-Tier ArchitectureMichael Zhang
 
2014 GITC 帶上數據去創業 talkingdata—高铎
 2014 GITC 帶上數據去創業 talkingdata—高铎 2014 GITC 帶上數據去創業 talkingdata—高铎
2014 GITC 帶上數據去創業 talkingdata—高铎Michael Zhang
 
Fastsocket Linxiaofeng
Fastsocket LinxiaofengFastsocket Linxiaofeng
Fastsocket LinxiaofengMichael Zhang
 
2014 Hpocon 李志刚 1号店 - puppet在1号店的实践
2014 Hpocon 李志刚   1号店 - puppet在1号店的实践2014 Hpocon 李志刚   1号店 - puppet在1号店的实践
2014 Hpocon 李志刚 1号店 - puppet在1号店的实践Michael Zhang
 
2014 Hpocon 姚仁捷 唯品会 - data driven ops
2014 Hpocon 姚仁捷   唯品会 - data driven ops2014 Hpocon 姚仁捷   唯品会 - data driven ops
2014 Hpocon 姚仁捷 唯品会 - data driven opsMichael Zhang
 
2014 Hpocon 高驰涛 云智慧 - apm在高性能架构中的应用
2014 Hpocon 高驰涛   云智慧 - apm在高性能架构中的应用2014 Hpocon 高驰涛   云智慧 - apm在高性能架构中的应用
2014 Hpocon 高驰涛 云智慧 - apm在高性能架构中的应用Michael Zhang
 
2014 Hpocon 黄慧攀 upyun - 平台架构的服务监控
2014 Hpocon 黄慧攀   upyun - 平台架构的服务监控2014 Hpocon 黄慧攀   upyun - 平台架构的服务监控
2014 Hpocon 黄慧攀 upyun - 平台架构的服务监控Michael Zhang
 
2014 Hpocon 吴磊 ucloud - 由点到面 提升公有云服务可用性
2014 Hpocon 吴磊   ucloud - 由点到面 提升公有云服务可用性2014 Hpocon 吴磊   ucloud - 由点到面 提升公有云服务可用性
2014 Hpocon 吴磊 ucloud - 由点到面 提升公有云服务可用性Michael Zhang
 
2014 Hpocon 周辉 大众点评 - 大众点评混合开发模式下的加速尝试
2014 Hpocon 周辉   大众点评 - 大众点评混合开发模式下的加速尝试2014 Hpocon 周辉   大众点评 - 大众点评混合开发模式下的加速尝试
2014 Hpocon 周辉 大众点评 - 大众点评混合开发模式下的加速尝试Michael Zhang
 
Cuda 6 performance_report
Cuda 6 performance_reportCuda 6 performance_report
Cuda 6 performance_reportMichael Zhang
 
The Data Center and Hadoop
The Data Center and HadoopThe Data Center and Hadoop
The Data Center and HadoopMichael Zhang
 
Hadoop Hardware @Twitter: Size does matter.
Hadoop Hardware @Twitter: Size does matter.Hadoop Hardware @Twitter: Size does matter.
Hadoop Hardware @Twitter: Size does matter.Michael Zhang
 
Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]
Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]
Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]Michael Zhang
 
Q con shanghai2013-[刘海锋]-[京东文件系统简介]
Q con shanghai2013-[刘海锋]-[京东文件系统简介]Q con shanghai2013-[刘海锋]-[京东文件系统简介]
Q con shanghai2013-[刘海锋]-[京东文件系统简介]Michael Zhang
 
Q con shanghai2013-[韩军]-[超大型电商系统架构解密]
Q con shanghai2013-[韩军]-[超大型电商系统架构解密]Q con shanghai2013-[韩军]-[超大型电商系统架构解密]
Q con shanghai2013-[韩军]-[超大型电商系统架构解密]Michael Zhang
 
Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]
Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]
Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]Michael Zhang
 
Q con shanghai2013-[黄舒泉]-[intel it openstack practice]
Q con shanghai2013-[黄舒泉]-[intel it openstack practice]Q con shanghai2013-[黄舒泉]-[intel it openstack practice]
Q con shanghai2013-[黄舒泉]-[intel it openstack practice]Michael Zhang
 
Q con shanghai2013-罗婷-performance methodology
Q con shanghai2013-罗婷-performance methodologyQ con shanghai2013-罗婷-performance methodology
Q con shanghai2013-罗婷-performance methodologyMichael Zhang
 

Mehr von Michael Zhang (20)

廣告系統在Docker/Mesos上的可靠性實踐
廣告系統在Docker/Mesos上的可靠性實踐廣告系統在Docker/Mesos上的可靠性實踐
廣告系統在Docker/Mesos上的可靠性實踐
 
HKIX Upgrade to 100Gbps-Based Two-Tier Architecture
HKIX Upgrade to 100Gbps-Based Two-Tier ArchitectureHKIX Upgrade to 100Gbps-Based Two-Tier Architecture
HKIX Upgrade to 100Gbps-Based Two-Tier Architecture
 
2014 GITC 帶上數據去創業 talkingdata—高铎
 2014 GITC 帶上數據去創業 talkingdata—高铎 2014 GITC 帶上數據去創業 talkingdata—高铎
2014 GITC 帶上數據去創業 talkingdata—高铎
 
Fastsocket Linxiaofeng
Fastsocket LinxiaofengFastsocket Linxiaofeng
Fastsocket Linxiaofeng
 
Spark sql meetup
Spark sql meetupSpark sql meetup
Spark sql meetup
 
2014 Hpocon 李志刚 1号店 - puppet在1号店的实践
2014 Hpocon 李志刚   1号店 - puppet在1号店的实践2014 Hpocon 李志刚   1号店 - puppet在1号店的实践
2014 Hpocon 李志刚 1号店 - puppet在1号店的实践
 
2014 Hpocon 姚仁捷 唯品会 - data driven ops
2014 Hpocon 姚仁捷   唯品会 - data driven ops2014 Hpocon 姚仁捷   唯品会 - data driven ops
2014 Hpocon 姚仁捷 唯品会 - data driven ops
 
2014 Hpocon 高驰涛 云智慧 - apm在高性能架构中的应用
2014 Hpocon 高驰涛   云智慧 - apm在高性能架构中的应用2014 Hpocon 高驰涛   云智慧 - apm在高性能架构中的应用
2014 Hpocon 高驰涛 云智慧 - apm在高性能架构中的应用
 
2014 Hpocon 黄慧攀 upyun - 平台架构的服务监控
2014 Hpocon 黄慧攀   upyun - 平台架构的服务监控2014 Hpocon 黄慧攀   upyun - 平台架构的服务监控
2014 Hpocon 黄慧攀 upyun - 平台架构的服务监控
 
2014 Hpocon 吴磊 ucloud - 由点到面 提升公有云服务可用性
2014 Hpocon 吴磊   ucloud - 由点到面 提升公有云服务可用性2014 Hpocon 吴磊   ucloud - 由点到面 提升公有云服务可用性
2014 Hpocon 吴磊 ucloud - 由点到面 提升公有云服务可用性
 
2014 Hpocon 周辉 大众点评 - 大众点评混合开发模式下的加速尝试
2014 Hpocon 周辉   大众点评 - 大众点评混合开发模式下的加速尝试2014 Hpocon 周辉   大众点评 - 大众点评混合开发模式下的加速尝试
2014 Hpocon 周辉 大众点评 - 大众点评混合开发模式下的加速尝试
 
Cuda 6 performance_report
Cuda 6 performance_reportCuda 6 performance_report
Cuda 6 performance_report
 
The Data Center and Hadoop
The Data Center and HadoopThe Data Center and Hadoop
The Data Center and Hadoop
 
Hadoop Hardware @Twitter: Size does matter.
Hadoop Hardware @Twitter: Size does matter.Hadoop Hardware @Twitter: Size does matter.
Hadoop Hardware @Twitter: Size does matter.
 
Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]
Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]
Q con shanghai2013-[ben lavender]-[long-distance relationships with robots]
 
Q con shanghai2013-[刘海锋]-[京东文件系统简介]
Q con shanghai2013-[刘海锋]-[京东文件系统简介]Q con shanghai2013-[刘海锋]-[京东文件系统简介]
Q con shanghai2013-[刘海锋]-[京东文件系统简介]
 
Q con shanghai2013-[韩军]-[超大型电商系统架构解密]
Q con shanghai2013-[韩军]-[超大型电商系统架构解密]Q con shanghai2013-[韩军]-[超大型电商系统架构解密]
Q con shanghai2013-[韩军]-[超大型电商系统架构解密]
 
Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]
Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]
Q con shanghai2013-[jains krums]-[real-time-delivery-archiecture]
 
Q con shanghai2013-[黄舒泉]-[intel it openstack practice]
Q con shanghai2013-[黄舒泉]-[intel it openstack practice]Q con shanghai2013-[黄舒泉]-[intel it openstack practice]
Q con shanghai2013-[黄舒泉]-[intel it openstack practice]
 
Q con shanghai2013-罗婷-performance methodology
Q con shanghai2013-罗婷-performance methodologyQ con shanghai2013-罗婷-performance methodology
Q con shanghai2013-罗婷-performance methodology
 

腾讯大讲堂30 运维工具让你的开发运营更轻松

  • 2.
  • 3.
  • 4.
  • 5.
  • 6. 我们为什么要建ITIL 30 多个亿 100 亿 我们的规模会有多大? 我们需要多强大的支持能力?
  • 7.
  • 8.
  • 9.
  • 10. HP - ITSM 方法论
  • 11. 如何实施 ITIL 客 户 服务台 突发事件管理 问题管理 变更管理 发布管理 专家建议:应用 ITIL ,一般从服务支持环节着手。服务支持环节包括包含 5 个流程:事件管理、问题管理、变更管理、配置管理和软件发布管理,它们之间互为补充。 ITIL 的实施过程中,配置管理是核心。 配置管理 CMDB
  • 12. 传统的 IT 管理和 ITSM 比较
  • 13.  
  • 14.
  • 15.
  • 16. 服务目录介绍 质量 基础 数据 运营平 台中心 成本 4个产品线 31个子产品 效率
  • 17.
  • 18.
  • 19.
  • 20.
  • 22.
  • 23.
  • 24.
  • 26.
  • 27. 系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高级配置管理模块 接口
  • 28. 系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 配置核心支撑平台 (包括配置系统核心的数据库 (CMDB) 和管理模型、接口、管理工具 ( 定义及配置管理、用户管理、角色权限管理、日志管理、通用增删改、通用查询检索)
  • 29. 系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 基于场景的配置管理模块 (为了提高批量操作,简化配置管理的复杂性,而引入的基于场景的配置管理模块)
  • 30. 系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 高层配置管理模块 (以配置数据的管理为核心的高层增值管理模块,如综合管理试图)
  • 31. 系统结构 配置核心支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 Auto Discovery System (用于数据的自动发现、自动采集、自校验和诊断的系统)
  • 32. 系统结构 配置管理支撑平台 管理平台 接口 基于场景的配置管理模块 网管 OMSCA 变更系统 RTools … CMDB Auto Discovery System 高层配置管理模块 接口 周边配套系统 (主要不是用于配置管理的系统,但需要存取 CMDB 中的数据的系统)
  • 34.
  • 35.
  • 36.
  • 37.
  • 39. 监控层次 产品 业务 模块组 模块 业务功能 用例 用例操作 组件 (具体到IP) 基础资源 外部监控 业务内监控 基础监控
  • 40. 产品体系架构(三横两纵) 用户体验监控系统 用户体验定位系统 业务特性监控系统 外部 监控 业务逻辑监控系统 模块间调用监控系统 业务模块监控系统 业务内部 监控 基础环境监控 基础设备监控系统 基础网络监控系统 统一告警平台 告警关联模型库 统一告警渠道 智能分析平台
  • 41.
  • 42. 基础网管架构层次 Agent 数据接入层 数据 Cache 层 数据逻辑运算层 DB, 文件存储层 数据访问接口层 Web 展示层 采集的网络 , 主机数据 , 业务插件接入数据 最近访问数据内存缓冲 告警分析 , 数据分析 , 叠加运算等 主机性能数据 , 告警等历史数据 各种数据访问方法 , 访问协议适配方法 基于 iis 的 aps.net 和 apache cgi web 应用展示 网管公共组件库 (.so)
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 56.
  • 57.
  • 58.
  • 59.
  • 60.
  • 61.
  • 62.
  • 63.
  • 64.
  • 65.
  • 66.
  • 67.
  • 68. 单据类型 标 红色 是为目前未实现 被动 主动 事件 维护单 客服 自动监控 / 运维发现 突发事件 监控单 投诉单 服务请求 (管工事件) 有影响 无影响 管工 BU 处理 部门?
  • 69. 产品关联图 变更实施解决故障 事件管理 问题管理 变更管理 配置管理 服务台 变更请求 提供配置信息 配置变化通知 提供配置信息 提供配置信息 趋势分析 避免故障重复出现 监控告警 客服工单 投诉单
  • 70. 事件系统的价值和定位 SLA 确定及签署 事件的记录及处理 SLA 的阶段核算及监控 绩效及评价考核 SLA 优化及改进措施 年度系统建设及优化规划 系统建设及优化实施 SLA 偏离整改及行动方案 系统改进及优化 系统建设项目评估评价 图:可用性管理与项目建设的推进协作
  • 71. 解决方案及成果 解决方案 项目收益 事件记录 公司统一事件录入平台,记录跟踪事件处理直至最终解决 1. 将原来分散在工单系统、事件系统和 BU 内部的运维数据录入统一的事件管理平台中 2. 公司只建设一套系统,各部门不用投入重复开发 3. 将 ISD/IED 对事件管理的管理和规范推广到其他部门 管理支持 建立服务目录和级别管理模块 1. 在统一平台上展现管工 SLA 以及 BU 可用性统计等重要运营数据和报表,可以纵向对比运营质量 2. 支持管工、客服、 BU 针对数据分析,进行管理决策 3. 支持对运维人员的服务质量和运维质量考评 ITIL 其他系统建设 统一后续问题管理,知识库管理的建设,减少重复投入 1. 通过各相关系统提供的接口,预留变更管理、问题管理接口,并在统一平台上展现管工 SLA 以及 BU 可用性统计等重要运营数据和报表 2. 已支持与 ISD 问题管理系统接口,实现初步的问题管理升级模式
  • 72.
  • 74.
  • 75.
  • 76.
  • 77.
  • 78. ARS 发布推广情况 红色代表基本覆盖所有产品 蓝色代表部分产品覆盖 白色代表正在试用中 部门 对象业务 接口人 现状 ISD Qzone waynewang 1 、已经覆盖 ISD80 %的发布工作; 2 、剩余 20 %的 ISD 发布计划在 Q2 实现覆盖(主要是包的增量发布); QQ 秀 QQ 会员 QQ 相册 QQ 交友 QQ 音乐 Imagecache IED 寻仙 leoxiong 、 felixwang 1 、飞行岛发布稳定。 2 、 PET 1.0 正常进行了多次正式环境发布。 3 、 CF 进行了多次正式发布。 4 、其它多个产品处于试用中。 QQ 宠物 1.0 飞行岛 QQ 宠物 2.0 CF QQ 幻想 无线 手机 QQ amyli,yen,steveqiao,wingzhou 1 、手机 QQ 发布稳定。 2 、 VOIP 进行了多次正式发布。 3 、其它多个产品处于试用中。 无线音乐 无线平台服务 VOIP 创新中心 QQ 客服 jackye 1 、频道应用发布稳定。 网站部 频道应用 国际产品中心 美国 QQGame 广告部 QQlive 运营支持部 pay.qq.com hairyxie 发布数量稳定。 电子商务部   eagle 已完成部署,试用中 在线支付部 财富通 aaronzheng 完成了新环境的部署,试用中。
  • 79. ARS 发布数据 注明: 1 、图表中所示为发布次数,不是发布版本数,因为一个版本可能会发布多次; 2 、互动娱乐和无线产品部的发布次数中包含试用次数。
  • 80. ARS 版本计划 V3.2 Mar 2008 V3.2 Beta02 Apr 6,2008 V3.0 Dec 2007 V3.1 Jan 2008 ARS V3.2 主要进行 windows 移植开发、 Linux 整改、包发布、 task 完善。 V3.2 Beta03 Apr 22,2008 V3.3 Jul 2008 V3.2 Beta04 May 15,2008 V3.2 Beta05 May 23,2008 V3.2 Beta06 Jun 6,2008 V3.2 Beta07 Jun 17,2008 V3.2 Beta08 Jun 27,2008
  • 81. 公共运维平台的规划 安全管理 公共运维平台 发布管理 任务管理 TSH 监控管理 用户管理 权限管理 操作日志管理 发布自动化 发布平台化 发布审批 发布计划管理 版本管理 公共软件的发布管理 命令 / 脚本集中管理(编辑 / 查看 / 保存) 任务的权限管理 任务手工 / 定时自动调用 任务执行结果查看 进程状态监控; 版本状态查询; 自动 / 手工重启进程; 用户分权分组管理 操作进行分类管理 记录 / 查看用户在公共运维平台的所有操作
  • 82. 公共运维平台的拓扑图 Rnet Dnet IDC ARS 服务器 编译机池 生产机 生产机 办公网 测试机池 预发布机池 ARS 备份服务器 …… … … …
  • 83. 公共运维平台定位 IDC RNet 办公网 控制以及 审计对生 产环境的 访问 … … ……
  • 84.
  • 85.  

Hinweis der Redaktion

  1. 事件管理是一个很关键的流程,它为组织提供首先检测事件然后准确确定正确的支持资源以便尽快解决事件的能力。该流程还为管理层提供关于影响组织的事件的准确信息,以便他们能够确定必需的支持资源,并为支持资源的供给做好计划。 通过利用事件管理流程,组织能够确保他们的支持资源集中在最紧迫并且可能对业务产生最大影响的问题上。如果没有该流程提供的控制和管理信息,组织将无法确保他们在 IT 支持方面的投资(经常是很重大的投资)是否真正满足其目标。