Start
Entdecken
Suche senden
Hochladen
Einloggen
Registrieren
Anzeige
Check these out next
baidu fuye
dachmx
Net iq sentinel log manager (work shop)
零壹科技股份有限公司
盛大游戏运维体系
Ken Liu
盛大游戏运维体系
Ken Liu
赛诺朗基全局事件管理
Mktg
1_overall
Galaxy Software Services
家庭健康网络平台需求分析
velvetdl
From Principle to Practice
Jordan Pan
1
von
32
Top clipped slide
Principle and Practice of Monitoring System
2. Feb 2023
•
0 gefällt mir
0 gefällt mir
×
Sei der Erste, dem dies gefällt
Mehr anzeigen
•
19 Aufrufe
Aufrufe
×
Aufrufe insgesamt
0
Auf Slideshare
0
Aus Einbettungen
0
Anzahl der Einbettungen
0
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Melden
Technologie
Principle and Practice of Monitoring System
kevin10241
Folgen
Anzeige
Anzeige
Anzeige
Recomendados
分会场四It 治理、风险管理和法规遵从的一种整体实现方案
ITband
583 Aufrufe
•
23 Folien
網路安全管理
Hsuan-Chih Wang
1.5K Aufrufe
•
30 Folien
做好开源软件安全管理 帮您移开IoT认证的挡路石
Onward Security
79 Aufrufe
•
37 Folien
腾讯大讲堂30 运维工具让你的开发运营更轻松
areyouok
966 Aufrufe
•
85 Folien
腾讯大讲堂30 运维工具让你的开发运营更轻松
Michael Zhang
1.5K Aufrufe
•
85 Folien
Management Control
zsx468
104 Aufrufe
•
34 Folien
Más contenido relacionado
Similar a Principle and Practice of Monitoring System
(20)
baidu fuye
dachmx
•
274 Aufrufe
Net iq sentinel log manager (work shop)
零壹科技股份有限公司
•
1.6K Aufrufe
盛大游戏运维体系
Ken Liu
•
1.7K Aufrufe
盛大游戏运维体系
Ken Liu
•
1.1K Aufrufe
赛诺朗基全局事件管理
Mktg
•
234 Aufrufe
1_overall
Galaxy Software Services
•
453 Aufrufe
家庭健康网络平台需求分析
velvetdl
•
852 Aufrufe
From Principle to Practice
Jordan Pan
•
322 Aufrufe
20210928 #118 - 給非營利組織的資安自保手冊
Net Tuesday Taiwan
•
3.3K Aufrufe
參展
Sonny Chen
•
203 Aufrufe
组网与网络管理技术(第四章)
telab
•
826 Aufrufe
厚生 公開說明會 實驗室傳染病自動通報-20150127-02
台灣醫學資訊學會
•
407 Aufrufe
腾讯大讲堂39 数据运营规划理念及方法概要介绍
PMCamp
•
686 Aufrufe
厚生 105年實驗室傳染病自動通報系統公開說明會
台灣醫學資訊學會
•
544 Aufrufe
需求分析(一)(第三章)
surfwave
•
927 Aufrufe
茂华集团财务集中管理项目实施工作汇报
xiangmt11
•
515 Aufrufe
Brochure ahn lab-soc
ahnlabchina
•
321 Aufrufe
Teched 2013 监和控
Cheng Zhang
•
291 Aufrufe
QM-034-軟體品質管理
handbook
•
1.9K Aufrufe
邁向品質卓越化的關鍵平台
Galaxy Software Services
•
346 Aufrufe
Último
(20)
IT如何協助提升供應鏈韌性_Openfind.pptx
openfind
•
359 Aufrufe
留信网认证可查【加州大学圣地亚哥分校文凭证书毕业证购买】
1lkjhg
•
2 Aufrufe
☀️【北卡罗来纳大学教堂山分校毕业证成绩单留学生首选】
2125nuh
•
3 Aufrufe
CMMC合規需求調查問卷.pptx
jacklee422407
•
3 Aufrufe
在哪里可以办英国大学文凭《伦敦大学伯贝克学院毕业证成绩单仿制》
efagvah
•
2 Aufrufe
留信网认证可查【切斯特大学文凭证书毕业证购买】
12da12
•
2 Aufrufe
留信网认证可查【路易斯安那理工大学文凭证书毕业证购买】
1lkjhg
•
2 Aufrufe
Configuration of Meter_Data_Management_Systems.pdf
Bhekumuzi Xaba
•
3 Aufrufe
☀️《佩斯毕业证仿真》
jjkjkijk
•
3 Aufrufe
☀️【阿卡迪亚大学毕业证成绩单留学生首选】
15sad
•
2 Aufrufe
留信网认证可查【内华达大学拉斯维加斯分校文凭证书毕业证购买】
32lkhng
•
2 Aufrufe
☀️【伦敦国王学院毕业证成绩单留学生首选】
25mjhd12
•
2 Aufrufe
留信网认证可查【加州州立大学圣贝纳迪诺分校文凭证书毕业证购买】
32lkhng
•
2 Aufrufe
《索尔福德大学毕业证|学位证书校内仿真版本》
w124dsa
•
2 Aufrufe
如何办理一份高仿谢菲尔德大学毕业证成绩单?
aazepp
•
4 Aufrufe
Leadpower Catalogue 2023.pdf
ssuser029943
•
15 Aufrufe
☀️【北卡罗来纳大学格林波若分校毕业证成绩单留学生首选】
25mjhd12
•
2 Aufrufe
歡迎參加合規審核准備評估 for cmmc.docx
jacklee422407
•
5 Aufrufe
在哪里可以办美国大学文凭《麦纳特州立大学毕业证成绩单仿制》
efagvah
•
3 Aufrufe
留信网,您可信赖的学历认证服务提供商添加q薇634068167订做加州大学洛杉矶分校毕业证成绩单#Diploma#留信入库#留才#雅思托福#offer#学...
AlifAle
•
2 Aufrufe
Anzeige
Principle and Practice of Monitoring System
凯文 监控系统原理与实践 Principle and Practice
of Monitoring System
目录/Content 01 什么是监控系统 02 为什么要监控系统 03 怎么做监控系统 04 常见的监控指标 05 日志监控 06 业务监控
01
基础概念 监控系统 是通过对信息持续采集、收敛、分析来发现问题,并对解决问题提供数据依赖的 一种科学技术。通过监控技术可以实现对故障进行 “事前预警,事后追踪”。 气象监控系统 Windows 任务管理 器 气象情况 系统情况 水质监控系统
监控 监控 监控 水质情况
02
监控系统的作用 对系统不间断实时监控 实时反馈系统当前状态 保证服务可靠性安全性 保证业务持续稳定运行
开发和运维对比 开发重建设,运维重维护,开发创造新产 品产生价值,运维维护老产品避免问题, 所以运维比开发容易不受重视,但产品维 护的时间要多于开发,就像“开始一段关 系很容易,但维持关系不容易”,所以运 维的重要性也不容忽视。 监控,是运维的眼睛,是稳定性建设中最 重要的一环。 如果没有监控,运维人员就相当于盲人摸 象,发现问题会变得很被动;监控也是整 个产品生命周期中重要的一环,如果没有 监控,产品中存在的问题就只能等用户反 馈(客诉),严重降低用户体验。 开发
运维
03
监控系统的五步流程 五大流程 数据采集 Data Collection 数据存储 Data Storage 告警通知 Alarm
Notification 数据计算 Data Calculation 数据展示 Data Display
数据采集 基础数据 应用数据 业务数据 原始数据 MySQL ElasticSearch ClickHouse 存储容器 采集 ● 释义说明:通过各种方式采集原始的相 关数据,常见的有agent、埋点等方式; ● 注意事项:主要为数据采集对业务服务 的性能损耗以及对业务的侵入性两点: ○
性能损耗:一般采样都是百分比采样 ,比如10%,如果100%采样,对业务服 务的性能损耗会比较大; ○ 侵入性:良好的监控系统,对业务来 说应该是无感知的,能快速接入又不影响 正常的业务迭代;
数据采集常见技术方案 数据采集有不少开源的第三方技术方案,可以根据自身需求选用。 当然也可以自己编程开发。 Flume Logstash Filebeat
数据存储 基础数据 应用数据 业务数据 原始数据 MySQL ElasticSearch ClickHouse 存储容器 采集 ● 释义说明:采集到的原始数据需要进行 存储,以便于进行后续的聚合计算; ● 注意事项:这里需要注意的点为存储时 间和成本控制两方面: ○
存储时间:大多场景只关注最近一周 或最近一个月,但有时候为了审计安全等 需要,部分数据需要存储的时间会比较长 ,甚至有1-2年,因此需要根据具体情况 来设定数据过期和清理时间; ○ 成本控制:有些场景对数据的实时性 要求比较高,因此需要存储到高速 SSD ,有些场景数据实时性没那么高,就可以 考虑更低成本的存储方式,甚至做数据归 档,然后离线计算的方式来进行后续的计 算;
数据计算 ● 释义说明:通过对采集到的原始数据进 行各种维度的计算,才能得到我们想要的 监控指标; ● 注意事项:数据计算这一环节,主要考 虑的点为计算速度和结果的准确性: ○
计算速度:上面提到了,某些场景对 于数据的实时性要求较高,因此在计算环 节就需要考虑到这点。在具体的技术方案 实现过程中,需要根据不同的业务需要来 采用不同的技术选型和实现; ○ 数据准确:比如上面提到的每分钟订 单量,以及履约率、错误率等指标,对准 确度要求是比较高的。再比如QPS这种指 标,如果实时计算,对服务压力比较大, 但如果取单位时间的均值,又会造成结果 的准确性降低,因此在实际实践过程中, 需要综合考量。 在线 新增 日活 留存 数据计算
数据展示 ● 释义说明:即通过界面动态可视化的方 式,将我们关注的监控指标进行展示。 ● 注意事项 ○
时延:时延这部分,上面已经阐述过 了,主要还是要考虑到具体的业务场景, 灵活采用技术方案; ○ 便捷:监控是个很复杂庞大的体系, 但对使用者来说,往往只关注和自己有关 的模块,因此便捷可定制化的展示,良好 的界面,是很需要下功夫去设计的。 Grafana Kibana 自研
告警通知 ● 释义说明:将已发生的或者即将发生的 错误异常及时通知给相关人员,快速处理 ,降低影响。 ● 注意事项 ○
时延:告警是需要及时的做到通知的 ,因此对实时性要求很高。 ○ 降噪:这涉及到告警的一个敏感度问 题,某些阈值怎么设置,通知到谁,怎么 通知,不同等级的告警采用什么方式通知 ,都有很多需要考量的方面。 邮件 即时通信 电话 短信
04
硬件监控 系统监控 常见的监控指标 磁盘使用率 CPU负载 内存使用率 物理磁盘 CPU温 度 虚拟磁盘 应用监控 进程 状态 MySQL、 Redis 等 指标 日志监控 运行日志 访问日志 错误日志 业务监控 活跃用户 新增用户 留存用户
05
日志监控 什么是日志监控 日志是设备或者程序对自身 状态和运作行为的记录,日 志监控平台是包括日志采集 ,存储,分析,索引查询, 告警以及各种流程管理的一 站式日志服务,日志监控是 监控体系中核心的建设,而 且可以说是量最大的一项监 控。 01 为什么要日志监控 如果没有日志监控,当系统 挂了,或者有 bug 的时候, 才会登录到系统查看日志。 有了日志监控不仅可以集中 化日志便于查看,更可以分 析统计日志提前暴露风险和 定位
bug。 02 怎么做日志监控 使用开源技术栈 ELK Stack 搭建。 03
怎么做日志监控 ELK Stack 不是一个产品,而是
elastic 公司的四个产品的合称。 简单地说,Filebeat 用过高效采集数据,Logstash 用于过滤转发数据,ElasticSearch 用于存储搜索数据, Kibana 用于展示查询数据。 采集+过滤 Filebeat + Logstash 存储+搜索 ElasticSearch 展示 Kibana
日志监控设计 ELK 系统架构图
日志监控实现 安装过程就不介绍了,这里主要说下几个重要的配置。代码链接
日志监控效果 日志监控系统展示图。网站链接
06
业务监控 什么是业务监控 业务监控, 主要侧重对业务 状态数据的实时监控, 收集 数据后对业务数据进行深入 的统计分析,
帮助业务方发 现和分析问题。 不同的产品有不同的业务指 标,一般需要根据具体的业 务需求来定制化。拿游戏来 说,常见的有日活、新增数 、留存率等指标。 01 为什么要业务监控 我们所做的一切最终还是保 证业务的运行,如果没有业 务监控,我们便无法得知业 务的情况。 有了业务监控,便可以提供 相应的业务指标供相关人员 分析决策,制定出更有利于 业务发展的方案。 02 怎么做业务监控 使用 filebeat 采集数据,go 实现数据聚合服务将数据 落地入库,go 实现数据分 析服务提供 API 接口将数 据展示在 Web 界面。 03
怎么做业务监控 Filebeat 采集数据 到 Redis go
进程将 Redis 数据 存储到 MySQL ClickHouse 引擎聚合 MySQL 数据 数据聚合服务 go 进程分析业务指标 提供 API 接口展示在 Web 界面 数据分析服务
业务监控设计 业务监控系统架构图
业务监控实现 数据聚合服务关键代码。代码链接
业务监控实现 数据分析服务关键代码。代码链接
业务监控实现 数据分析服务关键代码。代码链接
业务监控效果 数据分析系统展示图。网站链接
谢谢欣赏!
Hinweis der Redaktion
wiki.fsbm.cc kaiwen.kf Kevin10??fsbm
10.4.31.31:8095 admin 12??56
Anzeige