Start
Entdecken
Suche senden
Hochladen
Einloggen
Registrieren
Check these out next
美团点评技术沙龙14美团云-Docker平台
美团点评技术团队
Docker一期培训
青帅 常
Full stack-development with node js
Xuefeng Zhang
WOT Cloud Computing Architect Summit
Docker, Inc.
淘宝网前台应用性能优化实践
丁 宇
Android开发基础
ykdsg
Wot2013云计算架构师峰会 -陈轶飞2
dotCloud
调试技术的应用
延胜 黄
1
von
68
Top clipped slide
如何选择 Docker 监控方案
4. May 2016
•
0 gefällt mir
0 gefällt mir
×
Sei der Erste, dem dies gefällt
Mehr anzeigen
•
408 Aufrufe
Aufrufe
×
Aufrufe insgesamt
0
Auf Slideshare
0
Aus Einbettungen
0
Anzahl der Einbettungen
0
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Melden
Technologie
刘斌 OneAPM
Leo Zhou
Folgen
Recomendados
Comment System of 56.com
Ho Kim
668 Aufrufe
•
39 Folien
OpenStack Resource Scheduling
Guangya Liu
1.2K Aufrufe
•
28 Folien
Jvm memory
benewu
1.6K Aufrufe
•
47 Folien
QCon - 一次 Clojure Web 编程实战
dennis zhuang
2.9K Aufrufe
•
39 Folien
SMACK Dev Experience
Chih-Hsuan Hsu
679 Aufrufe
•
45 Folien
Azure Container Service 使用 DC / OS 管理 docker 容器
Ch Rick
459 Aufrufe
•
59 Folien
Más contenido relacionado
Similar a 如何选择 Docker 监控方案
(20)
美团点评技术沙龙14美团云-Docker平台
美团点评技术团队
•
923 Aufrufe
Docker一期培训
青帅 常
•
504 Aufrufe
Full stack-development with node js
Xuefeng Zhang
•
4.3K Aufrufe
WOT Cloud Computing Architect Summit
Docker, Inc.
•
807 Aufrufe
淘宝网前台应用性能优化实践
丁 宇
•
1.9K Aufrufe
Android开发基础
ykdsg
•
3K Aufrufe
Wot2013云计算架构师峰会 -陈轶飞2
dotCloud
•
6.6K Aufrufe
调试技术的应用
延胜 黄
•
848 Aufrufe
3 introduction to kubernetes
Jiang Shang
•
2.2K Aufrufe
Databases on AWS
Chien Chung Shen
•
559 Aufrufe
docker intro
koji lin
•
1.9K Aufrufe
运维安全 抵抗黑客攻击_云络安全沙龙4月上海站主题分享
ChinaNetCloud
•
1.2K Aufrufe
Large-Scale Cluster Mangement & Kubernetes Under The Hood
Lei (Harry) Zhang
•
1K Aufrufe
Weic2015 docker
Ray Lin
•
405 Aufrufe
線上埋碼資料收集實作
FEG
•
36 Aufrufe
Windbg入门
晓锋 陈
•
1.4K Aufrufe
Win dbg入门
晓锋 陈
•
549 Aufrufe
云梯的多Namenode和跨机房之路
li luo
•
410 Aufrufe
Docker基礎
Perry Tsai
•
62 Aufrufe
Ceph intro
Yang Guanjun
•
141 Aufrufe
Más de Leo Zhou
(20)
第三名 3rd zhyict
Leo Zhou
•
228 Aufrufe
异常检测在苏宁的实践
Leo Zhou
•
1.3K Aufrufe
第二名 2nd 火眼金睛
Leo Zhou
•
107 Aufrufe
第四名 4th H3C AI Institute
Leo Zhou
•
218 Aufrufe
第一名 1st Bocoiops
Leo Zhou
•
173 Aufrufe
第六名 6th Aurora
Leo Zhou
•
123 Aufrufe
AI使能网络自动驾驶 AI Building Autonomous Driving Network
Leo Zhou
•
91 Aufrufe
2.2 go在阿里云cdn系统的应用
Leo Zhou
•
98 Aufrufe
1.6 米嘉 gobuildweb
Leo Zhou
•
59 Aufrufe
1.4 go在数据存储上面的应用—毛剑
Leo Zhou
•
395 Aufrufe
1.2 刘奇 go在分布式数据库中的应用
Leo Zhou
•
169 Aufrufe
Protocol libraries the right way
Leo Zhou
•
252 Aufrufe
美团数据库运维平台介绍
Leo Zhou
•
330 Aufrufe
特卖场景下的大数据平台和机器学习实践
Leo Zhou
•
392 Aufrufe
我的互联网运维理论与实践
Leo Zhou
•
741 Aufrufe
美团数据库运维平台介绍
Leo Zhou
•
516 Aufrufe
The net is dark and full of terrors - James Bennett
Leo Zhou
•
314 Aufrufe
Hypothesis randomised testing for django
Leo Zhou
•
313 Aufrufe
NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享
Leo Zhou
•
315 Aufrufe
动静态混合网站或 APP的CDN优化方法
Leo Zhou
•
392 Aufrufe
Último
(20)
加拿大:主教大学毕业证办理详细流程
hyptugu
•
3 Aufrufe
留信网,您可信赖的学历认证服务提供商添加q薇634068167订做加州大学洛杉矶分校毕业证成绩单#Diploma#留信入库#留才#雅思托福#offer#学...
AlifAle
•
0 Aufrufe
☀️【巴斯大学毕业证成绩单留学生首选】
25mjhd12
•
2 Aufrufe
①【玛格丽特女王大学毕业证文凭学位证书|工艺完美复刻】
love445ds
•
2 Aufrufe
留信网认证可查【路易斯安那理工大学文凭证书毕业证购买】
1lkjhg
•
2 Aufrufe
在哪里可以办美国大学文凭《麦纳特州立大学毕业证成绩单仿制》
efagvah
•
3 Aufrufe
【本科生、研究生】美国南达科他大学毕业证文凭购买指南
foxupud
•
3 Aufrufe
Expecto Patronum! Stable Diffusion!
William Chong
•
5 Aufrufe
①【拉筹伯大学毕业证文凭学位证书|工艺完美复刻】
vgh215w
•
2 Aufrufe
☀️【基尔大学毕业证成绩单留学生首选】
25mjhd12
•
2 Aufrufe
☀️【阿卡迪亚大学毕业证成绩单留学生首选】
15sad
•
2 Aufrufe
☀️【北英属哥伦比亚大学毕业证成绩单留学生首选】
bjd42as
•
2 Aufrufe
☀️【路易斯维尔大学毕业证成绩单留学生首选】
2125nuh
•
2 Aufrufe
☀️【北卡罗来纳大学教堂山分校毕业证成绩单留学生首选】
2125nuh
•
3 Aufrufe
《索尔福德大学毕业证|学位证书校内仿真版本》
w124dsa
•
2 Aufrufe
☀️【加州州立大学圣贝纳迪诺分校毕业证成绩单留学生首选】
25mjhd12
•
2 Aufrufe
①【温哥华岛大学毕业证文凭学位证书|工艺完美复刻】
love445ds
•
2 Aufrufe
☀️【密西西比州立大学毕业证成绩单留学生首选】
2125nuh
•
2 Aufrufe
☀️【爱丁堡龙比亚大学毕业证成绩单留学生首选】
15sad
•
2 Aufrufe
☀️【北卡罗来纳大学格林波若分校毕业证成绩单留学生首选】
25mjhd12
•
2 Aufrufe
如何选择 Docker 监控方案
如何选择Docker监控 刘斌 2016/4/24
自我介绍 Cloud Insight,蓝海讯通 https://cloud.oneapm.com/
Agenda • 什么是监控 • Docker监控原理 •
Docker监控方案
为什么监控 • 尽在掌握 • 炸药桶
监控目的 • 少宕机时间 • 扩展和性能管理 •
资源计划 • 识别异常事件 • 故障排除、分析
监控层次 • 硬件 • OS、中间件(MySQL、Tomcat) •
应用程序 • RUM
Docker监控的挑战 • Docker特点 • 像host但不是host •
量大 • 生命周期短 • 监控盲点(断层) • 微服务 • 集群 • 全方位 • Host(VM) > Services > Containers > Apps
Docker监控内容 • 配置信息 • Logs •
主机和Daemon日志 • 容器信息 • Metric(performance) • Event
内部监控 VS 外部监控 •
在容器内部监控 • 在宿主机上监控
Docker监控内容 • CPU • memory
usage • memory limit • network IO
Docker监控基础 • docker stats •
Remote API • 伪文件系统
docker stats $ docker
stats redis1 redis2 CONTAINER CPU % MEM USAGE/LIMIT MEM % NET I/O redis1 0.07% 796 KB/64 MB 1.21% 788 B/648 B redis2 0.07% 2.746 MB/64 MB 4.29% 1.266 KB/648 B
伪文件系统 • CPU、内存、磁盘 • 网络
Cgroups • CPU、内存、磁盘 • /sys/fs/cgroup/{memory,cpuacct,blkio}/ system.slice/${docker
ps --no-trunc}.scope • Standard: /sys/fs/cgroup/:cgroup/ docker/:container_id • Systemd: /sys/fs/cgroup/:cgroup/system.slice/ docker-#{id}.scope
Memory • memory.stat
Memory
CPU • cpuacct.stat • docker.cpu.system •
docker.cpu.user
Blkio • *_recursive • blkio.throttle.io_service_bytes •
blkio.throttle.io_serviced
网络数据 • 伪文件系统 • iptables •
网络设备接口
数据源(veth device) $ CONTAINER_PID=`docker
inspect -f '{{ .State.Pid }}' nginx` $ mkdir -p /var/run/netns $ ln -sf /proc/$CONTAINER_PID/ns/net /var/run/netns/$CONTAINER_ID $ ip netns exec $CONTAINER_ID netstat -i
Docker容器网络信息-文件系统 • $ CONTAINER_PID=`docker
inspect -f '{{ .State.Pid }}' nginx ` • $ cat /proc/$CONTAINER_PID/net/dev
Docker容器网络信息-文件系统 $ pwd /sys/class/net/veth559b656/statistics $ ls collisions
rx_crc_errors rx_frame_errors rx_packets tx_compressed tx_heartbeat_errors multicast rx_dropped rx_length_errors tx_aborted_errors tx_dropped tx_packets rx_bytes rx_errors rx_missed_errors tx_bytes tx_errors tx_window_errors rx_compressed rx_fifo_errors rx_over_errors tx_carrier_errors tx_fifo_errors
Docker容器网络接口数据的取得 方式
Docker容器网络接口数据的取得 方式
Docker容器网络接口数据的取得 方式
Docker监控方案 • 自己动手 • 源软件 •
SaaS
评价标准 • 功能 • 活性 •
运维
自己动手 • 活性强 • 成本高
自己动手打造监控方案 • 采集 • 存储 •
展示 • 报警(动作)
自己动手 • Docker remote
API • 200L • Reports the resource usage of Docker containers to InfluxDB (https://github.com/ mustafaakin/docker-resource-reporter)
性能指标采集 • tcollector • StatsD •
collectd • cAdvisor • … …
StatsD • Etsy/Flickr • UDP/TCP •
应用和协议
Tcollector • 来源于OpenTSDB • 数据采集框架
Collectd • Statistics collection
daemon • 存储到RRD • 插件机制(input/output) • 简单报警功能
cAdvisor(Container Advisor)
存储TSDB • OpenTSDB • Influxdb •
RRDTool • Graphite • … …
写入方式 • File、TCP/UDP • HTTP •
JMX/JDBC/SNMP • AWS/Docker/cAdvisor • 消息队列(Kafka、ActiveMQ等) • … …
数据展示 • Highcharts(Cloud Insight) •
D3(Datadog) • echarts • Google Charts • Charts.js • n3-charts
源可视化工具 • Graphite • Influxdb
+ Grafana • Prometheus
源方案 • cAdvisor(经典)+ InfluxDB
+ Grafana • Zabbix/Nagios/Hawkular • Fluentd • Prometheus • Riemann • ATSD(Axibase Time Series Database) • Hawkular • ELK
Zabbix • 最经典(SaaS软件的最大敌人) • 架构简单、清晰 •
文档丰富 • 包括采集、触发、告警 • agent支持用户自定义监控项 • 通过SNMP、ssh、telnet、IPMI、JMX监控
Zabbix Docker Monitoring •
https://github.com/monitoringartist/zabbix- docker-monitoring • Zabbix Template
Fluentd
Graphite • 存储数值型时序列数据 • 根据请求对数据进行可视化(画图)
Graphite
Prometheus • 一体化 • 多维度 •
活查询语言 • 仪表盘和告警 • LevelDB • 非分布式、单机自治 • 基于HTTP的pull模式(push需要中间网 )
Prometheus
Riemann • 事件处理 • Clojure实现 •
Protocol Buffer • 学习曲线?
Heapster • K8s子项目 • source
and sink • 经典组合:heapster + Influxdb + grafana • Sink:Kafka、stdout、gcm(Google Cloud Monitoring)、hawkular、monasca、riemann、 opentsdb
源软件的问题点 • 活性受限于upstream • 维护成本高 •
定制难度大 • 技术栈
SaaS • turnkey解决方案 • 维护成本
~ Zero • 适合中小企业
SaaS • New Relic •
AppDynamics • Dynatrace(Ruxit) • Datadog • SysDig • Cloud Insight • clusterup • Scout • Librato
Datadog • 国外最好 • 功能很强大 •
安装很简单 • 有点贵
Cloud Insight • 实时数据 •
历史数据(免费版最大保存15天) • 仪表盘 • 混合监控 • 报警功能
Cloud Insight Docker Overview
Cloud Insight Docker
Share
Cloud Insight Docker
Event Stream
Cloud Insight Docker
Alert
Cloud Insight Docker Intergrations
Sysdig • 免费工具 • SaaS服务
Sysdig Cloud • 拓扑可视化
Librato • 数据聚合平台 • 简单探针 •
图表和报警 • 价格不贵
axibase(ATSD) • 实际上是一个TSDB • 支持报警 •
预测功能
SaaS的挑战 • 安全性 • 成本(
移和使用成本) • 和自有系统的兼容 • 内部抵抗(观念、个人爱好)
趋势 • 拓扑可视化 • 标签机制 •
通过API打通 • 一体化
参考资料 • Comparing Seven
Monitoring Options for Docker:http://rancher.com/ comparing-monitoring-options-for-docker-deployments/ • How to collect Docker metrics:https://www.datadoghq.com/blog/how-to- collect-docker-metrics/ • 时序列数据库武斗大会:http://liubin.org/blog/2016/02/18/tsdb-intro/ • Fluentd Docker Metrics Input Plugin:https://github.com/kiyoto/fluent-plugin- docker-metrics • Docker Runtime metrics:https://docs.docker.com/v1.8/articles/runmetrics/
谢谢您的倾听