Docker重量级监控
# 190.Docker重量级监控
上一篇讲的是轻量级的监控工具,本文就来讲重量级的: CAdvisor + InfluxDB + Granfana,简称CIG
# docker stats
原生的Docker命令中,stats可以查看每个容器占用的CPU,内存,网络流量等情况:
CONTAINER ID NAME CPU % MEM USAGE / LIMIT MEM % NET I/O BLOCK I/O PIDS
f9480daf14c6 mynginx 0.00% 1.445MiB / 3.701GiB 0.04% 2.55kB / 2.43kB 0B / 15.9kB 2
b31770c6aef2 wonderful 0.00% 2.164MiB / 3.701GiB 0.06% 830B / 0B 9.97MB / 0B 2
740c27663f2c portainer 0.00% 13.36MiB / 3.701GiB 0.35% 687kB / 16.6MB 0B / 5.76MB 7
2
3
4
stats统计结果只能是当前宿主机的全部容器,数据是实时的,不会存储、也没有健康指标过线预警等功能
# CIG是什么
每个技术的作用:
- CAdvisor:监控收集
- InfluxDB:存储数据
- Granfana:展示图表
示意图:
CAdvisor是一个容器资源监控工具,包括容器的内存,CPU,网络IO,磁盘IO等监控,同时提供了一个WEB页面用于查看容器的实时运行状态。CAdvisor默认存储2分钟的数据,而且只是针对单物理机。
不过,CAdvisor提供了很多数据集成接口,支持InfluxDB,Redis,Kafka,Elasticsearch等集成,可以加上对应配置将监控数据发往这些数据库存储起来。
CAdvisor功能主要有两点:
- 展示Host和容器两个层次的监控数据。
- 展示历史变化数据。
InfluxDB
InfluxDB是用Go语言编写的一个开源分布式时序、事件和指标数据库,无需外部依赖。
CAdvisor默认只在本机保存最近2分钟的数据,为了持久化存储数据和统一收集展示监控数据,需要将数据存储到InfluxDB中。InfluxDB是一个时序数据库,专门用于存储时序相关数据,很适合存储CAdvisor的数据。而且,CAdvisor本身已经提供了InfluxDB的集成方法,启动容器时指定配置即可。
InfluxDB主要功能:
- 基于时间序列,支持与时间有关的相关函数(如最大、最小、求和等);
- 可度量性:你可以实时对大量数据进行计算;
- 基于事件:它支持任意的事件数据
Granfana
Grafana是一个开源的数据监控分析可视化平台,支持多种数据源配置(InfluxDB,MySQL,Elasticsearch,OpenTSDB,Graphite等)和丰富的插件及模板功能,支持图表权限控制和报警。
Grafan主要特性:
- 灵活丰富的图形化选项
- 可以混合多种风格
- 支持白天和夜间模式
- 多个数据源
# 使用compose一键搭建监控平台
我们使用compose,一键启动cadvisor,influxdb以及grafana。当然也可以逐个启动,不过既然我们学了compose,就用起来。
编写/mydocker/cig/docker-compose.yml
version: '3.1'
volumes:
grafana_data: {}
services:
influxdb:
image: tutum/influxdb:0.9
restart: always
environment:
- PRE_CREATE_DB=cadvisor
ports:
- "8083:8083"
- "8086:8086"
volumes:
- ./data/influxdb:/data
cadvisor:
image: google/cadvisor
links:
- influxdb:influxsrv
command: -storage_driver=influxdb -storage_driver_db=cadvisor -storage_driver_host=influxsrv:8086
restart: always
ports:
- "8080:8080"
volumes:
- /:/rootfs:ro
- /var/run:/var/run:rw
- /sys:/sys:ro
- /var/lib/docker/:/var/lib/docker:ro
grafana:
user: "104"
image: grafana/grafana
restart: always
links:
- influxdb:influxsrv
ports:
- "3000:3000"
volumes:
- grafana_data:/var/lib/grafana
environment:
- HTTP_USER=admin
- HTTP_PASS=admin
- INFLUXDB_HOST=influxsrv
- INFLUXDB_PORT=8086
- INFLUXDB_NAME=cadvisor
- INFLUXDB_USER=root
- INFLUXDB_PASS=root
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
说明:
- 第11行
PRE_CREATE_DB=cadvisor
,预先创建一个数据库,用来存储数据。有点类似我们之前微服务实战中创建的数据库db2021 - 第20行:
links
,配置的是influxdb
,相当于CAdvisor集成influxdb
- 第22行:配置
CAdvisor
使用的驱动(类似JDBC驱动类型)
然后检查下配置文件有没错:
docker compose config -q
然后启动(注意要用到8080端口,因此如果有Tomcat监听了该端口,得先关闭):
docker compose up -d
启动完记得用ps检查下
# 测试
然后我们访问并测试:
- 浏览cAdvisor收集服务,http://ip:8080/
- 浏览influxdb存储服务,http://ip:8083/
- 浏览grafana展现服务,http://ip:3080/
cAdvisor第一次访问慢,要等一下;cadvisor也有基础的图形展现功能,这里主要用它来作数据采集
influxdb:可以做一些查询工作,例如展现数据库:
8083是web端口,后台监听的是8086端口
选中query templates,在输入框回车,即可看到查询结果,有我们之前定义的cadvisor
访问grafana,默认帐户密码为 admin/admin,首次登录后需要改密
登录后,我们给grafana 配置数据源:
grafana支持很多数据库,这里我们选择InfluxDB
然后我们配置名字和网址
数据库名以及用户密码,然后测试,成功的话会出现“Data Source is working”:
接下来我们配置新的面板:
然后选择面板的形状(例如柱状图,圆饼图等,这里我们选择经典的graph)
然后下方有详细的配置,这里我们随便配置下名字和描述,然后保存:
然后图形化界面就好了,但是没有数据:
没有数据是因为还没配置要监控什么内容。我们选择编辑:
在下方可以添加监控指标,例如监控CPU,监控内存等;
这里我们写一个监控CPU的:指标选择CPU使用情况,然后根据容器名字来查询,容器名字为cig-cadvisor-1,然后下面可以起个别名:
配置完后在右上方选择保存,并回退到刚刚的面板,可以看到有数据了:
该图形化界面功能还是很多的,多点点就会了,或者看官网文档来配置。
(完)