Grafana v6.7.4/v7.2.0 + node_exporter 1.0.1测试通过
2020.10.03更新,增加整体资源展示!支持 Grafana6&7,Node Exporter v0.16及以上的版本,优化重要指标展示。包含整体资源展示与资源明细图表:CPU 内存 磁盘 IO 网络等监控指标。
重要更新:
- 新增数据源变量
origin_prometheus
,取自于Prometheus的外部系统标签:external_labels
,可用于支持多个Prometheus接入VictoriaMetrics或Thanos等第三方存储使用remote_write
方式的场景。(默认取值.*
,指标中无该标签不影响使用)VictoriaMetrics
请使用v1.42.0及以上版本,修复了grafana表格展示的问题。
- 增加时间间隔变量
interval
,所有曲线图关联该变量,可根据需要选择时间间隔来调整曲线图的粒度。注意Prometheus的采集周期,如果rate
时间间隔内少于2个值,曲线图无法展示,当等于2个值时rate
即为irate
。(默认时间间隔设置为2分钟,如果你的Prometheus采集周期大于1分钟,曲线图会无法展示,把时间间隔选大一点即可。)
使用方法:
https://grafana.com/grafana/dashboards/8919
或者直接在grafana中使用导入功能,输入看板ID:8919 即可导入。
兼容性版本说明:
如果你导入看板之后报错:
Failed create dashboard model
Cannot read property 'Symbol(Symbol.iterator)' of undefined
说明你的grafana版本过低,不支持新增的BAR GAUGE图表,建议升级到grafana v6.7.x,或者重新导入不带BAR GAUGE的版本:https://grafana.com/grafana/dashboards/11174(20191102版本)
关注公众号【全栈运维开发】加入运维群交流,获取更多...
GitHub:https://github.com/starsliao/Prometheus
提问请在github上提交issue
截图
新增的资源总览页截图
资源明细页截图
注意事项:
导入看板后,请根据实际情况在看板右上角点击Dashboard settings
--Variables
设置好变量:
默认已经设置并关联好job
,hostname
,node
这3个变量。
$node
取值node_exporter的instance
,IP:端口
格式。大部分查询关联了这个变量,请确保该变量有效!$maxmount
用来查询当前主机的最大分区,默认只获取ext.*和xfs类型的分区。
【update】:
2020/10/03
- 资源总览表中增加了5分钟负载、TCP连接数、timewait数、主机总数,去除了分页。
- 修复了资源总览表中超链接到资源明细的问题。
- 替换所有
irate
为rate
,增加时间间隔变量,可自行控制曲线图粒度,详细请看上方重要更新说明。 - 增加数据源变量,用于支持多Prometheus,详细请看上方重要更新说明。
- 修改了资源总览图表的描述说明,鼠标移至表格左上角的
i
即可查看。
2020/05/30
- 增加了整体主机资源情况的表格明细,以及整体主机资源的统计曲线图。默认收缩,可按Job分组,可直接链接到指定主机明细。(参考截图)
- 取消了主机温度的图表,增加了每小时流量的图表。
- 修正了磁盘使用率的计算和
df
命令的算法保持一致。 - 优化了部分图表的计算时长取值,加快加载速度,调整了部分图表曲线展示效果与位置。
2019/11/2
- 调整了网络连接信息的展示指标与描述,使其更具实用性。
- 修改了
node_disk_io_time_seconds_total
指标的展示与描述。 - 每次I/O读写耗时的图表增加了参考值。
- 优化了部分曲线图的展示效果,固定了部分线条的颜色。
2019/10/30
- 取消了需要手动安装的饼图,把原来磁盘信息的饼图整合到了磁盘表格信息中。
- 增加了一个Bar Gauge来实时展示cpu内存等信息。
- 增加了打开上下文切换与打开文件数的曲线图。
- 把磁盘监控与cpu使用率的图分开。
- 对整个看板的大部分图表做了展示效果的调整与优化,加强实用性与兼容性。
- 修复了同时展示多个服务器部分图表报错的问题。
2019/7/1
- 增加了磁盘分区的使用率曲线图。
- 优化了数据展示效果。
- 使用Grafana 6.2.5 测试使用正常。
2019/5/20
- 增加了服务器列表多选支持,曲线图可以展示多台服务器的数据。
- 优化了变量的展示效果。
- 优化了部分监控指标的描述说明,点击各图表左上角的“i”即可查看。
2019/1/9
- 修复了一个展示内存使用量不准确的bug。
- 增加了更新node_exporter和仪表板的外链。
- Grafana v5.4.2 + node_exporter 0.16 、node_exporter 0.17 、node_exporter 0.18 测试使用正常。
11/16
- 增加了变量的说明。
- 优化了新安装看板后的展示速度。
11/15
- 增加各环境对服务器分组。
- 增加饼图,磁盘总空间。
- 增加当前打开文件描述符。
- 增加部分监控指标的描述。
- 优化部分指标的显示结果。
11/13
- 增加磁盘每秒的I/O操作耗费时间占比图形。
@tjs870620: 你好,请问下,资源总览那个table怎么才能一个ip只展示一条数据啊,我这边同一个ip地址的展示了很多数据