Node Exporter for Prometheus Dashboard CN v20201003


Grafana v6.7.4/v7.2.0 + node_exporter 1.0.1测试通过

2020.10.03更新,增加整体资源展示!支持 Grafana6&7,Node Exporter v0.16及以上的版本,优化重要指标展示。包含整体资源展示与资源明细图表:CPU 内存 磁盘 IO 网络等监控指标。


重要更新:

  • 新增数据源变量origin_prometheus,取自于Prometheus的外部系统标签:external_labels,可用于支持多个Prometheus接入VictoriaMetrics或Thanos等第三方存储使用remote_write方式的场景。(默认取值.*,指标中无该标签不影响使用)
    VictoriaMetrics请使用v1.42.0及以上版本,修复了grafana表格展示的问题。
  • 增加时间间隔变量interval,所有曲线图关联该变量,可根据需要选择时间间隔来调整曲线图的粒度。注意Prometheus的采集周期,如果rate时间间隔内少于2个值,曲线图无法展示,当等于2个值时rate即为irate。(默认时间间隔设置为2分钟,如果你的Prometheus采集周期大于1分钟,曲线图会无法展示,把时间间隔选大一点即可。)

使用方法:

https://grafana.com/grafana/dashboards/8919

或者直接在grafana中使用导入功能,输入看板ID:8919 即可导入。

 


 

兼容性版本说明:

如果你导入看板之后报错:

Failed create dashboard model
Cannot read property 'Symbol(Symbol.iterator)' of undefined

说明你的grafana版本过低,不支持新增的BAR GAUGE图表,建议升级到grafana v6.7.x,或者重新导入不带BAR GAUGE的版本:https://grafana.com/grafana/dashboards/11174(20191102版本)


 

关注公众号【全栈运维开发】加入运维群交流,获取更多...

GitHub:https://github.com/starsliao/Prometheus

提问请在github上提交issue


 

截图

新增的资源总览页截图


资源明细页截图
 

注意事项:

导入看板后,请根据实际情况在看板右上角点击Dashboard settings--Variables设置好变量:

默认已经设置并关联好jobhostnamenode这3个变量。

  • $node取值node_exporter的instanceIP:端口格式。大部分查询关联了这个变量,请确保该变量有效!
  • $maxmount用来查询当前主机的最大分区,默认只获取ext.*和xfs类型的分区。

 

【update】:

2020/10/03

  1. 资源总览表中增加了5分钟负载、TCP连接数、timewait数、主机总数,去除了分页。
  2. 修复了资源总览表中超链接到资源明细的问题。
  3. 替换所有iraterate,增加时间间隔变量,可自行控制曲线图粒度,详细请看上方重要更新说明。
  4. 增加数据源变量,用于支持多Prometheus,详细请看上方重要更新说明。
  5. 修改了资源总览图表的描述说明,鼠标移至表格左上角的i即可查看。

2020/05/30

  1. 增加了整体主机资源情况的表格明细,以及整体主机资源的统计曲线图。默认收缩,可按Job分组,可直接链接到指定主机明细。(参考截图)
  2. 取消了主机温度的图表,增加了每小时流量的图表。
  3. 修正了磁盘使用率的计算和df命令的算法保持一致。
  4. 优化了部分图表的计算时长取值,加快加载速度,调整了部分图表曲线展示效果与位置。
2019/11/2
  1. 调整了网络连接信息的展示指标与描述,使其更具实用性。
  2. 修改了node_disk_io_time_seconds_total指标的展示与描述。
  3. 每次I/O读写耗时的图表增加了参考值。
  4. 优化了部分曲线图的展示效果,固定了部分线条的颜色。
2019/10/30
  1. 取消了需要手动安装的饼图,把原来磁盘信息的饼图整合到了磁盘表格信息中。
  2. 增加了一个Bar Gauge来实时展示cpu内存等信息。
  3. 增加了打开上下文切换与打开文件数的曲线图。
  4. 把磁盘监控与cpu使用率的图分开。
  5. 对整个看板的大部分图表做了展示效果的调整与优化,加强实用性与兼容性。
  6. 修复了同时展示多个服务器部分图表报错的问题。
2019/7/1
  1. 增加了磁盘分区的使用率曲线图。
  2. 优化了数据展示效果。
  3. 使用Grafana 6.2.5 测试使用正常。
2019/5/20
  1. 增加了服务器列表多选支持,曲线图可以展示多台服务器的数据。
  2. 优化了变量的展示效果。
  3. 优化了部分监控指标的描述说明,点击各图表左上角的“i”即可查看。
2019/1/9
  1. 修复了一个展示内存使用量不准确的bug。
  2. 增加了更新node_exporter和仪表板的外链。
  3. Grafana v5.4.2 + node_exporter 0.16 、node_exporter 0.17 、node_exporter 0.18 测试使用正常。
11/16
  1. 增加了变量的说明。
  2. 优化了新安装看板后的展示速度。
11/15
  1. 增加各环境对服务器分组。
  2. 增加饼图,磁盘总空间。
  3. 增加当前打开文件描述符。
  4. 增加部分监控指标的描述。
  5. 优化部分指标的显示结果。
11/13
  1. 增加磁盘每秒的I/O操作耗费时间占比图形。
  • caohuan2000

    评论: 您好~我这个什么都装好了使用都正常~但是我的JOB里面没有ALL~看不到所有服务器的~只能一个一个的单独点开看~请问这个是哪里配置的问题~麻烦帮忙解决下~谢谢~

    2021-10-14 11:04:37          回复

  • mmaneshm

    评论: Dear Brother, How can I display the server which is currently down d

    2021-09-10 22:28:31          回复

  • mmaneshm

    评论: Dear Brother, How can I display the server which is currently down

    2021-09-10 22:23:20          回复

  • limaolin

    评论: 大佬请教配置邮件报警 ,这个插件怎么使用啊 alertmanager

    2021-07-16 10:16:37          回复

  • deanadam

    评论: 老哥哥,我发现现在alert不能报警,说是有模板字段,Template variables are not supported in alert queries

    2021-06-14 14:45:52          回复

  • deanadam

    评论: 老哥哥,我们也发现数据源显示不出来,以及整体的面板query不出数据

    2021-06-11 17:39:58          回复

  • deanadam

    评论: 老哥哥,我发现panel页面不支持配置alert,说是Template variables are not supported in alert queries,这个怎么弄啊

    2021-06-11 17:27:10          回复

  • 十年老运维

    评论: 老哥,怎么左上角切换数据源啊,我这边显示为none,不能切换其他普罗米修斯数据源啊

    2021-04-02 10:57:48          回复

  • Dominic

    评论: 您好,我这边只有每小时流量all 和每秒网络宽带使用all 无数据显示,这个应该看下哪里的问题鸭

    2021-03-10 17:21:40          回复

  • starsliao

    评论: 提问请在github上提交issue GitHub:https://github.com/starsliao/Prometheus

    2020-10-04 13:22:01          回复

  • 99973279@qq.com

    评论: 你好,没有数据是哪个地方配置不当?

    2020-09-21 00:25:07          回复

  • ytJoe

    @tjs870620: 你好,请问下,资源总览那个table怎么才能一个ip只展示一条数据啊,我这边同一个ip地址的展示了很多数据

    评论: 加计算,sum,count或者其他的,然后选择instant

    2020-08-31 15:56:56          回复

  • ytJoe

    评论: 我想问一下资源总览页面的链接,我想把instance的 ip:端口 转化成 ip,那么我的正则表达式该如何去写?

    2020-08-31 15:53:07          回复

  • 370569218

    评论: 已自己找到临时修复方法,编辑资源总浏 在右边的编辑菜单中找到Link 菜单,将Url里面的Unique identifier (uid) 部分替换成第二次导入模板时的Unique identifier (uid) 就可以修复这个问题。 还希望楼主修改导入时的取值从源头解决

    2020-07-20 10:11:41          回复

  • 370569218

    评论: 发现一个bug,请楼主修复下,当添加两个prometheus数据源,并导入两次模板分别关联两个prometheus数据源后,点击第二次导入模板的资源总浏中主机明细时会显示无数据,初步查看是跳到第一次导入的模板去了,第一次导入的模板之关联了第一个数据源,没有第二个数据源的主机所以显示没有数据

    2020-07-20 09:43:46          回复

  • 370569218

    评论: 发现一个bug,请楼主修复下,当添加两个prometheus数据源,并导入两次模板分别关联两个prometheus数据源后,点击第二次导入模板的主机明细时会显示无数据,初步查看时跳到第一次导入的模板去了,导致在第一个数据源来查询主机所以显示没有数据

    2020-07-20 09:41:15          回复

  • tjs870620

    评论: 你好,请问下,资源总览那个table怎么才能一个ip只展示一条数据啊,我这边同一个ip地址的展示了很多数据

    2020-06-23 18:19:37          回复

  • starsliao

    @lylelaii: 资源总浏,链接到明细中的Link,建议增加一个前缀配置。 比如我的环境,实际访问grafana的url 是: xxxx.com/grafana。默认情况点击链接是跳转到 xxx.com/d/9CWBz0bik/node_…… 此时会访问不到正确页面, 实际上我需要访问 xxx.com/grafana/d/9CWBz0bik/node_……才可以

    评论: 这个配置的是相对路径哦,因为每个人配置的二级目录名称可能会不一样,需要自己填上去。

    2020-06-16 12:31:11          回复

  • starsliao

    @youmu: 你好 想咨询下 windows exporter已添加到prometheus,但在grafana里面读取不到。

    评论: windows的可以使用这个 https://github.com/starsliao/Prometheus/tree/master/wmi_exporter

    2020-06-16 12:27:40          回复

  • starsliao

    @captainhuang: 请问这个不支持wmi_exporter吗?

    评论: windows的可以使用这个 https://github.com/starsliao/Prometheus/tree/master/wmi_exporter

    2020-06-16 12:24:16          回复

  • youmu

    评论: 你好 想咨询下 windows exporter已添加到prometheus,但在grafana里面读取不到。

    2020-06-15 17:31:41          回复

  • lylelaii

    评论: 资源总浏,链接到明细中的Link,建议增加一个前缀配置。 比如我的环境,实际访问grafana的url 是: xxxx.com/grafana。默认情况点击链接是跳转到 xxx.com/d/9CWBz0bik/node_…… 此时会访问不到正确页面, 实际上我需要访问 xxx.com/grafana/d/9CWBz0bik/node_……才可以

    2020-06-04 19:18:04          回复

  • captainhuang

    评论: 请问这个不支持wmi_exporter吗?

    2020-06-04 18:33:24          回复

  • captainhuang

    评论: 不管是导入json或是看板号,我这儿提示都是 Unique identifier (uid) The unique identifier (uid) of a dashboard can be used for uniquely identify a dashboard between multiple Grafana installs. The uid allows having consistent URL’s for accessing dashboards so changing the title of a dashboard will not break any bookmarked links to that dashboard。

    2020-06-04 17:46:23          回复

  • starsliao

    @sam: 我指定了job,但ip(自动关联的主机名)把一些不是改job的ip全部显示出来了

    评论: 应该是IP这个变量没关联到JOB,看板已经更新,可以使用新版本看下。

    2020-05-30 02:48:42          回复

  • sam

    评论: 我指定了job,但ip(自动关联的主机名)把一些不是改job的ip全部显示出来了

    2020-04-24 15:48:41          回复

  • BaldStrong

    评论: 数据获取不到

    2020-04-23 20:10:32          回复

  • starsliao

    评论: 在grafana导入看板中,输入ID:8919,就可以直接导入哦。https://grafana.com/grafana/dashboards/8919

    2020-04-23 11:26:56          回复