运维开发网

Zabbix“专家坐诊”第82期问答汇总

运维开发网 https://www.qedev.com 2020-10-29 12:27 出处:51CTO 作者:Zabbix_Z大叔
zabbix获取数据是轮询的。有时候数据会出现采集超时的情况,时间上并不是很好控制。建议是从zabbix自身、数据库等方面进行优化,减小采集item的耗时,这样数据获取的时间基本都不会有大的差距。

Q:我所有的监控项都是通过自动发现获取的item和值,这个数据获取的时间是怎么控制的,现在感觉都是无序的,我想控制在每个整点的10分左右更新数据。

Zabbix“专家坐诊”第82期问答汇总

A:zabbix获取数据是轮询的。有时候数据会出现采集超时的情况,时间上并不是很好控制。建议是从zabbix自身、数据库等方面进行优化,减小采集item的耗时,这样数据获取的时间基本都不会有大的差距。

Q:那应该要怎么优化的能提供下思路吗,不知道改怎么优化

A:zabbix自身的优化,可以从自身的进程方面,比如poller过于繁忙,那么适当加大进程;数据库则是做表分区、存储过程;在硬件这块可以上ssd等。 在网上有很多zabbix优化的资料,你可以查下看看。

Q:好的,这个LLD获取数据的时间,是根据主机启动的时间开始获取的吗?

A:从启用监控的那个时间开始去获取数据。

Q:请问下,如果部署时候软件版本是5.0;新版本5.0.5;也升级到5.0.5、但是已有的Template还是5.0的,针对5.0 - 5.0.5中间这些版本新增修复的Template如何进行升级呢?有办法进行Template的更新吗?

A:部署一台5.0.5的,然后对比下template,有差别对比后再决定是否要导入更新上。 如果目前监控是满足需求的,也可以不做模板的升级。

Q:最近监控trap告警,有几个疑惑请帮忙:

在trap中,示 SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.114,而不是HUAWEI-SERVER-IBMC-MIB::hwRAIDRebuildDeassert, 把HUAWEI-SERVER-iBMC-MIB.mib文件放到mibdir目录了,如下图:

Zabbix“专家坐诊”第82期问答汇总

A:你最后要达到的目的是什么呢?

Q:看网上别人配置后显示是这样的,比数字好理解:

Zabbix“专家坐诊”第82期问答汇总

看着数字不明白是什么意思,还需要对照文档才能理解每个参数

A:能发下你这边的配置步骤/参考网址看下不?Q:参考网址:file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.pnghttps://www.cnblogs.com/lwops/p/10148392.html
br/>Q:参考网址:file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.pnghttps://www.cnblogs.com/lwops/p/10148392.html
export MIBS=ALL

Q:请教一个问题,zabbix保存到数据库的数据有哪些呢?我想取一些主机的性能数据,cpu 内存这些

A: zabbix保存历史数据的表是history、history_log、history_str、history_text、history_uint,一般像cpu内存这些浮点/整数的数据,可以看下history跟history_uint

Q:我用api获取类似没分钟的cpu负载,取平均值作为每小时的cpu平均负载,这个做法可行么?

A:可以的

Q:OK

Q:请问下,自动发现做了过滤器,怎么还会有这些提示。![](https://s4.51cto.com/images/blog/202010/29/0979d85b697e2409f4ce98fbec20da7e.jpg)

A:上图看下预处理是怎么做的?

Q:不匹配0的才做自动发现。discovery[{#ENTPHYSICALNAME},file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png1.3.6.1.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png2.1.47.1.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png1.1.1.7,{#HWENTITYOPTICALTYPE},file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png1.3.6.1.4.1.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png011.5.25.31.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png1.1.3.1.10]
br/>![](https://s4.51cto.com/images/blog/202010/29/0979d85b697e2409f4ce98fbec20da7e.jpg)

A:上图看下预处理是怎么做的?

Q:不匹配0的才做自动发现。discovery[{#ENTPHYSICALNAME},file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png1.3.6.1.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png2.1.47.1.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png1.1.1.7,{#HWENTITYOPTICALTYPE},file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png1.3.6.1.4.1.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png011.5.25.31.file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png1.1.3.1.10]
Zabbix“专家坐诊”第82期问答汇总

Q:还有一个问题,一条trap告警信息有重复发送的情况,也就是隔一段时间又发送一次,为避免这总情况,我创建了一个fallback,给每种trap错误创建了一个触发器, {Huawei_PCServer_2288Hv5:snmptrap.fallback.str(SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.113)}=1 跟 {Huawei_PCServer_2288Hv5:snmptrap.fallback.str(SNMPv2-SMI::enterprises.2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.1)}=1同时存在的情况下,后一个被触发,前一个永远无法触发。

我想问一下,trap告警这样处理合适吗? 表达式如何写才能避免这种情况A:2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.113是 RAID rebuild detected,2file:///C:\Users\admin\AppData\Roaming\Tencent\QQTempSys\%[email protected]$ACOF(TYDYECOKVDYB.png011.2.235.1.1.500.10.13.1是Storage device presence detected。

我刚模拟了下,你这边做依赖是可以实现的。个人是觉得根据不同trap OID 分多个成监控项会比较方便。

Q:谢谢,我试试依赖,分多个监控项也有同样的问题,就是1 和113会先匹配1

Q:大神也帮我看看呀,为什么显示问题呢?

Zabbix“专家坐诊”第82期问答汇总

A:你这里监控项返回的值不等于0,就触发了告警了

扫码领视频副本.gif

0

精彩评论

暂无评论...
验证码 换一张
取 消

关注公众号