zabbix 按CPU核数监控负载状态

使用zabbix自带的key来实现多核CPU监控

system.cpu.discovery

自动发现CPU核数:

定义宏

按核数监控CPU负载

$2:指key中的第二个参数,这里是idle(CPU空闲比例)

    us(user):非nice用户进程占用CPU的比率

    sy(system):内核、内核进程占用CPU的比率;

    ni(nice):如果一些用户进程修改过优先级,这里显示这些进程占用CPU时间的比率;

    id(idle):CPU空闲比率,如果系统缓慢而这个值很高,说明系统慢的原因不是CPU负载高;

    wa(iowait):CPU等待执行I/O操作的时间比率,该指标可以用来排查磁盘I/O的问题,通常结合wa和id判断

    hi(irq):CPU处理硬件终端所占时间的比率;

    si(softirq):CPU处理软件终端所占时间的比率;

    st(stealstealon):流逝的时间,虚拟机中的其他任务所占CPU时间的比率;

  用户进程占比高,wa低,说明系统缓慢的原因在于进程占用大量CPU,通常还会伴有教低的id,说明CPU空转时间很少;

  wa低,id高,可以排除CPU资源瓶颈的可能。  

  wa高,说明I/O占用了大量的CPU时间,需要检查交换空间的使用,交换空间位于磁盘上,性能远低于内存,当内存耗尽开始使用交换空间时,将会给性能带来严重影响,所以对于性能要求较高的服务器,一般建议关闭交换空间。另一方面,如果内存充足,但wa很高,说明需要检查哪个进程占用了大量的I/O资源。

    tps: 每秒I/O传输请求量;

    kB_read/s:每秒读取多少KB;

    kB_wrtn/s:每秒写多少KB;

    kB_read:一共读了多少KB;

    kB_wrtn:一共写了多少KB。

标签:监控Zabbix 发布于:2019-10-31 20:30:22