今天收到icinga發出的警告如下(這監控系統不是我架的,小弟只是莫名其妙被抓來代管的人...)
***** Icinga *****
Notification Type: PROBLEM
Service: Memory and Swap
Host: XXXX
Address: XXXX
State: WARNING
Date/Time: Wed Feb 17 09:58:54 CST 2016
Additional Info:
WARNING: Memory Usage - 36.71% RAM, 21.23% Swap
就去追查了icinga到底使用了什麼方法來監控遠端的主機資源資料
首先找到/etc/icinga/conf.d 設定了XXXX主機的名稱,並且找到使用監控的指令如下
define command {
command_name nrpe_check_mem
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c 'check_mem!$ARG1$!$ARG2$!$ARG3$!$ARG4$' -t 30
}
使用的是check_nrpe並呼叫主機XXXX本地的指令check_mem
check_nrpe 是 icinga主機用來作遠端執行的命令
可參考 http://docs.icinga.org/latest/en/nrpe.html
check_mem 則是用來檢查記憶體的放在被監控的主機上
可參考 http://xmodulo.com/monitor-server-memory-usage-nagios-remote-plugin-executor.html
接著跑到/usr/lib64/nagios/plugins查看ckeck_mem的內容
發現check_mem是使用free -mt的資訊來作評估的
警告內容
36.71% RAM = buffer used * 100 / mem total
21.23% Swap = swap used *100 / swap total
參考 http://jashliao.pixnet.net/blog/post/163147709-%E6%AF%8F%E5%A4%A9%E4%B8%80%E5%80%8Blinux%E6%8C%87%E4%BB%A4--free%E6%8C%87%E4%BB%A4(%E9%A1%AF%E7%A4%BAlinux%E7%B3%BB%E7%B5%B1%E4%B8%AD%E5%B7%B2
其實從一開始的警告訊息就告知 memory不夠了swap比例偏高,
但就是想去看看這東西怎跑出來的
接下來該想辦法加記憶體了...