“nginx统一监控”意思是在一台Linux服务器上集中监控所有nginx站点的status状态。我们把这个服务器叫做“nginx监控服务器”,可以是装有zabbix agent的zabbix server,或是其他装agent的被监控客户端。

    思路:把所有nginx站点的URL写入到“nginx监控服务器”上的一个配置文件中。增加或删除nginx监控站点只需要修改这个配置文件,利用zabbix的low-level discovery动态监控这些站点。“nginx监控服务器”的zabbix-agent调用nginx监控脚本,获取nginx_status后,利用zabbix-sender把监控数据发送到zabbix服务器端。

配置步骤如下:

一、在被监控nginx站点上配置stub_status模块

    开启stub_status模块监控,在server块中加入location就行了。

    假设“nginx监控服务器”的IP地址为192.168.0.1,配置如下:

1
2
3
4
5
6
7
8
     location  /nginx_status {
         stub_status on;
         access_log off;
         allow 127.0.0.1;
         # 要允许“nginx监控服务器”访问nginx status
         allow 192.168.0.1;
         deny all;
     }

    重启nginx,然后请求http://domain/nginx_status 就行了,下面是结果:

1
2
3
4
Active connections: 1 
server accepts handled requests
  16672 16672 16769 
Reading: 0 Writing: 1 Waiting: 0

二、在nginx监控服务器上配置监控脚本

    首先,在nginx监控服务器上安装好zabbix-agent和zabbix-sender,推荐yum安装。

    注意:设置zabbix_agentd.conf里Timeout=30。减少因脚本执行超时,agent获取不到数据的情况。

    然后,建立脚本文件的目录/etc/zabbix/monitor_scripts。

1
shell # mkdir -p /etc/zabbix/monitor_scripts

    把监控脚本nginx_monitor.sh放到/etc/zabbix/monitor_scripts目录下。

    nginx_monitor.sh脚本内容如下,需要修改AGENT_CONF变量的值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
#!/bin/bash
#
# Filename:    nginx_monitor.sh
# Revision:    1.0
# Date:        2014/09/24
# Author:      Qicheng
# Email:
# Website:     http://qicheng0211.blog.51cto.com
# Description: nginx统一监控脚本
# Notes:       
#
 
# 修改AGENT_CONF的值为本地zabbix agent的配置文件路径
AGENT_CONF= "/etc/zabbix/zabbix_agentd.conf "
# nginx站点的配置文件路径
NGINX_SITE_CONF= "/etc/zabbix/monitor_scripts/nginx_site.conf"
# zabbix_sender的路径
ZBX_SENDER= "/usr/bin/zabbix_sender"
 
FUNCTION=$1
HOST_NAME=$2
NGINX_SITE=$3
CURL= "/usr/bin/curl"
TIMEOUT=30
 
# nginx site low-level discovery
function  nginxSiteDiscovery()
{
     nginx_site=($( grep  '^[^#]'  ${NGINX_SITE_CONF}))
     max_index=$[${ #nginx_site[@]}-1]
     printf  '{\n'
     printf  '\t"data":['
     for  key  in  ` seq  -s ' '  0 $max_index`
     do
         printf  '\n\t\t{'
         printf  "\"{#NGINX_SITE}\":\"${nginx_site[${key}]}\"}"
         if  [ $key - ne  $max_index ]; then
             printf  ","
         fi
     done
     printf  '\n\t]\n'
     printf  '}\n'
}
 
# 获取nginx status,把数据发送到zabbix server
function  getNginxStatus()
{
     nginx_status_url= "${NGINX_SITE}/nginx_status"
     # 获取nginx_status后,保存到下面的文件里
     nginx_status_file= "/tmp/nginx_status_$(echo ${NGINX_SITE} | sed 's#^http.*://##; s#/#_#g').log"
     :> "$nginx_status_file"
 
     # curl获取nginx_status
     ${CURL} -s --connect-timeout ${TIMEOUT}  "$nginx_status_url"  2>&1 |  tee  "$nginx_status_file"
     line_num=$( cat  "$nginx_status_file"  wc  -l)
     # 判断是否正确获取nginx_status
     [ $line_num - ne  4 ] && {  echo  "ERROR: $nginx_status_file is not correct." exit  1;}
 
     active=$( cat  "$nginx_status_file"  grep  'Active'  awk  '{print $NF}' )
     reading=$( cat  "$nginx_status_file"  grep  'Reading'  awk  '{print $2}' )
     writing=$( cat  "$nginx_status_file"  grep  'Writing'  awk  '{print $4}' )
     waiting=$( cat  "$nginx_status_file"  grep  'Waiting'  awk  '{print $6}' )
     accepts=$( cat  "$nginx_status_file"  awk  NR==3 |  awk  '{print $1}' )
     handled=$( cat  "$nginx_status_file"  awk  NR==3 |  awk  '{print $2}' )
     requests=$( cat  "$nginx_status_file"  awk  NR==3 |  awk  '{print $3}' )
     echo  "Sending the data to zabbix server..."
     # 将特定格式的数据发送到zabbix server,每行的格式为:<hostname> <key> <value>
     cat  << EOF | ${ZBX_SENDER} -c ${AGENT_CONF} -i -
"${HOST_NAME}"  "nginx_status[$NGINX_SITE,active]"  "${active}"
"${HOST_NAME}"  "nginx_status[$NGINX_SITE,reading]"  "${reading}"
"${HOST_NAME}"  "nginx_status[$NGINX_SITE,writing]"  "${writing}"
"${HOST_NAME}"  "nginx_status[$NGINX_SITE,waiting]"  "${waiting}"
"${HOST_NAME}"  "nginx_status[$NGINX_SITE,accepts]"  "${accepts}"
"${HOST_NAME}"  "nginx_status[$NGINX_SITE,handled]"  "${handled}"
"${HOST_NAME}"  "nginx_status[$NGINX_SITE,requests]"  "${requests}"
EOF
}
 
[ $ # -eq 0 ] && { echo "ERROR: The script needs at least one parameter."; exit 1;}
 
case  $FUNCTION  in
     nginxSiteDiscovery|getNginxStatus)
         $FUNCTION
         ;;
     *)
         echo  "ERROR: Bad parameters."
         exit  1
         ;;
esac

    创建nginx站点配置文件nginx_site.conf:

1
2
shell # touch /etc/zabbix/monitor_scripts/nginx_site.conf
shell # chown -R zabbix:zabbix /etc/zabbix/monitor_scripts

    把所有被监控nginx站点的URL写入到nginx_site.conf文件中,每一行一个URL,如下图:

wKiom1QiRf2RCGflAACIA9vwXvo605.jpg

    在zabbix_agentd.conf最后面添加自定义参数:

1
2
UserParameter=nginxSiteDiscovery, bash  /etc/zabbix/monitor_scripts/nginx_monitor .sh nginxSiteDiscovery
UserParameter=getNginxStatus[*], bash  /etc/zabbix/monitor_scripts/nginx_monitor .sh getNginxStatus  "$1"  "$2"

    最后重启zabbix agent。

    在zabbix server端执行zabbix_get命令测试:

wKioL1QiTd6TTqiMAAMEdIpr0fA635.jpg

    如上图所示,说明环境部署好了。

三、zabbix WEB端

    1、导入模板

    导入"Template App Nginx.xml"模板,附件有下载。

wKioL1QiVXHx-YAdAAGcPqGMVhA261.jpg

    模板的Item prototypes如下:wKiom1QiXPPijFunAAQ_V-haHlU404.jpg

    “get nginx status of {#NGINX_SITE}”监控项是Zabbix agent类型,用于调用脚本获取nginx_status。其他item是Zabbix trapper类型,用于接收zabbix-sender发来的nginx_status。

    模板配置了触发器,如果获取不到nginx_status则发出告警。

    2、创建nginx监控主机并链接模板

    “nginx监控主机”的配置中要填写Agent interfaces,并链接模板Template App Nginx。

wKioL1QiVdrSUqcTAAJOp49C1RI625.jpg

    3、数据展示

wKioL1QiV5HQQZ06AAewCq9WxeA362.jpg

wKioL1QiYXezJTIsAAanVXgwlIg508.jpg