监控宝服务器与服务性能监控配置

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 之前公司有使用过监控宝来进行网络和服务器,及服务器性能监控,在此记录一下各监控配置方式目录一、目的 21.1 监控目的 21.2 本文目的 2二、理论基础 22.1 相关理论 22.

之前公司有使用过监控宝来进行网络和服务器,及服务器性能监控,在此记录一下各监控配置方式

目录

一、目的 2

1.1 监控目的 2

1.2 本文目的 2

二、理论基础 2

2.1 相关理论 2

2.2 拓扑架构 2

三、监控部署 3

3.1 监控宝服务器性能监控 3

3.1.1 Windows服务器性能监控 3

3.1.2 Linux服务器性能监控 11

3.2 监控宝服务性能监控 14

3.2.1 Nginx服务性能监控 14

3.2.2 Apache服务性能监控 17

3.2.3 Mysql服务性能监控 21

四、检测排错 26

4.1 Mysql监控需要安装插件 26

4.2 WEB应用 26

4.3 检测SNMP数据 26

五、附录 28


一、目的

1.1 监控目的

监控宝的目的为帮助客户监控服务器及各服务性能,及时了解服务器与正在运行业务的服务的实时状态,当异常情况发生的时候,监控宝会主动告警,并通过各种方式(包括EmailMSN、短信、电话等)第一时间通知客户,及时采取运维补救错误,以及更加及时有效的了解网站是否运转正常,通过遍布全球的300多个分布式监测节点,对网络进行稳定性和可用性实时分析,支持httphttps)、ftppingudptcpsmtptraceroute等多种协议,全网全地域性能趋势分析来自不同地域的请求响应时间,并监控服务器的性能变化趋势,了解服务性能瓶颈,优化业务服务。

1.2 本文目的

快速部署服务器与服务性能监控,方便操作与管理相关监控项目。

二、理论基础

2.1 相关理论

在被监控服务器之上运行基于Python环境开发的内网采集器,内网采集器调用SNMP来获取被监控服务器的数据,在通过采集器主动发送给监控宝数据中心服务器,进行分析绘图,最终以WEB页面呈现给客户。

  • 服务器性能监控
    利用采集器通过SNMP来获取本机对应信息,不同监控项目使用的采集器不同,如服务器性能监控,抓取的为主机OS内部信息,如CPU,内存,负载等。

  • 服务性能监控
    服务性能监控,可根据需求定制采集器,服务器性能采集器抓取的为运行在服务器之上的应用程序的信息,如WEB服务器的状态页,可突破内外限制,将采集到的数据发送至监控宝服务器之上,监控端分析数据,进行绘图,最终以WEB界面呈现在用户面前。

2.2 拓扑架构

图片.png

监控宝拓扑架构图


三、监控部署

3.1 监控宝服务器性能监控

3.1.1 Windows服务器性能监控

1) 采集器创建

内网服务器的服务器性能监控采集器可以下载WindowsLinux两个版本,对不同系统实施监控。

图片.png

图片.png

图片.png

图片.png


下载相应的采集器上传到被检查服务器内。

2) Python环境部署

采集器需要Python环境运行,下面介绍Python的安装。

关于版本建议使用2.6或者2.7

若使用python2.4时,需要装hashlibctypessimplejson内库

http://pypi.python.org/pypi/hashlib

http://pypi.python.org/pypi/ctypes

http://pypi.python.org/packages/source/s/simplejson/simplejson-1.1.tar.gz

实例安装Python —–Windows 2003

a. 下载系统对应的Python版本

http://www.python.org/download/

如:http://www.python.org/ftp/python/2.7.5/python-2.7.5.msi

b. 双击后默认安装

c. 配置PATH,Python 运行目录加入PATH系统变量

  • 右击我的电脑 选择属性

  • 选择高级标签 ,选择环境变量

  • 找到系统变量 — PATH ,双击后添加“;C:\Python27\”

图片.png

  •  重新开启一个CMD窗口,我们输入python 命令 如出现图中样式,说明python安装成功。

图片.png

3) SNMP安装与配置

安装SNMP相关组件

图片.png

图片.png

配置SNMP:将SNMP ServiceSNMP Trap启动模式改为自动。

图片.png

图片.png

设置SNMP团体字

图片.png

重启SNMP服务

图片.png

4) 采集器的运行

a. 解压采集器代码, 解压后,请不要放到带有中文的目录下

图片.png


b. 双击运行start.bat 。运行后正常窗口内容如下:

图片.png

5) 监控项目创建

图片.png

图片.png

图片.png

图片.png


查看Linux服务器性能监控已经操作监控完成。

3.1.2 Linux服务器性能监控

1) 采集器创建

采集器的创建见3.1.1 服务器性能监控下1)采集器的创建,目前创建一个内外采集器可以下载Window Linux两个版本,分别对于不同系统进行监控。

2) Python环境部署

因不同LINUX版本较多,请自行编译安装或者使用系统 自带python版本,安装完成之后请确认要shell窗口下可以正常运行python命令

    图片.png

3) SNMP安装与配置

配置SNMP

yum install net-snmp net-snmp-devel net-snmp-utils -y
com2sec notConfigUser  default       public     //public 为设置的团体字
group   notConfigGroup v1           notConfigUser
group   notConfigGroup v2c           notConfigUser
view    systemview    included   .1
view    systemview    included   .1.3.6.1.2.1.1
view    systemview    included   .1.3.6.1.2.1.25.1.1
access  notConfigGroup ""      any       noauth    exact  all  none none
view all    included  .1                               80
syslocation Unknown (edit /etc/snmp/snmpd.conf)
syscontact Root <root@localhost> (configure /etc/snmp/snmp.local.conf)
dontLogTCPWrappersConnects yes
proc mountd
proc ntalkd 4
proc senmail 10 1
exec echotest /bin/echo hello world
disk / 10000
/etc/init.d/snmpd start

目前已经将Linux服务器SNMP配置写成脚本,更方便部署SNMP,脚本见附录。

4) 采集器的运行

图片.png

图片.png

5) 监控项目创建

图片.png

图片.png


查看Linux服务器性能监控已经操作监控完成。

3.2 监控宝服务性能监控

3.2.1 Nginx服务性能监控

1) 内外采集器的创建

图片.png

图片.png

图片.png


2) Python环境部署

3.1.2 Linux服务器性能监控下2)Python环境部署。

2) SNMP安装与配置

3.1.2 Linux服务器性能监控下3)SNMP安装与配置。

3) Nginx配置需求

Nginx 编译安装必须启用   --with-http_stub_status_module

Nginx配置文件内增加以下状态信息。

图片.png

图片.png

图片.png

active connections – 活跃的连接数量
server accepts handled requests — 总共处理了764个连接 , 成功创建764次握手, 总共处理了906个请求
reading — 读取客户端的连接数.
writing — 响应数据到客户端的数量
waiting — 开启 keep-alive 的情况下,这个值等于 active (reading+writing), 意思就是 Nginx 已经处理完正在等候下一次请求指令的驻留连接.

5) 采集器的运行

图片.png

6) 监控项目创建

图片.png

图片.png

图片.png

图片.png

图片.png

图片.png

3.2.2 Apache服务性能监控

1)内外采集器的创建

图片.png

2) Python环境部署

3.1.2 Linux服务器性能监控下2)Python环境部署

3) SNMP安装与配置

3.1.2 Linux服务器性能监控下3)SNMP安装与配置

4) Apache的安装需求

Apache的安装

配置文件里面需要开启apache状态模块

图片.png

图片.png

图片.png

ExtendedStatus On
<Location /Server-status>
SetHandler Server-status
Order deny,allow
Deny from all
Allow from all
</Location>

图片.png

5)采集器的运行

图片.png

6)监控项目创建

图片.png

图片.png

图片.png

图片.png

图片.png

3.2.3 Mysql服务性能监控

1) 内外采集器的创建

图片.png

图片.png

图片.png


2) Python环境部署

若要使用mysql性能监控,需要安装PythonMySQLdb扩展件。

具体参考http://blog.jiankongbao.com/?p=1556

安装mysql插件

  • windows2003

请访问 http://sourceforge.net/projects/mysql-python/ 找对应下载文件

http://jaist.dl.sourceforge.net/project/mysql-python/mysql-python-test/1.2.4b4/MySQL-python-1.2.4b4.win32-py2.7.exe

默认安装即可。

  • linux下 需要根据您安装的python版本来安装对应的 ‘Python interface’

ubuntu下的需要apt-get install python-mysqldb

centos下需要 yum install   Mysql-python

如果python是编译的请将mysql-python重新编译进去。

3) SNMP安装与配置

3.1.2 Linux服务器性能监控下3)SNMP安装与配置。

4) Mysql配置

  •  添加mysql用户

在被监测的myql上执行

>CREATE USER kaliarch@’你的采集器的IPIDENTIFIED BY your_password;

>flush privileges;

图片.png

  • 授权用户远程连接

图片.png

  • 重启采集器

安装完mysql-python 之后 ,双击 stop.bat ,按任意键退出,并退出之前的采集器窗 口。双击start.bat

  • 测试已经可以正常连接数据库。

图片.png

5) 采集器的运行

图片.png

6) 监控项目创建

图片.png

图片.png

图片.png

图片.png

图片.png

图片.png

四、检测排错

4.1 Mysql监控需要安装插件

如果没有安装MySQL-python  在 采集器的LOG中 会报相应的错误 内容类似如下:

2013-05-29 18:16:23,638 ERROR relation_id:1310  type:mysql  error:Traceback (most recent call last):

File “C:\jkb_agent_windows\jkb_agent\plugin\MySQLPlugin.py”, line 51, in getData

import MySQLdb

ImportError: No module named MySQLdb2013-05-29 18:16:23,638 ERROR relation_id:1310  type:mysql  error:Traceback (most recent call last):

import MySQLdb

ImportError: No module named MySQLdb

4.2 WEB应用

检查服务内部WEB中间件是否内部加载status模块,使用浏览器测试是否可以正常打开status页面。

4.3 检测SNMP数据

  • 检查防火墙是否开启对应UDP端口,使用snmpwalk -v SNMP版本 -c 团体名称 检测IP .

测试是否有数据返回。

此处以5min CPU的负载来测试。

图片.png

  • 使用Windows下测试工具MIB Browser测试是否有监控数据返回。

填写被监控端IP地址、SNMP团体号、端口等信息。

图片.png

图片.png

图片.png

有数据出现,即配置正确,可以获取主机数据。

五、附录

目前已经将Linux下安装配置SNMP写成脚本,更便于快速部署基本环境。

AutoInstallSNMP.sh
#!/bin/bash
#mail xuel@anchnet.com
echo "##########################################"
echo "Auto Install Linux-snmp.                ##"
echo "Press Ctrl + C to cancel                ##"
echo "Any key to continue                     ##"
echo "##########################################"
read -n 1
SNMPFILE=/etc/snmp/snmpd.conf
yum install net-snmp net-snmp-devel net-snmp-utils -y
sleep 3
if [ -f "$SNMPFILE" ]
then
cp $SNMPFILE /etc/snmp/snmpd.conf.bak
fi
read -p "Please input your community:" COMMUNITY
cat > $SNMPFILE << EOF
com2sec notConfigUser  default       $COMMUNITY
group   notConfigGroup v1           notConfigUser
group   notConfigGroup v2c           notConfigUser
view    systemview    included   .1
view    systemview    included   .1.3.6.1.2.1.1
view    systemview    included   .1.3.6.1.2.1.25.1.1
access  notConfigGroup ""      any       noauth    exact  all  none none
view all    included  .1                               80
syslocation Unknown (edit /etc/snmp/snmpd.conf)
syscontact Root <root@localhost> (configure /etc/snmp/snmp.local.conf)
dontLogTCPWrappersConnects yes
proc mountd
proc ntalkd 4
proc senmail 10 1
exec echotest /bin/echo hello world
disk / 10000
EOF
/etc/init.d/iptables status >/dev/null 2>&1
if [ $? -eq 0 ]
then
iptables -I INPUT -p udp --dport 161 -j ACCEPT && 
iptables-save >/dev/null 2>&1
else
echo -e "\033[32m iptables is stopd\033[0m"
fi
 
################################################################
IP=`ifconfig |grep "inet addr"|grep -v 127.0.0.1|cut -d: -f2|cut -d' ' -f1`
SNMPPORT=`netstat -lntup | grep 161 | wc -l`
SNMPPROCESS=`ps -ef | grep snmp | grep -v grep | wc -l`
if [ $SNMPPORT == $SNMPPROCESS ]
then
/etc/init.d/snmpd restart
else
/etc/init.d/snmpd start
Fi
chkconfig snmpd on
echo -e "\033[32m Snmp is install success,ipaddress is:$IP,community is:$COMMUNITY\033[0m"
相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
6天前
|
消息中间件 安全 Unix
SSH配置多台服务器之间的免密登陆以及登陆别名
SSH配置多台服务器之间的免密登陆以及登陆别名
18 1
|
28天前
|
弹性计算 负载均衡 容灾
slb配置后端服务器组
配置阿里云SLB后端服务器组涉及四个主要步骤:创建服务器组、添加ECS实例、关联监听规则和设定负载均衡策略。这使得流量根据业务需求和服务器特性进行转发,便于应用架构的灵活管理和扩展,支持蓝绿部署、灰度发布,并通过多可用区提升系统可用性和容灾能力。
25 3
|
24天前
|
弹性计算 运维 监控
ECS资源监控
ECS资源监控涉及CPU、内存、磁盘I/O、网络流量、系统负载和进程的关键指标,通过云服务商控制台、监控服务、API与SDK、运维工具进行实时监控和告警设置。支持历史数据查询、事件监控,以及使用Windows资源监视器和Linux系统工具进行操作系统层面监控。全面监控确保ECS实例稳定运行、资源有效利用和问题及时处理。如需特定云服务商的指导,请询问。
28 3
|
21天前
|
Shell Windows
Windows服务器 开机自启动服务
Windows服务器 开机自启动服务
13 0
|
21天前
|
弹性计算
2024年阿里云服务器不同实例规格与配置实时优惠价格整理与分享
2024年阿里云服务器的优惠价格新鲜出炉,有特惠云服务器也有普通优惠价格,本文为大家整理汇总了2024年阿里云服务器的优惠价格,包含特惠云服务器和其他配置云服务器的优惠价格。以便大家了解自己想购买的云服务器选择不同实例规格和带宽情况下的价格,仅供参考。
2024年阿里云服务器不同实例规格与配置实时优惠价格整理与分享
|
2天前
|
安全 Java 网络安全
对象存储oss使用问题之使用oss上服务器后显示服务异常如何解决
《对象存储OSS操作报错合集》精选了用户在使用阿里云对象存储服务(OSS)过程中出现的各种常见及疑难报错情况,包括但不限于权限问题、上传下载异常、Bucket配置错误、网络连接问题、跨域资源共享(CORS)设定错误、数据一致性问题以及API调用失败等场景。为用户降低故障排查时间,确保OSS服务的稳定运行与高效利用。
10 0
|
3天前
|
存储 弹性计算 安全
阿里云服务器2核2G、2核4G配置最新租用收费标准及活动价格参考
2核2G、2核4G配置是很多个人和企业建站以及部署中小型的web应用等场景时首选的云服务器配置,这些配置的租用价格也是用户非常关心的问题,本文为大家整理汇总了2024年阿里云服务器2核2G、2核4G配置不同实例规格及地域之间的收费标准,同时整理了这些配置最新活动价格,以供大家参考和选择。
阿里云服务器2核2G、2核4G配置最新租用收费标准及活动价格参考
|
6天前
|
网络协议 Java 物联网
阿里云服务器上搭建 MQTT服务
阿里云服务器上搭建 MQTT服务
|
6天前
|
域名解析 网络协议 应用服务中间件
阿里云服务器配置免费https服务
阿里云服务器配置免费https服务
|
9天前
|
数据采集
robots.txt配置 减小服务器压力
robots.txt配置 减小服务器压力
12 0