针对惠普服务器SNMP采集频繁,导致服务停止的解决方案

简介: 运维软件:zabbix采集方式:snmp采集设备:惠普-DL380_Gen9-服务器采集周期:根据指标要求频率有5分钟到1天主要命令:reset /map1乐维服务中发现,snmp采集惠普服务器一段时间后,zabbix提示连接失败,重启ilo后又可以重新采集,我们可以利用这一点做一个自动重启脚本,保证采集正常。
运维软件:zabbix
采集方式:snmp
采集设备:惠普-DL380_Gen9-服务器
采集周期:根据指标要求频率有5分钟到1天
主要命令:reset /map1

乐维服务中发现,snmp采集惠普服务器一段时间后,zabbix提示连接失败,重启ilo后又可以重新采集,我们可以利用这一点做一个自动重启脚本,保证采集正常。
实现思路:zabbix检查自定时间内没有数据->触发告警脚本->告警脚本登录设备执行 reset /map1

1.我们要模板里加一个多久没有采集到数据的触发器如:
img_f9b83c6b27e84bf6fdd25cf66f5b811c.png 

2.增加报警媒介。
管理->报警媒介类型->创建报警媒介类型。

img_df24e78933a398a1b69f89f024f01926.png 

脚本的操作是根据传过来的参数到数据库是找出此设备管理口IP、帐号、密码。

主要sql:SELECT i.ip,h.ipmi_username,h.ipmi_password from `hosts` as h LEFT JOIN interface as i on i.hostid = h.hostid where h.host="'.$hostName.'"  and  i.port= 161。

然后用ssh连接到该设备,执行reset /map1 就可以重启该ilo了。

3.添加动作
配置->动作->创建动作
img_35963fe10443915efca0a40e3b52b831.png 


到此重启设备ilo口完成。

面对snmp频繁采集导致snmp连接失败,这也是一个解决方案。


3.png




转自

惠普服务器SNMP采集频繁导致服务停止解决方案

(出处: 乐维)


相关文章
|
1月前
|
Arthas 弹性计算 运维
阿里云ECS监控服务
阿里云ECS监控服务
403 2
|
1月前
|
机器学习/深度学习 弹性计算 运维
ECS阿里云监控服务
ECS阿里云监控服务
74 3
|
26天前
|
Shell Windows
Windows服务器 开机自启动服务
Windows服务器 开机自启动服务
14 0
|
2月前
|
存储 弹性计算 运维
ECS快照问题之ECS快照服务关闭失败如何解决
阿里云ECS用户可以创建的一个虚拟机实例或硬盘的数据备份,用于数据恢复和克隆新实例;本合集将指导用户如何有效地创建和管理ECS快照,以及解决快照过程中可能遇到的问题,确保数据的安全性和可靠性。
|
1月前
|
弹性计算 NoSQL Redis
阿里云ECS使用docke搭建redis服务
阿里云ECS使用docke搭建redis服务
154 1
|
1月前
|
弹性计算 运维 安全
2024年阿里云一键搭建部署幻兽帕鲁服务器解决方案
幻兽帕鲁火了,为了确保畅快体验游戏,构建高效、稳定的游戏服务器至关重要。幸运的是,阿里云为您提供了快速、简便的服务器搭建解决方案,即使您对技术知识了解有限,也能在短短一分钟内轻松完成《幻兽帕鲁》游戏的联机服务器搭建!
1453 4
|
1月前
|
弹性计算 关系型数据库 MySQL
阿里云ECS使用docker搭建mysql服务
阿里云ECS使用docker搭建mysql服务
152 1
|
7天前
|
安全 Java 网络安全
对象存储oss使用问题之使用oss上服务器后显示服务异常如何解决
《对象存储OSS操作报错合集》精选了用户在使用阿里云对象存储服务(OSS)过程中出现的各种常见及疑难报错情况,包括但不限于权限问题、上传下载异常、Bucket配置错误、网络连接问题、跨域资源共享(CORS)设定错误、数据一致性问题以及API调用失败等场景。为用户降低故障排查时间,确保OSS服务的稳定运行与高效利用。
11 0
|
11天前
|
网络协议 Java 物联网
阿里云服务器上搭建 MQTT服务
阿里云服务器上搭建 MQTT服务
|
11天前
|
域名解析 网络协议 应用服务中间件
阿里云服务器配置免费https服务
阿里云服务器配置免费https服务