IBM X系列服务器IMM日志采集

IBM服务器素来以稳定著称,但有时候难免也会出现一些故障。在出现故障时怎么排除故障,除了依靠经验判断定位故障外,还有没有更好的办法呢?

IBM X系列服务器提供了Integrated Management Module(IMM)集成管理模块,可以比较方便的监控服务器健康状况,查看日志信息,还提供了一些配置管理功能。下面就让我们来看看这个神秘的IMM吧。

在IBM X系列服务器背板上有一个“SYS MGMT”接口,用网线将此接口与笔记本连接起来,然后将笔记本的IP地址配置成“192.168.70.0/24”这个网段的地址,然后PING测试“192.168.70.125”,如果能通就OK了。IMM的默认管理地址就是“192.168.70.125/24”,此地址可以进行修改。然后在IE地址栏输入“http://192.168.70.125”,然后出来以下界面:

 

输入用户名口令:USERID/PASSW0RD,注意是数字“0”不是英文字母“o”。

 

点“continue”,

 

在“system status”可以查看系统的健康状况,如果系统正常则显示绿色指示灯, 如果有错误则显示黄色灯,并会列出是什么错误。

 

 

“vitual light path”指示灯状态

 

这里是服务器日志信息模块,记录了错误日志,警告日志和信息日志信息,可以帮助工程师方便的定位故障。

 

在“network interfaces”里可以对网络接口进行配置,修改管理地址等操作。

 

在“Login Profiles”导行栏中可以添加管理帐户。

在IBM x3650m3与IBM x3850x5服务器中都曾用IMM日志定位过故障。将一次定位IBMx 3850x5的内存故障定位过程和大家分享一下。

IBMx3850x5首先出现硬件故障时,服务器的关键指示灯面板上会有指示,如果是内存故障,则“MEM”亮黄灯,但当时我们的服务器共有128G内存,有8块内存板,每块内存板上插了4条4G的内存,这么多的内存,如何知道到底是哪条或者哪几条内存出了问题了,常规的做法是插开机箱面板去看内存板卡上的指示灯,这是种方法。而且也可以进行定位,其实还有2种方法,一种是通过BIOS去检查系统信息,里面也会有指示,另一种就是通过IMM,查看日志。我个人偏向于IMM,因为简单直观,还需要指出一点就是IBM x3850x5在内存板卡上插槽的位置有讲究,不是随便插的,每块内存板卡上有8个槽位,插内存条时要成对的插,而且按照1-8,3-6,2-7,4-5的顺序,而且每对内存只要有一根出错,2个槽位会同时报错。