WSFC2016 诊断排错更新

简介:

WSFC2016针对于群集日志也进行了一些更新


首先,针对于生成ClusterLog的时候加入了-UseLocalTime的参数,原来默认都是生成GMT的时间,我们在中国看起来还需要加八小时,这样如果你能够确认你的群集节点不存在时区问题,那么你完全就可以使用-UseLocalTime参数输出本地时区的群集日志


#转储当前群集所有节点,最后五分钟的日志到网络路径下,使用本地时间显示。

Get-ClusterLog -TimeSpan 5 -UseLocalTime -Destination \\10.0.0.2\log

wKioL1mvt3uQIE4-AABXSqp_vKE844.jpg

打开日志可以看到,时间使用节点本地时区,即北京时区

wKioL1mvuFDznfxIAAdIb08Q1xk518.jpg

以上为2016日志诊断的第一个变化


第二个变化,老王发现诊断日志的和2012R2时不太一样,2012R2的日志,打开之后是这样的,直接就是一条一条的诊断信息

wKiom1mvuWmDUFtLAATEPpYGTQU943.jpg

2016中的群集日志则更加智能化,当我们使用get-clusterlog获取群集日志的时候,实质上还会在日志的前面帮我们列出,群集的资源信息,配置信息

wKiom1mvucCQmPkoAAbeO2Q8TRQ829.jpgwKioL1mvubqyZI0RAAOg1X5APRs202.jpg

除了群集的资源和群集配置信息外,clusterlog还会在开头,显示群集相关的其它事件管理器事件

会帮助我们综合Operational logs,CAU,admin logs,DiagnosticVerose的事件综合进来一起显示,为我们在一个clusterlog,提供一个整体的排错

wKiom1mvuhXRa3L5AACSpzIHHGU329.jpg

在2012R2时我们就有过介绍,clusterlog,默认是获取diagnostic下的内容,剔除掉无用数据,保留下有用的元数据信息,显示在clusterlog中,针对于这些日志显示在clusterlog中,也会通过这种机制,剔除掉XML中无用的数据栏,只显示出关键有用的元数据信息。

wKiom1mvu4_SnK69AAOw-ydYz0A225.jpg

Diagnostic这个事件管理器通道,是负责记录群集运作过程中执行的每一个操作,包括底层调用的插件,用于管理人员排错查看,但因为日志不断增长,在事件管理器中查看不便,因此可以通过clusterlog获取,获得更直观的查看,在2012R2时我们曾经提到,Diagnostic默认是level 3级别的信息记录,如果这个级别无法帮助我们定位问题,我们可以通过设置cluster log为5,push它去收集更细致诊断级别的日志,但那时官方一直强调,设置为5后,后导致该日志飞速增长,会对系统操作性能影响,因此我们短暂排错后还需要及时设置回来

wKioL1mvvNGzVeg6AABXDxxpn3M923.jpg

但是在2016,微软优化了这一点,解除了这个性能担心的问题,改为单独设置了一个事件管理器通道DiagnosticVerbose,这个通道就是按照level 5级别来记录群集运作信息,如果我们需要进行level 5级别的群集排错,可以直接查看这个事件管理器通道,实质上当我们获取clusterlog的时候也可以看见这个通道的内容,这个日志下面是来自DiagnosticVerbose中level5的群集日志

wKiom1mvvynBJJJoAAKyKxiOwMA885.jpg

下面Cluster Logs开始的部分是来自Diagnostic Level 3级别的日志

wKiom1mvvymwyBmFAALA_TCnYM0242.jpg

因此,现在我们大多数时间都无需去更改cluster log的级别了,因为默认日志就有level5和level3级别,微软实现了并行的事件管理器通道,我们不必再担心性能问题!


以上为关于ClusterLog 在2016中的变化,更新千呼万唤的localtime功能,ClusterLog也新增了其它通道,方便做整体排错,level级别过高带来的性能问题也已得到了解决。


除了ClusterLog,针对于群集排错,微软还提供了另一项新功能,即Dump文件的转储模式


新增了Active Memory Dump转储模式,对于一个Hyper-V集群来说,这可能会是项非常实用的功能,在以前,我们如果在一个Hyper-V跑了很多虚拟机,当我们生成dump时,实质上dump里面会即包括宿主机和虚拟机的内存,而虚拟机的内存页面对于我们进行宿主机级别排错有时可能并不需要,当我们选择活动内存转储后,dump将只包括宿主机的内存页面,对于虚拟机的内存页面将进行过滤,最终大小将只是将完整dump的百分之10%

wKioL1mvwF3iTiXUAADrSdVpYcM144.jpg


以上为2016中对于排错的功能更新,希望能为看到的朋友带来收获!


本文转自 老收藏家 51CTO博客,原文链接:http://blog.51cto.com/wzde2012/1963170

相关文章
|
4月前
|
存储 设计模式 监控
如何诊断处理生产环境服务器变慢
在当今的高科技环境下,生产环境服务器的性能问题可能是一个复杂且棘手的问题。当服务器变慢时,可能会对企业的运营产生重大影响,包括客户满意度下降,工作效率降低,甚至可能导致整个系统崩溃。为了解决这些问题,我们需要深入了解生产环境服务器变慢的原因,并掌握有效的诊断和处理方法。本文将详细介绍如何诊断和处理生产环境服务器变慢的问题。通过深入探讨服务器的硬件和软件配置,网络环境,以及可能影响服务器性能的各种因素,我们将提供一系列实用的诊断和解决方案。
47 1
|
1天前
|
运维 监控 Java
线上故障突突突?如何紧急诊断、排查与恢复
本文简单介绍了阿里云上关于故障恢复、诊断的一些最佳实践。
线上故障突突突?如何紧急诊断、排查与恢复
|
Java API 微服务
日志排查问题困难?分布式日志链路跟踪来帮你
开发排查系统问题用得最多的手段就是查看系统日志,在分布式环境中一般使用`ELK`来统一收集日志,但是在并发大时使用日志定位问题还是比较麻烦,由于大量的其他用户/其他线程的日志也一起输出穿行其中导致很难筛选出指定请求的全部相关日志,以及下游线程/服务对应的日志。
794 0
日志排查问题困难?分布式日志链路跟踪来帮你
|
监控 测试技术 网络安全
WMI监控碰到错误号53的问题定位
Spotlight On Oracle这款监控工具可以用来监控Windows操作系统,监控的原理是通过WMI远程访问协议,有时候监控会出现连接报错,比如报"错误号53,找不到网络路径”,或者是报别的错误,只要我们遵循以下的分析思路就能找到问题的根源
1610 0