WSFC2016 诊断排错更新-阿里云开发者社区

WSFC2016 诊断排错更新

2017-11-12 1205

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

WSFC2016针对于群集日志也进行了一些更新

首先，针对于生成ClusterLog的时候加入了-UseLocalTime的参数，原来默认都是生成GMT的时间，我们在中国看起来还需要加八小时，这样如果你能够确认你的群集节点不存在时区问题，那么你完全就可以使用-UseLocalTime参数输出本地时区的群集日志

#转储当前群集所有节点，最后五分钟的日志到网络路径下，使用本地时间显示。

Get-ClusterLog -TimeSpan 5 -UseLocalTime -Destination \\10.0.0.2\log

打开日志可以看到，时间使用节点本地时区，即北京时区

以上为2016日志诊断的第一个变化

第二个变化，老王发现诊断日志的和2012R2时不太一样，2012R2的日志，打开之后是这样的，直接就是一条一条的诊断信息

2016中的群集日志则更加智能化，当我们使用get-clusterlog获取群集日志的时候，实质上还会在日志的前面帮我们列出，群集的资源信息，配置信息

除了群集的资源和群集配置信息外，clusterlog还会在开头，显示群集相关的其它事件管理器事件

会帮助我们综合Operational logs，CAU，admin logs，DiagnosticVerose的事件综合进来一起显示，为我们在一个clusterlog，提供一个整体的排错

在2012R2时我们就有过介绍，clusterlog，默认是获取diagnostic下的内容，剔除掉无用数据，保留下有用的元数据信息，显示在clusterlog中，针对于这些日志显示在clusterlog中，也会通过这种机制，剔除掉XML中无用的数据栏，只显示出关键有用的元数据信息。

Diagnostic这个事件管理器通道，是负责记录群集运作过程中执行的每一个操作，包括底层调用的插件，用于管理人员排错查看，但因为日志不断增长，在事件管理器中查看不便，因此可以通过clusterlog获取，获得更直观的查看，在2012R2时我们曾经提到，Diagnostic默认是level 3级别的信息记录，如果这个级别无法帮助我们定位问题，我们可以通过设置cluster log为5，push它去收集更细致诊断级别的日志，但那时官方一直强调，设置为5后，后导致该日志飞速增长，会对系统操作性能影响，因此我们短暂排错后还需要及时设置回来

但是在2016，微软优化了这一点，解除了这个性能担心的问题，改为单独设置了一个事件管理器通道DiagnosticVerbose，这个通道就是按照level 5级别来记录群集运作信息，如果我们需要进行level 5级别的群集排错，可以直接查看这个事件管理器通道，实质上当我们获取clusterlog的时候也可以看见这个通道的内容，这个日志下面是来自DiagnosticVerbose中level5的群集日志

下面Cluster Logs开始的部分是来自Diagnostic Level 3级别的日志

因此，现在我们大多数时间都无需去更改cluster log的级别了，因为默认日志就有level5和level3级别，微软实现了并行的事件管理器通道，我们不必再担心性能问题！

以上为关于ClusterLog 在2016中的变化，更新千呼万唤的localtime功能，ClusterLog也新增了其它通道，方便做整体排错，level级别过高带来的性能问题也已得到了解决。

除了ClusterLog，针对于群集排错，微软还提供了另一项新功能，即Dump文件的转储模式

新增了Active Memory Dump转储模式，对于一个Hyper-V集群来说，这可能会是项非常实用的功能，在以前，我们如果在一个Hyper-V跑了很多虚拟机，当我们生成dump时，实质上dump里面会即包括宿主机和虚拟机的内存，而虚拟机的内存页面对于我们进行宿主机级别排错有时可能并不需要，当我们选择活动内存转储后，dump将只包括宿主机的内存页面，对于虚拟机的内存页面将进行过滤，最终大小将只是将完整dump的百分之10%