备案控制台

开发者社区

开发者社区大数据文章正文

解读Secondary NameNode的功能

2017-11-22 1108

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

1.概述

　　最近有朋友问我Secondary NameNode的作用，是不是NameNode的备份？是不是为了防止NameNode的单点问题？确实，刚接触Hadoop，从字面上看，很容易会把Secondary NameNode当作备份节点；其实，这是一个误区，我们不能从字面来理解，阅读官方文档，我们可以知道，其实并不是这么回事，下面就来赘述下Secondary NameNode的作用。

2.Secondary NameNode？

　　在Hadoop中，有一些命名模块不那么尽人意，Secondary NameNode就是一个典型的例子之一。从它的名字上看，它给人的感觉就像是NameNode的备份节点，但实际上却不是。很多Hadoop的入门者都很疑惑，Secondary NameNode究竟在其中起什么作用，它在HDFS中所扮演的角色是什么。下面，我就来解释下：

　　从名字来看，它确实与NameNode有点关系；因此，在深入了解Secondary NameNode之前，我们先来看看NameNode是做什么的。

2.1NameNode

　　NameNode主要是用来保存HDFS的元数据信息，比如命名空间信息，块信息等等。当它运行的时候，这些信息是存在内存中的。但是这些信息也可以持久化到磁盘上。如下图所示：

　　上图展示来NameNode怎么把元数据保存到磁盘上，这里有两个不同的文件：

fsimage：它是NameNode启动时对整个文件系统的快照。
edits：它是在NameNode启动后，对文件系统的改动序列。

　　只有在NameNode重启时，edits才会合并到fsimage文件中，从而得到一个文件系统的最新快照。但是在生产环境集群中的NameNode是很少重启的，这意味者当NameNode运行来很长时间后，edits文件会变的很大。在这种情况下就会出现下面这些问题：

edits文件会变的很大，如何去管理这个文件？
NameNode的重启会花费很长的时间，因为有很多改动要合并到fsimage文件上。
如果NameNode宕掉了，那我们就丢失了很多改动，因为此时的fsimage文件时间戳比较旧。

　　因此为了克服这个问题，我们需要一个易于管理的机制来帮助我们减小edits文件的大小和得到一个最新的fsimage文件，这样也会减小在NameNode上的压力。而Secondary NameNode就是为了帮助解决上述问题提出的，它的职责是合并NameNode的edits到fsimage文件中。如图所示：

　　上图的工作原理，我这里也赘述下：

首先，它定时到NameNode去获取edits，并更新到fsimage上。
一旦它有新的fsimage文件，它将其拷贝回NameNode上。
NameNode在下次重启时回使用这个新的fsimage文件，从而减少重启的时间。

　　Secondary NameNode的整个目的在HDFS中提供一个Checkpoint Node，通过阅读官方文档可以清晰的知道，它只是NameNode的一个助手节点，这也是它在社区内被认为是Checkpoint Node的原因。

　　现在，我们明白Secondary NameNode所做的是在文件系统这设置一个Checkpoint来帮助NameNode更好的工作；它不是取代NameNode，也不是NameNode的备份。　　

　　Secondary NameNode的检查点进程启动，是由两个配置参数控制的：

fs.checkpoint.period，指定连续两次检查点的最大时间间隔，默认值是1小时。
fs.checkpoint.size定义了edits日志文件的最大值，一旦超过这个值会导致强制执行检查点（即使没到检查点的最大时间间隔）。默认值是64MB。

　　如果NameNode上除了最新的检查点以外，所有的其他的历史镜像和edits文件都丢失了， NameNode可以引入这个最新的检查点。以下操作可以实现这个功能：

在配置参数dfs.name.dir指定的位置建立一个空文件夹；
把检查点目录的位置赋值给配置参数fs.checkpoint.dir；
启动NameNode，并加上-importCheckpoint。

　　NameNode会从fs.checkpoint.dir目录读取检查点，并把它保存在dfs.name.dir目录下。如果dfs.name.dir目录下有合法的镜像文件，NameNode会启动失败。 NameNode会检查fs.checkpoint.dir目录下镜像文件的一致性，但是不会去改动它。

　　注：关于NameNode是什么时候将改动写到edit logs中的？这个操作实际上是由DataNode的写操作触发的，当我们往DataNode写文件时，DataNode会跟NameNode通信，告诉NameNode什么文件的第几个block放在它那里，NameNode这个时候会将这些元数据信息写到edit logs文件中。

　　下面附上官方文档说明：

复制代码

The NameNode stores modifications to the file system as a log appended to a native file system file, edits. When a NameNode starts up, it reads HDFS state from an image file, fsimage, and then applies edits from the edits log file. It then writes new HDFS state to the fsimage and starts normal operation with an empty edits file. Since NameNode merges fsimage and edits files only during start up, the edits log file could get verylarge over time on a busy cluster. Another side effect of a larger edits file is that next restart of NameNode takes longer.

The secondary NameNode merges the fsimage and the edits log files periodically and keeps edits log size within a limit. It is usually run ona different machine than the primary NameNode since its memory requirements are on the same order as the primary NameNode.

The start of the checkpoint process on the secondary NameNode is controlled by two configuration parameters.

* dfs.namenode.checkpoint.period, set to 1 hour by default, specifies the maximum delay between two consecutive checkpoints, and
* dfs.namenode.checkpoint.txns, set to 1 million by default, defines the number of uncheckpointed transactions on the NameNode which will force an urgent checkpoint, even if the checkpoint period has not been reached.
The secondary NameNode stores the latest checkpoint in a directory which is structured the same way as the primary NameNode's directory. So that the check pointed image is always ready to be read by the primary NameNode if necessary.

复制代码

　　参考地址：http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-hdfs/HdfsUserGuide.html

3.总结

　　这篇文章就和大家分享到这里，若在阅读过程中有什么疑问，可以加群进行讨论或发送邮件给我，我会尽我所能为您解答，与君共勉！

联系方式：
邮箱：smartloli.org@gmail.com
Twitter： https://twitter.com/smartloli
QQ群（Hadoop - 交流社区1）： 424769183
温馨提示：请大家加群的时候写上加群理由（姓名＋公司/学校），方便管理员审核，谢谢！

热爱生活，享受编程，与君共勉！

本文转自哥不是小萝莉博客园博客，原文链接：http://www.cnblogs.com/smartloli/，如需转载请自行联系原作者

文章标签：

分布式计算

Hadoop

技术mix呢

目录

相关文章

极客李华

|

3月前

|

存储分布式计算 Hadoop

Hadoop的Secondary NameNode在HDFS中的作用是什么？

Hadoop的Secondary NameNode在HDFS中的作用是什么？

极客李华

36 0 0

赵广陆

|

7月前

|

存储分布式计算 Hadoop

HDFS Namenode挂掉后分析解决

HDFS Namenode挂掉后分析解决

赵广陆

164 1 1

码农日常

|

10月前

|

存储机器学习/深度学习 Java

HDFS 在 HA 模式集群下 JournalNode 节点的作用

HDFS 在 HA 模式集群下 JournalNode 节点的作用

码农日常

114 0 0

阿里云服务支持

|

机器学习/深度学习资源调度分布式计算

HA场景下主NameNode启动失败

HA场景下主NameNode启动失败

阿里云服务支持

284 0 0

邵奈一2018

|

分布式数据库 Perl Hbase

HDFS恢复非HA状态

HDFS恢复非HA状态

邵奈一2018

83 0 0

一见蓝天

强制DataNode向NameNode上报blocks

正常情况下，什么时候上报blocks，是由NameNode通过回复心跳响应的方式触发的。一次机房搬迁中，原机房hadoop版本为2.7.2，新机房版本为2.8.0，采用先扩容再缩容的方式搬迁。

一见蓝天

1425 0 0

从大数据到人工智能

|

分布式计算 Hadoop

hdfs集群安装（单namenode和HA模式）

本文介绍hdfs集群安装（单namenode和HA模式）指南

从大数据到人工智能

165 0 0

hdfs集群安装（单namenode和HA模式）

余二五

|

分布式计算 Hadoop

namenode ha切换优化

余二五

1710 0 0

余二五

|

存储分布式计算 Hadoop

hadoop中NameNode、DataNode、Secondary、NameNode、JobTracker TaskTracker介绍

余二五

1185 0 0

余二五

|

分布式计算 Hadoop

datanode报错FATAL datanode.DataNode

余二五

991 0 0

热门文章

最新文章

Google Colab免费GPU大揭晓：超详细使用攻略

fdisk、parted无损调整普通分区大小

二十款漂亮的CSS字体样式

随机生成UserAgent的python库（fake-useragent库）

使用zxing识别一幅包含多个二维码的图片

leetCode 169. Majority Element 数组

图解揭秘Oracle Buffer Header数据结构

《CCNP ROUTE 300-101认证考试指南》——8.6节复习所有考试要点

iOS (ProjectName-info.plist) (ProjectName-Prefix.pch) 解析

经典排序之堆排序

R语言中使用RCPP并行计算指数加权波动率

R语言用Rshiny探索lme4广义线性混合模型（GLMM）和线性混合模型（LMM）

Python计算股票投资组合的风险价值（VaR）

用excel来构建柯布-道格拉斯Cobb-Douglas生产函数的可视化

R语言使用马尔可夫链Markov Chain, MC来模拟抵押违约

R语言使用Bass模型进行手机市场产品周期预测

R语言k-Shape时间序列聚类方法对股票价格时间序列聚类

R语言基于ARMA-GARCH-VaR模型拟合和预

R语言检验独立性：卡方检验(Chi-square test)

MATLAB中的马尔可夫区制转换(Markov regime switching)模型

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云oss简介和使用流程