hadoop之 Hadoop 2.x HA 、Federation

简介:

HDFS2.0之HA

主备NameNode:
1、主NameNode对外提供服务,备NameNode同步主NameNode元数据,以待切换;
2、主NameNode的信息发生变化后,会将信息写到共享数据存储系统中让备NameNode合并到自己的内存中;
3、所有DataNode同时向两个NameNode发送心跳信息(块信息);

两种切换方式:
1、手动切换:通过命令实现主备之间的切换,可以用于HDFS升级等场合;
2、自动切换:基于Zookeeper实现;
Zookeeper Failover Controller:向Zookeeper注册NameNode并监控NameNode健康状态,当NM挂掉后,ZKFC为NameNode竞争锁,获得锁的NameNode变成active;

多种共享数据存储系统可供选择
1、NFS
2、多个Journal Node构成集群(推荐)
基本原理,数据同时写入所有的JN,多数写入成功,则认为写成功;
一般配置奇数个JN,JN越多,容错性越好;比如有3个JN,只要两个写成功,则数据写成功,最多允许一个JN挂掉;
3、Bookeeper

相对于hadoop1.x中多了备NameNodeJournalNode(存储共享数据)ZKFC&ZK(主备NN切换)

 

HDFS2.0之Federation

多个NN同时对外提供服务,每个NN分管一部分目录,多个NN共享底层DN存储;
此时每个NN都还是存在单点故障问题的,故还需要给Federation节点配置一个备用NN;
所有整个HADOOP2集群中可能存在的NN有:多个NN以及每个NN对应的备NN

带来的好处:单个NN内存和并发压力减小,NN彼此隔离,互不影响

常见应用方法:
为不同业务创建不同NN,防止相互影响;(一个NN给开发用,一个NN测试用)
为不同需求创建不同NN,比如测试用的NN,生产用的NN;

 

HDFS2.0之其他实现机制(与1.0版本基本一致)

1、文件放置策略
文件被切成若干个block,存放在不同节点上;
切分过程对用户透明;

2、文件容错策略
基于副本的容错机制;
流水线复制;

3、副本放置策略
一个节点(1个rack)+ 两个节点(另1个rack)

4、......

文章可以转载,必须以链接形式标明出处。


本文转自 张冲andy 博客园博客,原文链接:  http://www.cnblogs.com/andy6/p/7679243.html ,如需转载请自行联系原作者
相关文章
|
存储 分布式计算 运维
hadoop HA高可用集群实战
大数据实战:hadoop HA高可用集群
hadoop HA高可用集群实战
|
存储 分布式计算 Hadoop
四十九、Hadoop HA部署(MINI版)(二)
四十九、Hadoop HA部署(MINI版)(二)
四十九、Hadoop HA部署(MINI版)(二)
|
分布式计算 运维 Hadoop
四十九、Hadoop HA部署(MINI版)(一)
四十九、Hadoop HA部署(MINI版)(一)
四十九、Hadoop HA部署(MINI版)(一)
|
分布式计算 资源调度 Hadoop
搭建Hadoop集群的HA高可用架构(超详细步骤+已验证)(二)
搭建Hadoop集群的HA高可用架构(超详细步骤+已验证)(二)
253 0
|
分布式计算 资源调度 算法
搭建Hadoop集群的HA高可用架构(超详细步骤+已验证)(一)
搭建Hadoop集群的HA高可用架构(超详细步骤+已验证)(一)
532 0
|
分布式计算 大数据 Hadoop
好程序员大数据教程Hadoop全分布安装(非HA)
   机器名称 启动服务  linux11 namenode secondrynamenode datanode  linux12 datanode  linux13 datanode  第一步:更改主机名,临时修改+永久修改  临时修改:hostname linux11  永久修改: vi /e.
1186 0
|
分布式计算 Hadoop Java
搭建Hadoop的HA高可用架构(超详细步骤+已验证)
一、集群的规划 Zookeeper集群: 192.168.182.12 (bigdata12)192.168.182.13 (bigdata13)192.168.182.14 (bigdata14) Hadoop集群: 192.
6071 0
|
分布式计算 资源调度 大数据
Hadoop手把手逐级搭建(4) Hadoop高可用+联邦+视图文件系统(HA+Federation+ViewFs)
步骤概述 1). 为高可用保存hadoop配置 2). 增加federation配置 3). 首次启动HA+Federation集群part1:启动journalnode和zookeeper,格式化zookeeper集群 4).
4369 0
|
分布式计算 资源调度 Hadoop
一脸懵逼学习Hadoop分布式集群HA模式部署(七台机器跑集群)
1)集群规划:主机名          IP      安装的软件                      运行的进程master    192.168.199.130   jdk、hadoop                      NameNode、DFSZKFailoverController(zkfc)slaver1    192.
2056 0

相关实验场景

更多