《HBase管理指南》一1.1 简介

简介:

本节书摘来异步社区《HBase管理指南》一书中的第1章,第1.1节,作者: 蒋燚峰 译者: 苏南,更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.1 简介

本章将介绍HBase集群的安装方法,首先将介绍基本的单机运行模式的HBase实例的安装方法,然后介绍如何在Amazon EC2上安装完全分布式运行的高可靠性HBase集群。

根据Apache HBase主页上的定义:

HBase是Hadoop上的数据库。它适合在需要对大数据进行随机且实时读写的情况下使用。其目标是在基于商品化硬件构建的集群之上存储那些非常大的表——比如那些有数百万个字段和数十亿条记录的大表。

HBase可以在任何文件系统上运行。比如说,无论是在EXT4本地文件系统、Amazon S3(Amazon Simple Storage Service),还是Hadoop分布式文件系统(HDFS)上,都可以运行HBase。 HDFS是Hadoop首选的分布式文件系统,因此大多数完全分布式的HBase集群都运行在HDFS文件系统上,所以我们将首先介绍一下如何安装Hadoop。

Apache ZooKeeper是一个开源软件,它能够提供一种具有高可靠性的分布式的协调服务。分布式的HBase需要运行一个ZooKeeper集群。

作为一种运行在Hadoop上的数据库,HBase需要同时打开很多个文件。 为了使HBase能够顺畅运行,我们需要修改一些Linux内核参数的设置。

一个完全分布式的HBase集群都有一个或多个主节点(HMaster)和许多从节点(RegionServer),其中主节点用于协调整个集群,从节点用于处理实际的数据存储和要求。图1-1显示的是一个典型的HBase集群结构。


1

HBase可以同时运行多个主节点,它会使用Zookeeper来监控这些主节点和实现这些主节点之间的故障转移。不过,由于HBase在底层使用了HDFS来作为它的文件系统,所以如果HDFS宕机了,HBase也自然要宕机。HDFS的主节点(我们称之为NameNode)是HDFS的单点故障(SPOF,Single Point Of Failure),因此也是HBase集群的单一故障点。幸运的是,NameNode在软件方面非常健壮和稳定。此外,HDFS的研发团队也正在努力开发具有真正高可靠性的NameNode,Hadoop的下一个主要发布版本可能就会包含这一特性。

在1.2~1.8节中,我们将介绍如何让HBase与它所需要使用的那些软件一起工作,构建起一个完全分布式的HBase集群。最后一节将介绍一个较为高级的话题——如何避免集群的单点故障问题。

下面,我们就开始介绍如何安装一个单机运行的HBase实例,之后再来演示如何在Amazon EC2上安装一个分布式的HBase集群。

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
5月前
|
存储 分布式计算 Hadoop
92 hbase简介
92 hbase简介
29 0
|
7月前
|
Shell 分布式数据库 Hbase
Hbase shell管理操作
Hbase shell管理操作
53 0
|
存储 JSON 监控
|
存储 SQL 分布式计算
BigData之Hbase:Hbase数据管理的简介、下载、案例应用之详细攻略
BigData之Hbase:Hbase数据管理的简介、下载、案例应用之详细攻略
BigData之Hbase:Hbase数据管理的简介、下载、案例应用之详细攻略
|
SQL 分布式计算 大数据
BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略
BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略
BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略
|
SQL 缓存 安全
如何正确管理HBase的连接
如何正确管理HBase的连接
606 0
如何正确管理HBase的连接
|
SQL 分布式计算 大数据
BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略
BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略
|
存储 SQL 分布式计算
BigData之Hbase:Hbase数据管理的简介、下载、案例应用之详细攻略
BigData之Hbase:Hbase数据管理的简介、下载、案例应用之详细攻略
BigData之Hbase:Hbase数据管理的简介、下载、案例应用之详细攻略
|
Java 分布式数据库 文件存储
|
存储 Java 大数据
HBase+SpringBoot分布式文件存储实战(二)-HBase简介与环境部署
1 HBase简介及其在大数据生态圈的位置 行列表举例 行 / 列式数据表,即把列放在一起 列式则适合于大批量查询 2 HBase数据存储模型及与关系型数据库的区别 ...
1859 0