深入探讨HBASE

开源大数据EMR 2020-02-27

hbase hdfs 日志 集群 排序 负载均衡 同步 Server 磁盘 存储 数据存储

HBASE基础

1. HBase简介

HBase是一个高可靠、高性能、面向列的,主要用于海量结构化和半结构化数据存储的分布式key-value存储系统。
它基于Google Bigtable开源实现,但二者有明显的区别:Google Bigtable基于GFS存储,通过MAPREDUCE处理存储的数据,通过chubby处理协同服务;而HBase底层存储基于hdfs,可以利用MapReduce、Spark等计算引擎处理其存储的数据,通过Zookeeper作为处理HBase集群协同服务。

2. HBase表结构

HBase以表的形式将数据最终存储的hdfs上,建表时无需指定表中字段,只需指定若干个列簇即可。插入数据时,指定任意多个列到指定的列簇中。通过行键、列簇、列和时间戳可以对数据进行快速定位。

2.1 行键(row key)

HBase基于ro



登录 后评论
下一篇
云栖号资讯小编
356人浏览
2020-03-31
相关推荐
云数据库产品月刊·5月刊
5521人浏览
2018-06-11 14:17:11
招募有志青年
2850人浏览
2016-12-04 22:33:35
HBase 和 Cassandra的浅谈
13360人浏览
2017-09-05 16:19:04
HBase最佳实践-集群规划
1451人浏览
2017-08-01 10:45:00
异步社区本周半价电子书
1307人浏览
2018-07-09 17:16:49
0
0
0
596