企业打开云HBase的正确方式,来自阿里云云数据库团队的解读

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 一、HBase的历史由来 HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

一、HBase的历史由来

HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

HBase最初是以Hadoop子项目的形式进行开发建设,直到2010年5月才正式成为Apache的顶级项目独立发展。伴随着互联网时代数据的澎湃增长,HBase作为基础存储系统得到了快速发展与应用,大批知名商业公司(Facebook、Yahoo、阿里等)自主地加入到了HBase生态建设队伍,成为Apache最活跃的社区之一。

在大批知名公司的推动下,以及结合HBase自身的能力,HBase应用场景非常广泛,例如Cube分析、推荐画像、对象存储、消息/订单存储、时序数据、Feeds流、时空数据、NewSQL等多个领域
image

二、HBase普及和应用难点

整个Hadoop技术体系也不知不觉的走过了10年的青葱岁月,但相比关系型数据库超过40年的发展,还显得稚嫩。相比成熟的关系型数据库,HBase的普及和应用,有以下难点:

  • 生产部署至少4个节点,起步成本高。
  • 原始只有API接口,偏底层,需要较强编程功底。
  • 技术资料少。
  • 社区活动少。

三、技术平民化,阿里云HBase团队在行动

为了普及和推广HBase生态,降低HBase使用难度,让更多的公司享受到HBase技术红利。

阿里云HBase团队在产品,生态,客户服务方面积极投入,希望通过微薄的力量造福整个中国HBase技术生态,让HBase技术平民化,让那些只有大公司才玩的起的技术真正走进SME,校园和广大开发者。

1、推出云HBase单节点版本,极低成本,降低使用门槛

阿里云云HBase服务正式推出单节点版本,欢迎访问https://promotion.aliyun.com/ntms/act/hbasesingle.html 了解更多。

HBase单节点版本是在集群版本的基础上推出的基础版本,相比集群版本的4个节点起步,单节点版本HBase服务全部部署在一个节点上,因此单节点版本价格非常低。同时单节点是具备小规模生产能力的,具备纵向伸缩能力,提供11个9的数据集可靠性和2个9的服务可用性,所以单节点版本非常适合开发、测试以及非核心业务小规模生产环境。

HBase单节点有以下特点:

  • 体验一致 :和云数据库HBase集群版本各种操作,监控体验一致
  • 低成本 :年度爆款,99元/3月,399元/年
  • 高性能:深度内核优化,性能高于社区版本50%-200%
  • 弹性灵活:多种规格选择,未来支持实例升级变配,选择灵活

2、提供SQL能力,造福广大DBA和开发者

过于底层的API,使得HBase使用起来难度巨大。相比原生API,SQL能力是广大DBA和开发者提升开发和使用效率的利器,云HBase服务默认包含Phoneix服务。
Phoenix是一个开源的HBASE SQL层。它不仅可以使用标准的JDBC API替代HBASE client API创建表,插入和查询HBASE,也支持二级索引、事务以及多种SQL层优化。
另外,我们在云栖社区中推出一系列专业文章,帮助HBase用户很好的理解和使用HBase和Phoenix:Phoenix系列文章。此系列文章将会从Phoenix的语法和功能特性、相关工具、实践经验以及应用案例多方面从浅入深的阐述。希望对Phoenix入门、在做架构设计和技术选型的同学能有一些帮助。
另外,功能更强大和完善的HBase SQL能力也持续研发中,HBase使用难度会进一步降低,适应场景更加广泛。

3、回馈社区,积极推动社区发展

阿里由于业务上的需要,内部深度使用HBase,内部集群规模整体超过12000台,单集群超过1000台。在长期的实践和使用中,也培养了大量的专家,积累了雄厚的技术实力,目前拥有 3 HBase PMC、6 Committer、数十位内核贡献者。我们在收获社区的技术支持的同时,也积极回馈社区,给社区贡献超过 200+ Patch,同时阿里云平台提供了多种方便易上手的数据产品工具。除了产品上,我们在社区的推广和建设中也积极投入人力和物力。


- 主办Apache HBasecon Asia 2018大会

HBaseCon大会是Apache HBase™官方举办的技术会议,发起于2012年,是HBase技术人员的盛会。阿里云主办2018届HBase亚洲大会,大会预计在下半年举行,我们会在第一时间公布在技术社区中。欢迎广大HBase技术爱好者关注。

- 打造HBase中文社区,完善HBase中文资料

HBase发源于美国,发源于社区,所以存在资料不完善,核心资料都是英文的问题,进一步加大了开发人员学习和掌握HBase的难度。
云HBase团队联合国内众多大公司的研发leader,HBase社区PMC,推出HBase中文社区,打造一个技术人员的技术交流家园,组织广大的社区爱好者积极分享HBase技术文章,共同促进HBase技术氛围的形成。也欢迎更多的同学加入HBase技术社区,一起营造HBase技术家园。

4、一颗公益之心,义务抢救客户数据

4.13日,某公司使用自建一个HBase集群挂了!整个集群有30+T 业务数据,是公司的数据中心,集群直接启动不了。他们也是经历了熬战一天一夜的情况下,依旧没有解决恢复,还曾有过重装集群重导数据念头。最后,通过钉钉HBase技术交流群找到阿里云的技术团队同学。技术同学立刻自发组成抢救小分队,尽力最大的努力,使用最低风险的方式,抢救最完整的集群。

事后,技术负责人王华激动的表示:非常感谢阿里大牛的帮助,协助我们解决了关键问题,避免了30TB业务数据遗失的重大损失。

感谢这群单纯的技术人,让HBase技术社区有温度!

四、写到最后

一项技术的发展和成熟,都要经历无数的技术人员,无数个日夜,不眠不休持续奋战。也需要集全社会的力量,更多的公司一起参与进来共同打造更好的产品和更好的生态。

阿里云HBase团队希望通过这些星星之火,点燃HBase以及整个Hadoop技术生态的草原。

普及HBase,阿里云HBase团队在行动!

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
打赏
0
0
0
1
10543
分享
相关文章
拒绝等待!阿里云瑶池数据库 x Qwen3,构建增强式RAG
阿里云瑶池 Dify on DMS + AnalyticDB 现已支持通义千问 Qwen3 全系列模型的私域部署,并提供独占模型服务,实现高效安全的 GraphRAG 业务应用及大模型应用开发解决方案。
分布式存储数据恢复—hbase和hive数据库数据恢复案例
分布式存储数据恢复环境: 16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。 虚拟机上部署Hbase和Hive数据库。 分布式存储故障: 数据库底层文件被误删除,数据库不能使用。要求恢复hbase和hive数据库。
58 12
数据库国产化选型?YashanDB 给中大型企业的五个答案
近两年,“国产数据库”成为企业数字化升级的重要议题。YashanDB作为新一代国产关系型数据库,以完整产品矩阵解决企业核心关切:通过图形化工具提升开发效率;提供自动化迁移平台简化数据库切换;云管理工具减轻运维负担;支持复杂业务场景;拥有成熟团队保障企业级服务。YashanDB不仅是“可替代”,更是“更可靠”的选择,助力企业实现高效、可控的数据库升级。
当「内容科技企业」遇上多模数据库:新榜采用Lindorm打造全域数据“超级底盘”
新榜业务以数据服务提升内容产业信息流通效率,其数据处理需求聚焦于跨平台实时数据融合处理、实时分析检索、批量更新效率三大维度。Lindorm通过多模超融合架构,提供检索分析一体化、多引擎数据共享,分布式弹性扩展等能力,成为支撑新榜内容服务的核心引擎,助力客户在内容生态竞争中持续领跑。
当「内容科技企业」遇上多模数据库:新榜采用Lindorm打造全域数据“超级底盘”
新榜业务以数据服务提升内容产业信息流通效率,其数据处理需求聚焦于跨平台实时数据融合处理、实时分析检索、批量更新效率三大维度。Lindorm通过多模超融合架构,提供检索分析一体化、多引擎数据共享,分布式弹性扩展等能力,成为支撑新榜内容服务的核心引擎,助力客户在内容生态竞争中持续领跑。
华鼎冷链科技 × 阿里云瑶池数据库,打造全链路协同的智慧冷链新标杆
从 PolarDB 的高性能数据库服务到 AnalyticDB 的强大数据分析,阿里云提供的丰富产品矩阵为华鼎冷链科技构建了全面的解决方案,推动华鼎冷链科技从成本中心向效率中心转型。
让数据与AI贴得更近,阿里云瑶池数据库系列产品焕新升级
4月9日阿里云AI势能大会上,阿里云瑶池数据库发布重磅新品及一系列产品能力升级。「推理加速服务」Tair KVCache全新上线,实现KVCache动态分层存储,显著提高内存资源利用率,为大模型推理降本提速。
课时2:阿里云数据库:帮用户承担一切数据库风险
阿里云Apsara DB是国内首个通过国家等保三级安全标准的数据库,具备十项国际安全认证。它提供稳定、可靠的在线数据库服务,支持多种主流数据库类型,如MySQL、SQL Server等,覆盖70%市场。基于飞天操作系统和全SSD存储,Apsara DB性能卓越,帮助企业解决运维难题,并提供免费热迁移、自动化运维及顶级DBA专家服务,确保数据安全与高效管理。
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库

数据库

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等