【Cassandra生态】Cassandra强大的支持力量-商业&大公司&云&生态周边

本文涉及的产品
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云数据库 MongoDB,通用型 2核4GB
简介: 本文将梳理下Cassandra的商业公司、云公司、全球使用的大公司及相关生态的支持。另外有份资料表明,从事Cassandra职业的薪水非常可观,排名第五

引言

在本次 ApacheCon2019年的会议上,Cassandra的议题多达 30场次:https://www.apachecon.com/acna19/s/#/schedule?search=Cassandra,与最火的Spark类似。其它一些项目只有个位数的分享。
这么多的分享,背后必然有一个强大的生态社区,本文将梳理下Cassandra的商业公司、云公司、全球使用的大公司及相关生态的支持。另外有份资料表明,从事Cassandra职业的薪水非常可观,排名第五
948c50e265fed763bc137d5afd430b8c00d4da6c.png

商业公司

  • Datastax:https://www.datastax.com/,是一家位于加州的初创公司,提供了一个商业版本的Apache Cassandra数据库,公司目前已经接近1亿美元的融资。创始人也是Cassandra作者之一,是社区Cassandra较大贡献者。Datastax的Cassandra核心集成了Solr提供检索服务;另外集成Spark,与Cassandra一起搭配,提供流、存储、计算、机器学习一体化的存储计算分析服务。根据一些公开的资料,目前服务了较多世界500强的公司。
  • InstaClustr:提供了开源的Cassandra、ES、Spark、Kafka,并且以Cassandra为核心。Cassandra、ES、Spark、Kafka也被称之为新大数据4组件。
  • Thelastpickle:一家做Cassandra咨询的公司,公司也有不少的PMC及Committer。其开源了很多外围的工具,比如cassandra-reaper等,可以关注Thelastpickle的首页:https://thelastpickle.com
  • scylladb:支持CQL协议的,号称是C++版本的Cassandra,参考:https://www.scylladb.com
  • Strapdata:是cassandra + ES结合背后的商业公司,参考:https://www.strapdata.com/

这些商业公司,看起来也是分工合作,有的结合其他组件,有的提供工具,有的不断增强内核,共同把社区做大。

云公司

  • AWS:DynamoDB,本身Cassandra就是参考DynamoDB做的,社区也流行Cassandra就是DynamoDB的开源实现。因为AWS已经有DynamoDB,所以并没有支持Cassandra。不过AWS官方支持从Cassandra迁移到DynamoDB。另外一股潮流是 阿里云、Datastax、scylladb都在支持DynamoDB的协议。
  • Azure:CosmosDB,号称宇宙数据库,支持CQL的接口。
  • Google:Google面临跟AWS及Azure的竞争,他选择的路是直接与各大Paas的商业公司合作,比如:Datastax、Mongo等公司,也会提供Cassandra的支持。
  • 阿里云:在数据库的一方产品类别,直接提供原生的Cassandra服务,另外阿里云近期也重点在国内宣传Cassandra及积极贡献社区,是非常有诚意的,参考:https://www.aliyun.com/product/cds
  • 华为云:最近华为出了一个多模数据库,宣传是可以支持Cassandra与MongoDB
  • 腾讯云:貌似没有支持,不过迫于全球的云公司都对Cassandra有一定的支持,或许后续有一定的动作

全球较大使用Cassandra公司

具体可以参考文章:https://developer.aliyun.com/article/718156。根据不完全统计,在全球有超过10w公司在使用Cassandra,国内至少有5000家企业在使用。列举一些较大的使用的非云公司。(排除 阿里、华为、腾讯、京东等做云的公司)

与Cassandra结合的生态

image

  • Cassandra + Spark:Datastax维护的项目,目前有1000+的star。参考:https://github.com/datastax/spark-cassandra-connector。Cassandra从10年就开始跟Hadoop结合,后续Cassandra与Spark结合的更加紧密。
  • Cassandra + ES:https://www.elassandra.io/ es的每个节点放到了Cassandra的进程里面,同时提供CQL及ES api的接口
  • Cassandra + Kafka:支持把Kafka的数据直接写到Cassandra
  • Cassandra + RocksDB:RocksDB 与Cassandra同是Facebook开源的项目,两者做加法是天然的结合。CASSANDRA-13476目前也在推进之中,另外Facebook也开源了一个Cassandra与Rocksdb结合的项目Rocksandra
  • Cassandra + Datax:Datax是阿里开源的项目,阿里云Cassandra团队即将提交Patch支持Cassandra,包括MySQL写到Cassandra
  • Cassandra + Flink:Flink社区支持了Cassandra的connector,参考:https://github.com/apache/flink/tree/master/flink-connectors/flink-connector-cassandra
  • Cassandra + Spring:https://github.com/spring-projects/spring-data-cassandra ,支持spring写到Cassandra,此项目还是比较活跃的
  • Cassandra + Lucene:Lucene可以作为Cassandra本地二级索引。参考:https://github.com/Stratio/cassandra-lucene-index
  • Cassandra + JanusGraph:图数据库,JanusGraph支持以Cassandra为底座提供图服务
  • Cassandra + GeoMesa:时空数据库,GeoMesa支持以Cassandra为底座提供时空数据服务
  • Cassandra + KairosDB:时序数据库,KairosDB支持以Cassandra为底座提供时序服务
  • Cassandra + heroic:时序数据库,heroic支持以Cassandra为底座提供时序服务
  • thingsboard:物联网平台,仅仅支持Cassandra作为存储引擎
  • devicehive:物联网平台,支持Cassandra作为存储引擎

如果有其它的生态对接,欢迎反馈给社区~

总结

Cassandra背后的力量是很强大的,有全球最大的公司的支持,有数个商业公司支持,大部分的云都支持或者支持CQL语法,另外有数不清楚的其它生态的力量在跟Cassandra做加法。Cassandra真实火的不得了。希望后续Cassandra在 中国Cassandra技术社区、阿里云、各大公司、爱好者的推动下,火起来。 Cassandra你值得拥有~

入群邀约

为了营造一个开放的 Cassandra 技术交流环境,社区建立了微信群公众号和钉钉群,为广大用户提供专业的技术分享及问答,定期开展专家技术直播,欢迎大家加入。另外阿里云提供Cassandra试用:https://www.aliyun.com/product/cds
9e8c618e3543c4074a0506383d2f5ec7a50d8a8c.png

相关文章
|
5月前
|
机器学习/深度学习 分布式计算 大数据
开源大数据平台的发展
开源大数据平台的发展
66 0
|
7月前
|
运维 大数据 数据挖掘
SelectDB x 白鲸开源金融大数据解决方案正式发布!
飞轮科技联合白鲸开源,针对金融行业大数据实时分析的场景共同推出高效实用的解决方案。
|
11月前
|
存储 Cloud Native 关系型数据库
《云计算加速开源创新》——打造世界级云原生数据库开源社区(上)
《云计算加速开源创新》——打造世界级云原生数据库开源社区(上)
|
11月前
|
运维 Cloud Native 前端开发
《云计算加速开源创新》——打造世界级云原生数据库开源社区(下)
《云计算加速开源创新》——打造世界级云原生数据库开源社区(下)
|
SQL 分布式计算 运维
国产自研、安全、高可用——袋鼠云大数据基础平台EasyMR筑基企业数字化转型
俗话说 “基础不牢,地动山摇 “。大数据基础平台什么?是打地基的,是重中之重,地基扎得越深、打得越牢,上面的建筑才能越稳定。可以说,数字化转型的 “万丈高楼” 起于基础平台,具备自主可控的平台建设能力,是真正意义上一切的前提。 袋鼠云今年 7 月最新推出自研大数据基础平台 EasyMR,该产品提供 Hadoop、Hive、Spark、Trino、HBase、Kafka 等组件的自动化安装、中心化管理与集群监控告警功能,完全兼容 Apache 开源生态,支持企业级安全管控,一键开启 LDAP+Kerberos+Ranger 认证权限体系,以及提供一站式运维管理平台。
319 0
|
机器学习/深度学习 人工智能 运维
首届 TechoDay 腾讯技术开放日:云原生、大数据等基础产品一键配置,发布 7 款“轻量级”产品
首届 TechoDay 腾讯技术开放日:云原生、大数据等基础产品一键配置,发布 7 款“轻量级”产品
221 0
|
存储 人工智能 运维
7大openGauss商业版发布,共推规模落地行业核心场景
7大openGauss商业版发布,共推规模落地行业核心场景
198 0
7大openGauss商业版发布,共推规模落地行业核心场景
|
云安全 Cloud Native 架构师
PingCAP DevCon 2021:预见数据技术的未来生态
PingCAP DevCon 2021:预见数据技术的未来生态
151 0
PingCAP DevCon 2021:预见数据技术的未来生态
|
运维 资源调度 监控
SOFAStack背后的实践和思考:新一代分布式云PaaS平台,打造企业上云新体验
近几年云计算的发展如火箭般迅猛,异构变革日新月异,这是基础设施层明确的发展趋势。值得关注的是,随着基础设施的复杂度越来越高,也为整个基础设施的统一资源调度带来了极大挑战。在越来越复杂的异构基础设施上,存量应用和增量应用应该如何上云?面对大量异构基础设施带来的挑战,企业如何最大化上云价值?12月15日,在以“引领分布式云变革 助力湾区数字经济”为主题的全球分布式云大会上,蚂蚁集团数字科技事业部产品总监马振雄分享了在分布式云异构基础设施之上,蚂蚁集团在构建分布式云PaaS平台SOFAStack背后的实践和思考。
277 0
SOFAStack背后的实践和思考:新一代分布式云PaaS平台,打造企业上云新体验
|
运维 资源调度 监控
SOFAStack 背后的实践和思考|新一代分布式云 PaaS 平台,打造企业上云新体验
在越来越复杂的异构基础设施上,存量应用和增量应用应该如何上云?面对大量异构基础设施带来的挑战,企业如何最大化上云价值?
SOFAStack 背后的实践和思考|新一代分布式云 PaaS 平台,打造企业上云新体验