图数据库爱好者的聚会在谈论什么?

简介: 上周六,一群图数据库爱好者聚集在 Nebula Graph 总部,谈论了图数据库的…

Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。

聚会概述

在上周六的聚会中,Nebula Graph Committer 吴敏给爱好者们介绍了整体架构和特性,并随后被各位大佬轮番蹂躏(划掉)。

image.png

本次分享主要介绍了 Nebula Graph 的特性,以及新上线的《使用 Docker 构建 Nebula Graph》功能。

下面是现场的 Topic ( 以下简称:T ) & Discussion ( 以下简称:D ) 速记:

讨论话题目录

  • 算法和语言

    • 图库的 builtin 只搞在线查询可以吗?有必要搞传播算法和最短路径吗?Nebula 怎么实现对图分析算法的支持?
    • 为什么要新开发一种查询语言 nGQL?做了哪些优化?
    • 对于超大点,有啥优化的办法吗,或者对于构图有什么建议嘛?
    • 图库相比其它系统和数据库未来发展趋势,比如相比文档和关系型,它的核心价值是什么?
  • 架构和工程

    • key 为什么选择用 hash 而不是 range?
    • gRPC,bRPC,fbthrift 为什么这么选 rpc?有没有打算自己写一个?
    • 图库在设计上趋同化和同质化,架构上还有哪些创新值得尝试?
  • 关于生态

    • 图的生态怎么打造?和周边其它系统怎么集成融合?

算法和语言

T: 图库的 builtin 只搞在线查询可以吗?有必要搞传播算法和最短路径吗?Nebula 怎么实现对图分析算法的支持?

️D:Nebula 目前阶段侧重 OLTP,现在支持的算法是 全路径 和 最短路径 。在图库 builtin LPA 有不少工作要做(当然其实市面上也有产品),Nebula 现阶段的考虑是采用 存储计算分离架构 ,用户可以将图结构或者子图抽取到 GraphX 这种图计算框架,在图计算框架中实现传播算法。如果 OLTP 这块工作完成比较多了,再考虑向 OLAP 这个方向走。

T:为什么要新开发一种查询语言 nGQL?做了哪些优化?

️ D:其实目前市场上没有统一的图查询语言,可能 Cypher 和 Gremlin 影响力要大一些,当然要说图语言类的其实更多,比如还有 GraphQL,SPARQL。nGQL 与 SQL 接近,比较容易上手,但不用 SQL 那样嵌套(embedding)。

我感觉描述性的语言,大家的总体风格还是挺类似的,上手学习成本其实真没有想象那么高,花个十几分钟看看大概也明白了。有点类似中国各地方言(温州话除外,划掉),或者欧洲的各语言,共通的部分挺多的,连蒙带猜基本也能用。当然特别复杂的逻辑还是得看看手册才行。

优化方面:为避免存储层将过多数据回传到计算层,占用宝贵带宽,Nebula 做了 计算下沉 ,条件过滤会随查询条件一同下发到存储层节点。如果不带这个过滤,传 100% 和 1% 的数据,性能是数量级的差异。

对图查询的执行计划优化也进行了一定的探索,包括 执行计划缓存 和上下文无关语句的 并发执行 。当然其实查询优化挺难做的,我感觉 更能有效提升速度的是如何构图 。因为图的自由度还是挺大的,同一个东西,其实既可以构图成点、边也可以做成属性,其实对大多数目前的使用者来说,构图对性能的影响应该会比 DB 优化更明显更快。当然构图其实是和 DB 怎么实现也挺有关系的,比如减少网络传输(比如过滤)、用好 SSD 和 cache(比如减少随机读)、增加各种并发(多线程、多机)。

还有不要构造一个超大点出来,不然热点太明显了。回到语言,我们也考虑是不是 nGQL 上面加一层 Driver 支持 Cypher 和 Gremlin,比如 80% 的常见功能。还有就是考虑在 webconsole 上增加一些流程图的功能模块,CRUD 操作用图形化支持,复杂的就写 query,对长尾用户上手也有帮助。

T:刚才聊到超大点,有啥优化的办法吗,或者对于构图有什么建议嘛?

️ D:对于超大点建议还是构图和查询时,想办法处理(分解)比较好,这个和 SQL 分库分表差不多。比如:遍历过程中 touch 到的交易对手很大(比如:美团),那最好能给这种大点打标,遍历时候过滤掉。当然打标可能要离线 count 一下才知道。

比方说,根据业务类型、时间片段,把一个超大点最好能拆成多个小点,这样操作点一般不会落在一个 partition 上,再把当中热点的 partition 迁移到不同的机器上。举例来说,遍历太深的话,通常性能都不会太好,所以可以把属性放在起点和终点上。像 (Subject1)->(Predicate1)->(Object1)  这样, (Subject1)、(Predicate1)、(Object1) 三个节点,两跳深度,可能要走一次网络,但改成 (Subject1)-[Predicate1]->(Object1)  这样 -[Predicate1]->  改成一种类型的边,那就不走网络,特别当查询深度更深时,这种构图对性能优化很明显。类似的,还有属性值处理,如:起点的 Name(string),不要作为边属性,不然同一个点出去的所有边上都冗余了这个 Name(string),更新的时候也巨麻烦。

T:图库相比其它系统和数据库未来发展趋势,比如相比文档和关系型,它的核心价值是什么?

️ D: Everything is connected. 图数据库天生适合表达 connection,或者说多对多的关系。

图数据库可以很高效的查询几度关系,而传统关系型数据库不擅长,一般都需要做表连接,表连接是一个很昂贵的操作,涉及到大量的 IO 操作及内存消耗。

但我觉得其实文档、关系和图相互还是借鉴非常多的,我记得《DesigningData-Intensive Applications》里面有章就是做它们之间的比较。

架构和工程

T:key 为什么选择用 hash 而不是 range?

️ D:其实并不是一定要 hash,只是要求 vid 是定长的 64 bit。定长主要是出于对齐性能考虑,还可以用上 prefix bloomfilter。那么变长 id 一般 hash 成 64 bit 最简单,当然用户自己指定 vid 也是支持的,一般这个时候,需要把原始 id 放到点的属性里。

T:gRPC,bRPC,fbthrift 为什么这么选 rpc?有没有打算自己写一个?

️ D:从使用体验上看,fbthrift 易读性不错。gRPC 之前用过也挺多。当然写个好的 rpc 还是挺不容易的,这个轮子暂时不是很急迫。

T:图库在设计上趋同化和同质化,架构上还有哪些创新值得尝试?

️ D:其实图产品有很多,我觉得这些产品不能说都是趋同,毕竟从几个知名竞品的架构看,彼此之间相差还是蛮大的 :)。因为功能集和架构出发点主要还是针对业务目标,Nebula 设计目标是实现 万亿级别关联关系 和 大并发 低时延 ,所以选择了存储计算分离,存储层采用 raft 一致协议,数据 partition 到不同机器上。这样设计主要考虑到存储和计算两者的业务特点和增长速度不一样,比如 learner 可以拿来给一些 throughput 优先的场景使用,原集群给 latency 优先的场景使用。

说到大的架构创新,主要看长期的硬件更新速度。当然 DB 可做的优化的事情已经很多的,刚才 PPT 里面有提及。

T:在测试方面,Nebula 做了哪些工作?

️ D:一个是集成测试框架,包括 混沌工程 、 错误注入 这些,等完善之后也会开放出来。还有是关于测试集和数据集,对于 DB 来说,这部分的价值是最大的,不过图领域可参考的数据集较少,都是大家自己积累的。

关于生态

T:图的生态怎么打造?和周边其它系统怎么集成融合?

️ D:在查询语言方面,增加对 Gremlin、Cypher 的支持。

在工具方面,提供数据批量导入和导出的工具,比如 GraphX,Yarn,Spark 等。还有,就是对机器学习的需求支持,存储计算相分离的架构使得 Nebula 非常容易集成图计算框架。因为 Nebula 是开源产品,这些工具欢迎大家一起参与:)

Nebula Graph:一个开源的分布式图数据库。

GitHub:https://github.com/vesoft-inc/nebula

官方博客:https://nebula-graph.io/cn/posts/

微博:https://weibo.com/nebulagraph

相关实践学习
阿里云图数据库GDB入门与应用
图数据库(Graph Database,简称GDB)是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。 GDB由阿里云自主研发,具备如下优势: 标准图查询语言:支持属性图,高度兼容Gremlin图查询语言。 高度优化的自研引擎:高度优化的自研图计算层和存储层,云盘多副本保障数据超高可靠,支持ACID事务。 服务高可用:支持高可用实例,节点故障迅速转移,保障业务连续性。 易运维:提供备份恢复、自动升级、监控告警、故障切换等丰富的运维功能,大幅降低运维成本。 产品主页:https://www.aliyun.com/product/gdb
目录
相关文章
|
6月前
技术人修炼之道阅读笔记(三)顶级工程师行为准则
技术人修炼之道阅读笔记(三)顶级工程师行为准则
|
存储 弹性计算 分布式计算
科普达人丨一文弄懂什么是云计算?
云计算的定义、分类,以及发展历程。
科普达人丨一文弄懂什么是云计算?
|
Ubuntu Linux 开发者
90 后开源老司机徐亮:从大学开始全职做开源是一种怎样的体验?
  “如果你有正确的态度,有趣的事情自然会找到你。”   Eric S. Raymond 在被奉为“开源运动独立宣言”的《大教堂与集市》一文中,总结了 19 条在开源开发中非常有用的理论,上面是其中一条。开源项目总会在不经意间升级,参与者可能最初只是做一些小打小闹的贡献,后来逐步维护越来越重要、越来越多的代码,甚至是负责整个程序。在一个鼓励代码共享的软件文化中,这是一种很自然的项目演化方式。   徐亮在开源社区的经历也遵循着同样的演化路径。从一开始因为兴趣入圈、负责翻译工作,到后来成为Ubuntu、Debian资深官方开放人员,甚至把开源变成一份全职工作,今年已经是徐亮与开源结缘的第 12
374 0
|
Cloud Native 前端开发 测试技术
浪迹天涯的骨灰级开源爱好者——对话阿里云 MVP吴晟
吴晟是我见过最“浪”的程序员,喜欢买买买,热爱公路自驾。格子间拘不住他向往自由的灵魂,七大洲才能承载他追逐梦想的印记。作为SkyWalking创始人的吴晟,远不止诗与远方齐飞的魅力。
浪迹天涯的骨灰级开源爱好者——对话阿里云 MVP吴晟
|
数据库 关系型数据库 MySQL
|
机器学习/深度学习 人工智能 算法
【云周刊】第170期:技术人生-看90后如何逆袭,从实习生成长为阿里云分布式NoSQL领域专家
【技术人生】看90后如何逆袭,从实习生成长为阿里云分布式NoSQL领域专家,【超级干货】突破自我,—文看尽DataWorks全新升级以及在城市大脑的广泛应用,【超级干货】突破自我,—文看尽DataWorks全新升级以及在城市大脑的广泛应用 ! ...更多精彩内容,尽在云周刊!
4483 0