HybridDB for PostgreSQL(Greenplum)有哪些内核扩展-阿里云开发者社区

HybridDB for PostgreSQL(Greenplum)有哪些内核扩展

2017-08-29 3490

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生数据库 PolarDB MySQL 版，Serverless 5000PCU 100GB

对象存储 OSS，20GB 3个月

对象存储 OSS，恶意文件检测 1000次 1年

简介： [HybridDB for PostgreSQL](https://www.aliyun.com/product/gpdb) 是基于 Greenplum Database 开源数据库项目开发，由阿里云数据库内核团队深度扩展及优化，到目前为止，我们已经增加了许多功能性能，许多功能走在了社区的前面。

HybridDB for PostgreSQL 是基于 Greenplum Database 开源数据库项目开发，由阿里云数据库内核团队深度扩展及优化，到目前为止，我们已经增加了许多功能性能，许多功能走在了社区的前面。

OSS_EXT

OSS是阿里云对象存储产品，OSS_EXT功能打通了HybridDB for PostgreSQL和OSS数据通道，极大地方便用户将数据并行从OSS导入或导出到OSS，降低了上云门槛，并支持通过gzip进行OSS外部表文件压缩，大量节省存储空间及成本。我们测试的一个导入性能结果: 157G数据，16个节点，510秒导入完成，平均每个节点20M/s，节点数越多，导入越快详细使用链接

列存优化

Greenplum的列存储功能不仅可以节约表存储空间，而且基于一列或比较少的列计算时性能很好。当然也有不足，当含有条件查询时，如果不使用索引每次都会全表扫描，使用索引又会降低导入性能以及索引查询消耗大量IO。HybridDB for PostgreSQL列存优化的实现使列存储功能优势更加突出,主要优化在列存储数据中收集min、max元信息，并在查询中使用元信息过滤大量的数据块，没有索引的缺点，却能达到索引的性能，大部分场景可以用来替代索引。

Sortkey

Sortkey(排序键)可以让用户将数据按照顺序存储在磁盘文件中，排序键主要有两大优势，(1) 加速列存优化，收集的min、max元信息很少重叠，过滤性很好 (2) 对于含有order by和group by等需要排序的SQL可以避免再次排序，直接从磁盘中读取出来就是满足条件的有序数据。合理的使用分区键和排序键对于性能提升是非常有效的。HybridDB for PostgreSQL排序键

JSONB(即将推出)

json类型几乎已成为互联网及物联网的基础数据类型，越来越多的应用对json类型依赖，HybridDB for PostgreSQL除了支持json类型和json操作符外，即将推出jsonb功能，直接兼容PG 10.0 jsonb功能，丰富的操作符及函数，性能高于json。

Hyperloglog

HyperLogLog为互联网广告分析及有类似预估分析计算需求的行业提供解决方案，以便于快速预估 PV、UV 等业务指标。HybridDB for PostgreSQL深度融合Hyperloglog功能，两段式聚合实现，使Hyperloglog在用户的OLAP系统分析中发挥其强大的功能。详细使用链接

Library

对于复杂的分析系统，一条或者几条SQL难以满足用户的需求，Greenplum原生支持plpgsql实现UDF(用户自定义函数)，用户可以可以通过plpgsql存储过程实现复杂的SQL逻辑，然而对于学java或者python的程序猿简直要命，plpgsql太难写了。。怎么办？HybridDB for PostgreSQL支持Java UDF，用户只需要把本地实现的jar包通过create library命令就可以导入到HybridDB中，import一下就可以享用了。Library详细使用链接
 JAVA UDF详细使用链接

其他

MADLIB，POSTGIS，稳定性增强、BUG修复等，欢迎使用HybridDB for PostgreSQL

相关实践学习

使用PolarDB和ECS搭建门户网站

本场景主要介绍基于PolarDB和ECS实现搭建门户网站。

阿里云数据库产品家族及特性

阿里云智能数据库产品团队一直致力于不断健全产品体系，提升产品性能，打磨产品功能，从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手，打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系，结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台，为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案，提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。

HybridDB for PostgreSQL(Greenplum)有哪些内核扩展

OSS_EXT

列存优化

Sortkey

JSONB(即将推出)

Hyperloglog

Library

其他

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像