HybridDB for PostgreSQL(Greenplum)有哪些内核扩展

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
简介: [HybridDB for PostgreSQL](https://www.aliyun.com/product/gpdb) 是基于 Greenplum Database 开源数据库项目开发,由阿里云数据库内核团队深度扩展及优化,到目前为止,我们已经增加了许多功能性能,许多功能走在了社区的前面。

HybridDB for PostgreSQL 是基于 Greenplum Database 开源数据库项目开发,由阿里云数据库内核团队深度扩展及优化,到目前为止,我们已经增加了许多功能性能,许多功能走在了社区的前面。

OSS_EXT

OSS是阿里云对象存储产品,OSS_EXT功能打通了HybridDB for PostgreSQL和OSS数据通道,极大地方便用户将数据并行从OSS导入或导出到OSS,降低了上云门槛,并支持通过gzip进行OSS外部表文件压缩,大量节省存储空间及成本。我们测试的一个导入性能结果: 157G数据,16个节点,510秒导入完成,平均每个节点20M/s,节点数越多,导入越快 详细使用链接

列存优化

Greenplum的列存储功能不仅可以节约表存储空间,而且基于一列或比较少的列计算时性能很好。当然也有不足,当含有条件查询时,如果不使用索引每次都会全表扫描,使用索引又会降低导入性能以及索引查询消耗大量IO。HybridDB for PostgreSQL列存优化的实现使列存储功能优势更加突出,主要优化在列存储数据中收集min、max元信息,并在查询中使用元信息过滤大量的数据块,没有索引的缺点,却能达到索引的性能,大部分场景可以用来替代索引。

Sortkey

Sortkey(排序键)可以让用户将数据按照顺序存储在磁盘文件中,排序键主要有两大优势,(1) 加速列存优化,收集的min、max元信息很少重叠,过滤性很好 (2) 对于含有order by和group by等需要排序的SQL可以避免再次排序,直接从磁盘中读取出来就是满足条件的有序数据。合理的使用分区键和排序键对于性能提升是非常有效的。HybridDB for PostgreSQL排序键

JSONB(即将推出)

json类型几乎已成为互联网及物联网的基础数据类型,越来越多的应用对json类型依赖,HybridDB for PostgreSQL除了支持json类型和json操作符外,即将推出jsonb功能,直接兼容PG 10.0 jsonb功能,丰富的操作符及函数,性能高于json。

Hyperloglog

HyperLogLog为互联网广告分析及有类似预估分析计算需求的行业提供解决方案,以便于快速预估 PV、UV 等业务指标。HybridDB for PostgreSQL深度融合Hyperloglog功能,两段式聚合实现,使Hyperloglog在用户的OLAP系统分析中发挥其强大的功能。详细使用链接

Library

对于复杂的分析系统,一条或者几条SQL难以满足用户的需求,Greenplum原生支持plpgsql实现UDF(用户自定义函数),用户可以可以通过plpgsql存储过程实现复杂的SQL逻辑,然而对于学java或者python的程序猿简直要命,plpgsql太难写了。。怎么办?HybridDB for PostgreSQL支持Java UDF,用户只需要把本地实现的jar包通过create library命令就可以导入到HybridDB中,import一下就可以享用了。Library详细使用链接
JAVA UDF详细使用链接

其他

MADLIB,POSTGIS,稳定性增强、BUG修复等,欢迎使用HybridDB for PostgreSQL

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
相关文章
|
3月前
|
Cloud Native 关系型数据库 分布式数据库
掌阅科技采用云原生数据库PolarDB,大幅降低使用成本,提升业务稳定性和扩展性
掌阅科技将数据库迁移到PolarDB后,数据压缩到之前的30%,整体成本节省50%。
101 0
|
6月前
|
存储 NoSQL 关系型数据库
PostgreSQL列存扩展hydra简单测试
Hydra是一款PostgreSQL的扩展,为PostgreSQL增加了列存引擎,使得PostgreSQL的olap性能大幅提升,本文介绍Hydra基本的使用方法。
712 0
|
7月前
|
SQL 关系型数据库 分布式数据库
数据库内核那些事|细说PolarDB优化器查询变换:IN-List变换
本篇文章将对PolarDB的IN-List变换进行深入阐述,从而让我们对PolarDB的查询改写能力有更感性的认知。
|
7月前
|
关系型数据库 MySQL 分布式数据库
|
5月前
|
SQL 关系型数据库 分布式数据库
数据库内核那些事|细说PolarDB优化器查询变换:IN-List变换
数据库内核那些事|细说PolarDB优化器查询变换:IN-List变换
104 0
|
6月前
|
存储 安全 关系型数据库
PostgreSQL物化视图增量更新扩展 -- pg_ivm
PostgreSQL不支持物化视图增量更新,需要定期执行REFRESH MATERIALIZED VIEW命令刷新物化视图。Incremental View Maintenance (IVM)是一种使物化视图保持最新的方法,其中只计算增量更改并将其应用于视图,而不是REFRESH MATERIALIZED VIEW那样从头开始重新计算内容。当只更改视图的一小部分时,IVM可以比重新计算更高效地更新物化视图。
470 0
|
5月前
|
关系型数据库 PostgreSQL
PostgreSQL pg_orphaned扩展
由于种种原因,PostgreSQL可能会产生一些孤儿文件,这些文件会占用磁盘空间,手工查找费时费力还容易出错,pg_orphaned扩展很好的解决了这个问题。
1300 5
|
2月前
|
SQL 存储 关系型数据库
Mysql内核查询成本计算
Mysql内核查询成本计算
|
6月前
|
SQL 关系型数据库 Go
《增强你的PostgreSQL:最佳扩展和插件推荐》
《增强你的PostgreSQL:最佳扩展和插件推荐》
416 0
|
2月前
|
SQL 关系型数据库 分布式数据库