【译】Delta Lake 0.4.0 新特性演示:使用 Python API 就地转换与处理 Delta Lake 表

开源大数据EMR 2019-10-12

阿里云EMR

编译:陈强,花名无咎,阿里巴巴技术专家,目前专注于EMR产品的管控与数据治理的研发工作。


我们激动地宣布 Delta Lake 0.4.0 发布,本次发布包含操纵与管理 Delta Lake 表的 Python API。关键特性包括:

  • Python APIs for DML and utility operations (#89) - 现在,您可以使用 Python API 更新、删除、合并 Delta Lake 表,并对表执行实用操作(即:vacuum,history)。这个特性对于使用Python进行复杂工作非常有用,例如:渐变维度(SCD)操作,合并重复变化数据流式查询中执行upserts。查看文档了解更多详情。
  • Convert-to-Delta (#78) – 您可以就地转换 Parquet 表到 Delta Lake 表,而


登录 后评论
下一篇
云栖号
8415人浏览
2020-03-04
相关推荐
0
0
0
2248