开源大数据周刊-第46期-阿里云开发者社区

开源大数据周刊-第46期

2017-03-23 2462

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

阿里云E-MapReduce实践

云HBase建设之开篇
阿里云云HBase团队在2月份推出了云HBase产品，此款产品的内核在集团内部已经使用了6年之久，那么跟社区版本的HBase有怎样的区别，我们又做了怎样的产品化，本系列将会为用户详细介绍这些点。

资讯

自助式大数据分析时代正在来临
对于大数据而言，更多企业和机构在存储和处理各种形态和规模的数据，并从中提取有价值的信息。Gartner在其2017年《商业智能和分析平台魔力象限》中提到的Tableau预测：随着数据管控和保护系统以及大数据分析系统的日趋成熟，人们将要迎来自助式大数据分析时代。
云计算与移动化成为新型智慧城市"助推器"
在今年两会上，智慧城市成为一个高频词。两会代表指出：新型智慧城市已经成为未来城市进化的方向，要充分利用云计算、大数据等新一代信息技术，形成具备可持续、内生动力的安全、便捷、高效、绿色的智慧宜居新形态。那么，在推动新型智慧城市落地方面，需要具备哪些关键的能力呢？
告别盲目建设大数据，国家即将出台两项大数据重要标准
企业用户如何避免在大数据建设中“东一榔头西一锤子”？或者完全被厂商牵着鼻子走？如何能真正获取大数据的价值？这都是企业用户在大数据建设中真正关注的问题。现在，能帮助企事业机构更系统、更科学地建设和使用大数据的参考标准来了。
（技术）SparkSQL的3种Join实现
Join是SQL语句中的常用操作，良好的表结构能够将数据分散在不同的表中，使其符合某种范式，减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。SparkSQL作为大数据领域的SQL实现，自然也对Join操作做了不少优化，今天主要看一下在SparkSQL中对于Join，常见的3种实现。
（技术）Hadoop生态安全管理框架Apache Ranger升级为顶级项目
Apache Hadoop生态系统中的安全管理框架Apache Ranger晋升为顶级项目。Range是一种定义和管理安全策略的集中式组件，这些安全策略在受支持的Hadoop组件间强制执行，包括Apache HBase、Hadoop（HDFS和YARN）、Apache Hive、Apache Kafka、Apache Solr等。
（技术）获得PCC性能大赛背后的RocksDB引擎:5分钟全面了解其原理
在 3 月 4 日举办的高可用架构 PCC 性能挑战赛上（PCC 是 Performance Challenge Championship 的缩写），以 RocksDB 为存储的队伍获得了显著的优势。在另外一方面，RocksDB 被存储相关架构师在各种讨论中反复提及，高可用架构翻译了官方的 rocksdb 基础说明，让读者 5 分钟可以全面了解。PCC 大赛的获奖作品将会另文介绍。。
（技术）Apache Kylin - 大数据时代的OLAP利器
ApacheKylin 是一个Hadoop生态圈下的MOLAP系统，是eBay大数据部门从2014年开始研发并开源的支持TB到PB级别数据量的分布式OLAP分析引擎。

欢迎加入阿里云开源大数据交流钉钉群

screenshot

国内大数据相关会议

| 会议 | 地点 | 时间 | 费用 |

版权声明

信息都是来自互联网，都给出了原文的链接，如果侵权，请联系我们，我们负责删除。

阿里云E-Mapreduce团队出品

相关实践学习

简单用户画像分析

本场景主要介绍基于海量日志数据进行简单用户画像分析为背景，如何通过使用DataWorks完成数据采集、加工数据、配置数据质量监控和数据可视化展现等任务。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

开源大数据周刊-第46期

阿里云E-MapReduce实践

资讯

欢迎加入阿里云开源大数据交流钉钉群

国内大数据相关会议

版权声明

开源大数据平台 E-MapReduce

热门文章

最新文章

相关课程

相关电子书

相关实验场景