本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
机器学习PAI E-MapReduceEMR 最佳实践频道 对象存储OSS http://bp.aliyun.com 日志服务SLS 阿里云最佳实践分享群 云速搭CADT 钉钉搜索钉群号31852400入群 微服务引擎MSE用户交流群 钉钉搜索钉群号43525005207入群云服务器ECS(产品名称)文档模板(手册名称)/文档版本信息 基于湖仓一体架构使用MaxCompute...