本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
付费基础版/1个月 其他参考默认配置 s MaxCom 需要新建工作空间 基于模版新建 按量付费 pute 分别为:dlf_mc_01、dlf_mc_02 机器学习 按量付费 使用MC的SQL完成机器学习 基于模版新建 PAI 工作空间:dlf_ins 日志存在在SLS基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测 1.1.配置数据湖构建服务 步骤1登录DLF控制台...