本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
选择受信服务:大数据计算服务 接下来,创建自定义权限策略 步骤1 在权限策略管理页面,单击创建权限策略。步骤2 设置策略名称,选择脚本配置模式,输入自定义策略,单击确定。基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测 自定义权限策略:{"Version":"1","Statement":[{"Action":["oss:ListBuckets","oss:...