本文介绍离线大数据场景使MaxCompute构建云 上近实时数仓,打通云下数据上云链路,解决数据复杂类型支持和动态分区问题,满足高级数据处理需求的最佳实践。 l混合云环境下,现有业务系统零改造,打通数据上云链路。 l使用UDF实现复杂数据类型转换和数据动态分区。 l使用DataWorks配置周期调度业务流程,数据自动入仓。 l借助MaxCompute优化计算引擎,实现降本增效。 产品列表 云服务器ECS 专有网络VPC 访问控制RAM 数据总线DataHub E-MapReduceEMR DataWorks 大数据计算服务MaxCompute
上传的方式可以使用 odpscmd工具进行资源提交,也可以使用 DataWorks提交。本实践中使用 DataWorks提交资源。操作步骤 下载预打包的 UDTF JAR包。本实践中示例的 UDTF已预打包,通过以下命令下载到本地电脑中:git clone https://best-practice:Abcd123456@codeup.aliyun.com/best- practice/bp/166.git 回到 Dataworks默认...