本文介绍离线大数据场景使MaxCompute构建云 上近实时数仓,打通云下数据上云链路,解决数据复杂类型支持和动态分区问题,满足高级数据处理需求的最佳实践。 l混合云环境下,现有业务系统零改造,打通数据上云链路。 l使用UDF实现复杂数据类型转换和数据动态分区。 l使用DataWorks配置周期调度业务流程,数据自动入仓。 l借助MaxCompute优化计算引擎,实现降本增效。 产品列表 云服务器ECS 专有网络VPC 访问控制RAM 数据总线DataHub E-MapReduceEMR DataWorks 大数据计算服务MaxCompute
在数据投递正常的情况下,可以在分别在 Kafka集群、Datahub控制台 机 DataWorks控制台监控数据如仓至 MaxCompute的延时情况。进入消息队列 Kafka实例控制台。进入 topic message 文档版本:20240419 55 大数据近实时数据投递 MaxCompute 在 Topic的 Prometheus监控中可以看到消息从 EMR Kafka 到 云消息队列 Kafka 的延迟...