场景描述 客户基于ECS、IDC自建或在友商云平台自建了大数 据集群,为了降低企业大数据计算平台的成本,提高 大数据应用开发效率,更有效保障数据安全,把大数 据集群的数据、作业、调度任务以及业务数据库整体 迁移到MaxCompute和其他云产品。 解决的问题 自建Hadoop集群搬迁到MaxCompute 自建Hbase集群搬迁到云Hbase 自建Kafka或应用数据准实时同步到 MaxCompute 自建Azkaban任务迁移到Dataworks任务 产品列表 MaxCompute,Dataworks、云数据库Hbase版、Datahub、VPC,ECS。
在 MaxCompute改造后的任务执行规则如下:在每小时执行完任务 01_将 datahub表记录按小时汇总到 odps_apache_logs表 之 后,将表 datahub_dataconnector_apache_logs中前一个小时的日志记录,处理后的 结果插入到中间表 hbase_intermediate_table_job99_ip_statics中,后续使用数据集 成任务同步到云数据库 Hbase表 99_ip_...