场景描述 客户基于ECS、IDC自建或在友商云平台自建了大数 据集群,为了降低企业大数据计算平台的成本,提高 大数据应用开发效率,更有效保障数据安全,把大数 据集群的数据、作业、调度任务以及业务数据库整体 迁移到MaxCompute和其他云产品。 解决的问题 自建Hadoop集群搬迁到MaxCompute 自建Hbase集群搬迁到云Hbase 自建Kafka或应用数据准实时同步到 MaxCompute 自建Azkaban任务迁移到Dataworks任务 产品列表 MaxCompute,Dataworks、云数据库Hbase版、Datahub、VPC,ECS。
如 1TB 数据规模的 TPC-DS,MaxCompute 比 Spark 快 28%,比 Hive 快 76%,比 Impala 快 7%。低成本:相比自建降低 30%以上成本。安全:原生的多租户系统,以项目进行隔离,所有计算任务在安全沙箱中运行。文档版本:20210723 2 自建Hadoop迁移MaxCompute 前置条件 前置条件 在进行本文操作之前,您需要完成以下准备工作:拥有...