场景描述 客户在IDC或者公有云环境自建Hadoop集群构 建数据仓库和分析系统,购买阿里云EMR集群之 后,涉及到将数据仓库和Hive元数据的数据库迁 移上云。目前主流Hive数据仓库迁移场景为1.x 版本迁移到阿里云EMR(Hive2.x版本),涉及到 数据订正更新步骤。 解决的问题 Hive数据仓库的数据迁移方案 Hive元数据库的迁移方案 Hive跨版本迁移后的数据订正 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
如果线下 IDC的 HDFS数据量在几十 TB甚至 PB级别,建议使用阿里云闪电立 方进行迁移。闪电立方详情请查看 https://www.aliyun.com/product/mgw 本实践方案采用 DistCp完成数据迁移之后,将给出迁移报告,如下图所示:在 EMR集群的 HDFS文件系统/user/hive目录下可以查看到相关的数据:1.查看目标文件夹下文件数量。su-...