场景描述 客户在IDC或者公有云环境自建Hadoop集群构 建数据仓库和分析系统,购买阿里云EMR集群之 后,涉及到将数据仓库和Hive元数据的数据库迁 移上云。目前主流Hive数据仓库迁移场景为1.x 版本迁移到阿里云EMR(Hive2.x版本),涉及到 数据订正更新步骤。 解决的问题 Hive数据仓库的数据迁移方案 Hive元数据库的迁移方案 Hive跨版本迁移后的数据订正 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
使用下令命令对转储文件中的 Location信息进行订正:首先备份一下原始转储文件 cp hive_databases.sql hive_databases_for_emr.sql 使用 sed命令替换转储文件中的 Location相关信息,其中蓝色字体和红色字体内 容可以在步骤 2中分别查看到:sed-i"s/master:9000/emr-header-1.cluster-150561:9000/g"hive_databases_for_emr...