场景描述 客户在IDC或者公有云环境自建Hadoop集群构 建数据仓库和分析系统,购买阿里云EMR集群之 后,涉及到将数据仓库和Hive元数据的数据库迁 移上云。目前主流Hive数据仓库迁移场景为1.x 版本迁移到阿里云EMR(Hive2.x版本),涉及到 数据订正更新步骤。 解决的问题 Hive数据仓库的数据迁移方案 Hive元数据库的迁移方案 Hive跨版本迁移后的数据订正 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
服务的改动 HiveServer2完全取代 HiveServer1 语法的兼容性 新增关键字和保留字(作为表名或列名需要加引号)Hive 2.0 COMMIT,ONLY,REGEXP,RLIKE,ROLLBACK,START Hive 2.1 CACHE,CONSTRAINT,FOREIGN,PRIMARY,REFERENCES Hive 2.2 DAYOFWEEK,EXTRACT,FLOOR,INTEGER,PRECISION,VIEWS 举例:在 Hive1.2.2版本中,regexp的语法...