hive数据迁移

简介: 比如需要把生产的hive集群数据迁移到另一个集群,hive提供了2个命令工具,可以实现表的批量迁移。[export/import]设置默认需要导出的hive数据库在hive目录/etc/alternatives/hive-conf下添加.hivercvi ~/.hivercuse test;创建数据临时目录hdfs dfs -mkdir /tmp/

比如需要把生产的hive集群数据迁移到另一个集群,hive提供了2个命令工具,可以实现表的批量迁移。

[export/import]

  • 设置默认需要导出的hive数据库
在hive目录/etc/alternatives/hive-conf下添加.hiverc
vi ~/.hiverc
use test;
  • 创建数据临时目录
hdfs dfs -mkdir /tmp/test
  • 生成导出数据脚本
hive -e "show tables " | awk '{printf "export table %s to |/tmp/hive-export/%s|;\n",$1,$1}' | sed "s/|/'/g" > /home/hive/qcf/export.hql
  • 手工导出数据到hdfs
hive -f export.hql

- 下载hdfs数据到本地并传送到目标hadoop集群的/tmp/ test 目录 先get到本地:

hdfs dfs -get /tmp/ test /*
  • 然后put到目标集群上
hdfs dfs -put * /tmp/test
  • 构造导入语句
cp export.sql import.sql
sed -i 's/export table/import table/g' import.sql
sed -i 's/ to / from /g' import.sql
  • 导入数据
在hive目录/etc/alternatives/hive-conf下添加.hiverc
vi ~/.hiverc
use test;
hive -f import.sql  
目录
相关文章
|
分布式数据库 数据库 Hbase
|
5月前
|
SQL 分布式计算 Hadoop
Hive部署
Hive部署
72 0
|
3月前
|
SQL 分布式计算 关系型数据库
Sqoop数据导入到Hive表的最佳实践
Sqoop数据导入到Hive表的最佳实践
|
3月前
|
存储 缓存 分布式数据库
HBase的数据迁移是如何进行的?
HBase的数据迁移是如何进行的?
23 0
|
4月前
|
SQL 分布式计算 MaxCompute
Apache Flink目前不支持直接写入MaxCompute,但是可以通过Hive Catalog将Flink的数据写入Hive表
Apache Flink目前不支持直接写入MaxCompute,但是可以通过Hive Catalog将Flink的数据写入Hive表
59 3
|
8月前
|
SQL 存储 大数据
关于数据仓库的Hive的Hive架构的MetaStore元数据服务
随着大数据技术的不断发展,数据仓库成为了企业中不可或缺的一部分。而Hive作为一种开源的数据仓库系统,因其易于使用和高效处理等特点,成为了许多企业的首选。然而,对于普通用户来说,直接使用Hive的命令行工具进行操作并不方便。因此,开发者社区中涌现出了大量的Hive GUI工具,其中最为流行的就是Web GUI工具。
209 2
|
SQL 分布式计算 HIVE
|
存储 分布式计算 Hadoop
Hbase 数据迁移闭坑指南
Hbase 数据迁移闭坑指南
490 0
|
SQL 存储 数据库
Hive简介、什么是Hive、为什么使用Hive、Hive的特点、Hive架构图、Hive基本组成、Hive与Hadoop的关系、Hive与传统数据库对比、Hive数据存储(来自学习资料)
1.1 Hive简介 1.1.1   什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 1.1.2   为什么使用Hive Ø  直接使用hadoop所面临的问题 人员学习成本太高 项目周期要求太短 MapReduce实现复杂查询逻辑开发难度太大   Ø  为什么要使用Hive 操作接口采用类SQ
26068 0
|
SQL 分布式计算 DataWorks
Hive 数据如何同步至 MaxCompute|学习笔记
快速学习 Hive 数据如何同步至 MaxCompute
265 0
Hive 数据如何同步至 MaxCompute|学习笔记