备案控制台

开发者社区

开发者社区大数据文章正文

hive数据迁移

2016-08-22 6099

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 比如需要把生产的hive集群数据迁移到另一个集群，hive提供了2个命令工具，可以实现表的批量迁移。[export/import]设置默认需要导出的hive数据库在hive目录/etc/alternatives/hive-conf下添加.hivercvi ~/.hivercuse test;创建数据临时目录hdfs dfs -mkdir /tmp/

比如需要把生产的hive集群数据迁移到另一个集群，hive提供了2个命令工具，可以实现表的批量迁移。

[export/import]

设置默认需要导出的hive数据库

在hive目录/etc/alternatives/hive-conf下添加.hiverc
vi ~/.hiverc
use test;

创建数据临时目录

hdfs dfs -mkdir /tmp/test

生成导出数据脚本

hive -e "show tables " | awk '{printf "export table %s to |/tmp/hive-export/%s|;\n",$1,$1}' | sed "s/|/'/g" > /home/hive/qcf/export.hql

手工导出数据到hdfs

hive -f export.hql

- 下载hdfs数据到本地并传送到目标hadoop集群的/tmp/ test 目录先get到本地：

hdfs dfs -get /tmp/ test /*

然后put到目标集群上

hdfs dfs -put * /tmp/test

构造导入语句

cp export.sql import.sql
sed -i 's/export table/import table/g' import.sql
sed -i 's/ to / from /g' import.sql

导入数据

在hive目录/etc/alternatives/hive-conf下添加.hiverc
vi ~/.hiverc
use test;
hive -f import.sql

文章标签：

SQL

数据库

HIVE

Perl

分布式计算

Hadoop

秦超峰

目录

相关文章

游客wkxim4agoo6le

|

分布式数据库数据库 Hbase

HBase数据迁移详解！

笔记

游客wkxim4agoo6le

686 0 0

syst1_m

|

5月前

|

SQL 分布式计算 Hadoop

Hive部署

syst1_m

72 0 0

晓之以理的喵~~

|

3月前

|

SQL 分布式计算关系型数据库

Sqoop数据导入到Hive表的最佳实践

Sqoop数据导入到Hive表的最佳实践

晓之以理的喵~~

103 0 0

极客李华

|

3月前

|

存储缓存分布式数据库

HBase的数据迁移是如何进行的？

HBase的数据迁移是如何进行的？

极客李华

23 0 0

sunrr

|

4月前

|

SQL 分布式计算 MaxCompute

Apache Flink目前不支持直接写入MaxCompute，但是可以通过Hive Catalog将Flink的数据写入Hive表

Apache Flink目前不支持直接写入MaxCompute，但是可以通过Hive Catalog将Flink的数据写入Hive表

sunrr

59 3 3

安然AR

|

8月前

|

SQL 存储大数据

关于数据仓库的Hive的Hive架构的MetaStore元数据服务

随着大数据技术的不断发展，数据仓库成为了企业中不可或缺的一部分。而Hive作为一种开源的数据仓库系统，因其易于使用和高效处理等特点，成为了许多企业的首选。然而，对于普通用户来说，直接使用Hive的命令行工具进行操作并不方便。因此，开发者社区中涌现出了大量的Hive GUI工具，其中最为流行的就是Web GUI工具。

安然AR

209 2 4

1164785282151388

|

SQL 分布式计算 HIVE

如何将阿里云EMR中的Hive表数据迁移为Iceberg表？

Hive表如何迁移到Iceberg表

1164785282151388

793 1 1

857技术社区

|

存储分布式计算 Hadoop

Hbase 数据迁移闭坑指南

Hbase 数据迁移闭坑指南

857技术社区

490 0 0

涂作权

|

SQL 存储数据库

Hive简介、什么是Hive、为什么使用Hive、Hive的特点、Hive架构图、Hive基本组成、Hive与Hadoop的关系、Hive与传统数据库对比、Hive数据存储（来自学习资料）

1.1 Hive简介 1.1.1 什么是Hive Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。 1.1.2 为什么使用Hive Ø 直接使用hadoop所面临的问题人员学习成本太高项目周期要求太短 MapReduce实现复杂查询逻辑开发难度太大 Ø 为什么要使用Hive 操作接口采用类SQ

涂作权

26068 0 0

学堂小助手

|

SQL 分布式计算 DataWorks

Hive 数据如何同步至 MaxCompute|学习笔记

快速学习 Hive 数据如何同步至 MaxCompute

学堂小助手

265 0 0

Hive 数据如何同步至 MaxCompute|学习笔记

热门文章

最新文章

理解事务的4种隔离级别

疑犯追踪第一季/全集Person Of Interest迅雷下载

简单实用的数据建模工具PDManer

详细讲解！Canal+Kafka实现MySQL与Redis数据同步！

71.7. Script for automatic startup on boot

关于Oracle客户端显示乱码问题

PHPWAMP站点管理的“域名模式”和“端口模式”详解、均支持自定义

学校里学不到的东西(一)

Python 3 教程一:入门

Python的装饰器

R语言用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据

数据分享|R语言用logistic逻辑回归和AFRIMA、ARIMA时间序列模型预测世界人口

【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享（下）

【视频】马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享（上）

数据分享|数据探索电商平台用户行为流失可视化分析

电商平台数据可视化分析网红零食销量

R语言线性回归模型拟合诊断异常值分析家庭燃气消耗量和卡路里实例带自测题

数据分享|R语言GLM广义线性模型：逻辑回归、泊松回归拟合小鼠临床试验数据（剂量和反应）示例和自测题

数据分享|R语言逻辑回归、线性判别分析LDA、GAM、MARS、KNN、QDA、决策树、随机森林、SVM分类葡萄酒交叉验证ROC（下）

相关课程

更多

大数据Hive教程精讲

分布式数据库 HBase 快速入门

Sqoop 企业级大数据迁移方案实战

NoSQL数据库Kudu教程

实时数据接入：5分钟上手 Flink MySQL 连接器

云数据库HBase版使用教程

相关电子书

更多

Hive Bucketing in Apache Spark

2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践

Comparison of Spark SQL with Hive

相关实验场景

更多

通过Lindorm-cli连接并使用宽表引擎

玩转MaxCompute SQL! 30分钟搞定数据分析挖掘

5分钟上手Flink MySQL连接器

使用PolarDB-X与Flink搭建实时数据大屏

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）