0014-Hive中的Timestamp类型日期与Impala中显示不一致分析

简介:

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

1.问题描述

Hive表中存储的Timestamp类型的字段显示日期与Impala中查询出来的日期不一致。

2.问题复现

1.创建一个简单的测试表

2.向表中插入一条测试数据

insert into date_test4 values(1,'1503751615','2017-08-26 08:46:55');

获取当前系统时间存入表中:

3.通过Hive查询时间显示如下

select id,create_date_str,from_unixtime(create_date) from date_test4;

4.通过Impala查询时间显示如下

select id,create_date_str,cast(create_date as timestamp) from date_test4;

可以看到通过Hive查询看到的时间与通过Impala查询看到的时间不一致;

3.问题分析

3.1Hive的from_unixtime

Hive官网from_unixtime函数说明:

Return Type Name(Signature) Description
string from_unixtime(bigint unixtime, string format) Converts the number of seconds from unix epoch (1970-01-01 00:00:00 UTC) to a string representing the timestamp of that moment in the current system time zone in the format of "1970-01-01 00:00:00".

在Hive中通过from_unixtime函数将TIMESTAMP时间戳转换成当前时区的日期格式的字符串,默认格式为“yyyy-MM-dd HH:mm:ss”,所以Hive在查询的时候能正确的将存入的时间戳转成当前时区的时间;

3.2Impala的TIMESTAMP

默认情况下,Impala不会使用本地时区存储时间戳,以避免意外的时区问题造成不必要的问题,时间戳均是使用UTC进行存储和解释。具体说明请参考官方文档:

http://impala.apache.org/docs/build/html/topics/impala_timestamp.html#timestamp

4.解决方法

使用Impala的from_utc_timestamp函数指定时区进行时间转换,事例如下:

select id,create_date_str, cast(create_date as timestamp),from_utc_timestamp(cast(create_date as timestamp), 'EDT') from date_test4;

指定时区后时间与原始Hive中显示时间一致,时区查看参考如下地址:

http://zh.thetimenow.com/time-zones-abbreviations.php

醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

相关文章
|
4月前
|
SQL HIVE
Hive LAG函数分析
Hive LAG函数分析
36 0
|
4月前
|
SQL 数据可视化 关系型数据库
【大数据实训】基于Hive的北京市天气系统分析报告(二)
【大数据实训】基于Hive的北京市天气系统分析报告(二)
58 1
|
7月前
|
SQL 数据挖掘 HIVE
Hive数据仓库维度分析
Hive数据仓库维度分析
89 0
|
9月前
|
SQL 机器学习/深度学习 存储
Hadoop生态系统中的数据查询与分析技术:Hive和Pig的比较与应用场景
Hadoop生态系统中的数据查询与分析技术:Hive和Pig的比较与应用场景
|
SQL HIVE
hive的窗口函数、分析函数有哪些?
窗口函数FIRST_VALUE:取分组内排序后,截止到当前行,第一个值LAST_VALUE: 取分组内排序后,截止到当前行,最后一个值LEAD(col,n,DEFAULT) :用于统计窗口内往下第n行值。第一个参数为列名,第二个参数为往下第n行(可选,默认为1),第三个参数为默认值(当往下第n行为NULL时候,取默认值,如不指定,则为NULL)LAG(col,n,DEFAULT) :与lead相反,用于统计窗口内往上第n行值。第一个参数为列名,第二个参数为往上第n行(可选,默认为1),第三个参数为默认值(当往上第n行为NULL时候,取默认值,如不指定,则为NULL)OVER从句1、使用标准的聚
87 0
|
SQL 分布式计算 Ubuntu
8-点击流数据分析项目-Hive分析
文章目录 8-点击流数据分析项目-Hive分析 一、环境准备与数据导入 1.开启hadoop 2.导入数据
8-点击流数据分析项目-Hive分析
|
SQL 监控 HIVE
网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题|学习笔记
快速学习网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题
260 0
网站流量日志分析--统计分析--漏斗模型转化分析 &hive 级联求和问题|学习笔记
|
SQL 分布式计算 编译器
【Hive】(十六)Hive 执行过程实例分析
【Hive】(十六)Hive 执行过程实例分析
128 0
【Hive】(十六)Hive 执行过程实例分析
|
SQL HIVE
Hive 分析函数lead、lag实例应用
Lag和Lead分析函数可以在同一次查询中取出同一字段的后N行的数据(Lag)和前N行的数据(Lead)作为独立的列。这种操作可以代替表的自联接,并且LAG和LEAD有更高的效率,其中over()表示当前查询的结果集对象,括号里面的语句则表示对这个结果集进行处理。
510 0
|
SQL OLAP HIVE
hive窗口函数/分析函数详细剖析(三)
hive窗口函数/分析函数详细剖析
149 0