行转列的一个SQL写法(以Oracle为例)

简介:

在数据分析的过程中,常常会遇到行转列的问题。例如,系统按事务逐条摆放,但是分析时希望以某个线索(例如每一个客户)为中心,查看所有的事项。写个性化程序或者写自定义聚合函数都可以有很好的解决方案,但是计算环境复杂多变,有程序未必能部署上,掌握一个SQL写法快速响应大多数分析场景还是很有必要的。本文以Oracle为例,主要使用了row_number函数(不使用rank函数的原因是不希望出现2条记录排名相同的情况,我们的最终目的是行转列,不是合理排名)

下列sql准备一下测试数据:

 
  1. -- drop table example_row_data;  
  2.  
  3. create table example_row_data (  
  4.        user_school varchar2(2000),  
  5.        user_name varchar2(2000),  
  6.        user_item varchar2(2000),  
  7.        user_value number         
  8. );  
  9.  
  10. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_1','Linux',20);  
  11. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_1','BI',2);  
  12. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_1','数据库',20);  
  13. commit;  
  14. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_2','Linux',10);  
  15. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_2','BI',30);  
  16. commit;  
  17. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_3','Linux',5);  
  18. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_3','BI',2);  
  19. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_3','数据库',6);  
  20. insert into example_row_data(user_school,user_name,user_item,user_value) values('博客','iData_3','数据挖掘',20);  
  21. commit

 查看样例数据:

 
  1. SQL> select substr(t.user_school,1,4) 类别,substr(user_name,1,8) 用户 ,substr(t.user_item,1,8) 科目,substr(t.user_value,1,2) 数值 from example_row_data t;  
  2.    
  3. 类别     用户             科目             数值  
  4. -------- ---------------- ---------------- ----  
  5. 博客     iData_1          Linux            20  
  6. 博客     iData_1          BI               2  
  7. 博客     iData_1          数据库           20  
  8. 博客     iData_2          Linux            10  
  9. 博客     iData_2          BI               30  
  10. 博客     iData_3          Linux            5  
  11. 博客     iData_3          BI               2  
  12. 博客     iData_3          数据库           6  
  13. 博客     iData_3          数据挖掘         20  
  14.    
  15. rows selected 

行转列前的准备工作,计算单个用户最大可能的科目数:

 
  1. SQL> SELECT MAX(cnt)  
  2.   2  FROM   (SELECT t.user_school  
  3.   3                ,t.user_name  
  4.   4                ,COUNT(*) cnt  
  5.   5          FROM   example_row_data t  
  6.   6          GROUP  BY t.user_school  
  7.   7                   ,t.user_name) t;  
  8.    
  9.   MAX(CNT)  
  10. ----------  
  11.          4 

行转列(已知最大科目数为4):

 
  1. SELECT substr(t.user_school, 1, 4) 类别  
  2.       ,substr(t.user_name, 1, 8) 用户  
  3.       ,MAX(decode(rk, 1, rpad(t.user_item || ':' || t.user_value, 14, ' '), NULL)) ||  
  4.        MAX(decode(rk, 2, rpad(t.user_item || ':' || t.user_value, 14, ' '), NULL)) ||  
  5.        MAX(decode(rk, 3, rpad(t.user_item || ':' || t.user_value, 14, ' '), NULL)) ||  
  6.        MAX(decode(rk, 4, rpad(t.user_item || ':' || t.user_value, 14, ' '), NULL)) 科目成绩  
  7. FROM   (SELECT t.*  
  8.               ,row_number() over(PARTITION BY t.user_school, t.user_name ORDER BY t.user_item) rk  
  9.         FROM   example_row_data t) t  
  10. GROUP  BY t.user_school  
  11.          ,t.user_name;  
  12.  
  13. 类别     用户             科目成绩  
  14. -------- ---------------- ---------------------------------------------------  
  15. 博客     iData_1          BI:2          Linux:20      数据库:20  
  16. 博客     iData_2          BI:30         Linux:10  
  17. 博客     iData_3          BI:2          Linux:5       数据库:6      数据挖掘:20 



本文转自 hexiaini235 51CTO博客,原文链接:http://blog.51cto.com/idata/1071030 ,如需转载请自行联系原作者

相关文章
|
8天前
|
SQL 存储 Oracle
Oracle的PL/SQL定义变量和常量:数据的稳定与灵动
【4月更文挑战第19天】在Oracle PL/SQL中,变量和常量扮演着数据存储的关键角色。变量是可变的“魔术盒”,用于存储程序运行时的动态数据,通过`DECLARE`定义,可在循环和条件判断中体现其灵活性。常量则是不可变的“固定牌”,一旦设定值便保持不变,用`CONSTANT`声明,提供程序稳定性和易维护性。通过 `%TYPE`、`NOT NULL`等特性,可以更高效地管理和控制变量与常量,提升代码质量。善用两者,能优化PL/SQL程序的结构和性能。
|
7天前
|
SQL Oracle 关系型数据库
Oracle的PL/SQL游标属性:数据的“导航仪”与“仪表盘”
【4月更文挑战第19天】Oracle PL/SQL游标属性如同车辆的导航仪和仪表盘,提供丰富信息和控制。 `%FOUND`和`%NOTFOUND`指示数据读取状态,`%ROWCOUNT`记录处理行数,`%ISOPEN`显示游标状态。还有`%BULK_ROWCOUNT`和`%BULK_EXCEPTIONS`增强处理灵活性。通过实例展示了如何在数据处理中利用这些属性监控和控制流程,提高效率和准确性。掌握游标属性是提升数据处理能力的关键。
|
8天前
|
SQL Oracle 安全
Oracle的PL/SQL循环语句:数据的“旋转木马”与“无限之旅”
【4月更文挑战第19天】Oracle PL/SQL中的循环语句(LOOP、EXIT WHEN、FOR、WHILE)是处理数据的关键工具,用于批量操作、报表生成和复杂业务逻辑。LOOP提供无限循环,可通过EXIT WHEN设定退出条件;FOR循环适用于固定次数迭代,WHILE循环基于条件判断执行。有效使用循环能提高效率,但需注意避免无限循环和优化大数据处理性能。掌握循环语句,将使数据处理更加高效和便捷。
|
8天前
|
SQL Oracle 关系型数据库
Oracle的PL/SQL条件控制:数据的“红绿灯”与“分岔路”
【4月更文挑战第19天】在Oracle PL/SQL中,IF语句与CASE语句扮演着数据流程控制的关键角色。IF语句如红绿灯,依据条件决定程序执行路径;ELSE和ELSIF提供多分支逻辑。CASE语句则是分岔路,按表达式值选择执行路径。这些条件控制语句在数据验证、错误处理和业务逻辑中不可或缺,通过巧妙运用能实现高效程序逻辑,保障数据正确流转,支持企业业务发展。理解并熟练掌握这些语句的使用是成为合格数据管理员的重要一环。
|
8天前
|
SQL Oracle 关系型数据库
Oracle的PL/SQL表达式:数据的魔法公式
【4月更文挑战第19天】探索Oracle PL/SQL表达式,体验数据的魔法公式。表达式结合常量、变量、运算符和函数,用于数据运算与转换。算术运算符处理数值计算,比较运算符执行数据比较,内置函数如TO_CHAR、ROUND和SUBSTR提供多样化操作。条件表达式如CASE和NULLIF实现灵活逻辑判断。广泛应用于SQL查询和PL/SQL程序,助你驾驭数据,揭示其背后的规律与秘密,成为数据魔法师。
|
1月前
|
SQL Oracle 关系型数据库
Oracle系列十一:PL/SQL
Oracle系列十一:PL/SQL
|
1月前
|
SQL Oracle 关系型数据库
Oracle系列之八:SQL查询
Oracle系列之八:SQL查询
|
SQL Oracle 关系型数据库
oracle用SQL Plus输入命令为什么只显示2
oracle用SQL Plus输入命令为什么只显示2
464 0
oracle用SQL Plus输入命令为什么只显示2
|
SQL Oracle 关系型数据库

推荐镜像

更多