2017云栖大会·杭州峰会:《在线用户行为分析:基于流式计算的数据处理及应用》之《数据可视化:构建实时动态运营数据分析大屏》篇

简介: 2017云栖大会·杭州峰会:《在线用户行为分析:基于流式计算的数据处理及应用》之《数据可视化:构建实时动态运营数据分析大屏》篇

实验背景介绍

了解更多2017云栖大会·杭州峰会 TechInsight & Workshop.

本手册为云栖大会Workshop之《在线用户行为分析:基于流式计算的数据处理及应用》场的《数据可视化:构建实时动态运营数据分析大屏》篇所需。主要帮助现场学员熟悉并掌握DataV数据可视化的操作和使用。

实验涉及大数据产品

前提准备

必备条件:1、已经从云中沙箱中获取了实验所需的阿里云账号和密码。2、安装56版本以上的GOOGLE CHROME浏览器。

实验目标

本实验将会实现如下的实时动态运营数据分析大屏大屏。

1实验目标

创建可视化大屏

经过上述《流数据处理:通过StreamSQL分析视频日志》章节创建的流式任务,我们可以创建酷炫的可视化大屏展示网站实时流量统计情况,为了便于大家快速掌握DataV的使用,请使用事先准备好的RDS数据源。

进入DataV管理控制台

点击进入DataV可视化管理控制台。

添加数据源

  • step1:进入DataV管理控制台,点击左侧菜单中我的数据

我的数据

  • step2:点击+添加数据,跳出新建数据对话框。

添加数据

  • step3:配置数据类型为RDS for MySQL、名称、域名、用户名/密码、端口和数据库,点击“获取数据列表”,选择“workshop”,并点击测试连接,最后点击“完成”。

配置数据源

具体数据源配置项如下:

  • 数据源类型:RDS for MySQL,内网,华东2
  • 名称:workshop_rds
  • 域名:rm-uf6t1mym355i3qdsw.mysql.rds.aliyuncs.com
  • 用户名:root
  • 密码:Workshop001
  • 端口:3306
  • 数据库:workshop

创建DataV可视化大屏

  • step1:点击左侧我的可视化,进入配置大屏操作;再点击2017_WORKSHOP_HZ进入大屏编辑界面。

我的可视化

  • step2:此处大屏模板为此次Workshop量身定制,大家直接进入配置界面即可。DATAV功能布局见图示。

流式数据实战配置界面

配置DataV数据图表

依次配置实时在线人数(数字翻牌器)热门房间排名(轮播列表柱状图)在线人数变化趋势(折线图)用户卡顿率趋势(折线图)访问设备比例(饼图)用户故障地理分布(点热力图)

配置实时在线人数(数字翻牌器)
  • step1:点击数字翻牌器,进入配置实时在线人数(数字翻牌器)页面。

折线图样式

  • step2:点击数字翻牌器左侧“数据“选项卡,进入数据配置面板。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。
因为数据表包含了多条数据,需要获取最新的在线人数数据,故编写SQL如下:

数字翻牌器

附:SQL说明

SELECT 
  sum(count_value) as value 
  FROM online_num 
配置热门房间排名(轮播列表柱状图)

点击轮播列表在右侧进行配置数据。统一选择数据类型为数据库,且选择数据库为之前所配置的workshop_rds。
配置热门房间排名

附:SQL说明

SELECT sum(count_value) as value, roomid as content 
FROM hot_room_num 
where 
start_time < unix_timestamp()*1000 
and start_time > (unix_timestamp()-100)*1000 
group by content 
order by value DESC 
limit 5
配置在线人数变化趋势(折线图)
  • step1:同样点击在线人数变化趋势(折线图),进入数据配置页面。
  • step2:配置数据源。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。

在线人数变化趋势

附:SQL说明

   SELECT 
    count_value as y, 
    substring(start_time,  1, 19)  as x
    FROM online_num
    order by start_time DESC
    limit 10
配置用户卡顿率变化趋势(折线图)
  • step1:同样点击用户卡顿率变化趋势(折线图),进入数据配置页面。
  • step2:配置数据源。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。

用户卡顿率变化趋势

附:SQL说明

SELECT 
  block as y, 
  substring(start_time,  1, 19) as x 
  FROM block_min 
  order by start_time DESC 
  limit 10
配置访问设备比例(饼图)
  • step1:同样点击配置访问设备比例(饼图),进入数据配置页面。
  • step2:配置数据源。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。
编写SQL如下:
配置访问设备比例

附:SQL说明

SELECT 
sum(count_value) as value, 
agent as type, 
max(start_time) as date_time 
FROM access_device 
where 
start_time < unix_timestamp()*1000 
and start_time > (unix_timestamp()-100)*1000
group by agent
配置播放故障率(点热力图)
  • step1:点击地图组件,再选择点热力图层子组件。
    热力图层子组件
  • step2:进入数据配置页面,配置数据源。

数据类型选择数据库,选择数据库为workshop_rds(刚创建的数据源名称)在SQL底部勾选自动更新,设置每5秒请求一次。
我们需要的数据包括经度、纬度和故障率,但是原始数据中,经度、纬度在一个字段中,且该字段包含空数据等脏数据;同时,故障率为0的数据我们不需要,因为对绘制热力图不起作用。这就需要我们用DATAV数据过滤器处理。先用SQL查询10000条数据,保证充足的数据量进行下一步过滤。
附:SQL说明

SELECT * FROM region_failure_rate limit 10000
  • step3.1 添加数据过滤器

添加数据过滤器

  • step3.2 将新建数据过滤器命名为“getVideoFaultValue”
  • step3.3 编写数据过滤器
    编写数据过滤器
  • step3.4 选择应用数据过滤器“getVideoFaultValue”

附:数据过滤器代码说明

var processedData = [];

data.forEach(function(d, i) {
  if(d.remoteip && +d.fault_video > 0) {
    var dataObj = {};

    var latLngArray = d.remoteip.split(',');
    dataObj.lat = latLngArray[0];
    dataObj.lng = latLngArray[1];

    dataObj.value = +d.fault_video;

    processedData.push(dataObj);
  }
})

return processedData;

至此我们对所有组件的数据都已经配置完成。

预览大屏

  • 点击右上角预览,查看大屏效果,会看到数据实时的刷新。

大屏预览

发布大屏

通过发布操作可以将制作好的大屏分享别人查看。

  • step1:点击右上角发布,弹出发布对话框,打开发布按钮会生成链接。

发布1

复制生成的URL即可共享你的大屏作品,观看制作的流式数据大屏。其他验证密码、验证Token可以参考更多教程来完成,此处将不赘述。

到此为止,相信大家一定程度掌握了阿里云流式日志的分析及处理解决方案有了一定了解,包括Log、StreamCompute到最后的DataV大屏展示。更多内容请大家持续关注文章的更新和后续的workshop内容出品。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
目录
相关文章
|
1月前
|
数据采集 机器学习/深度学习 数据可视化
深入浅出:Python在数据分析中的应用
本文将探讨Python语言在数据分析领域的核心应用,通过实际案例展示其如何处理和分析大规模数据集。不同于传统的技术文章摘要,我们将采用一种故事化的方式引入,让读者通过一个数据分析师的日常挑战,感受Python的魅力。接着,文章将详细介绍Python在数据预处理、数据清洗、数据可视化及机器学习等方面的实际应用,旨在为广大技术爱好者提供一份易于理解且实用的指南。
|
1月前
|
机器学习/深度学习 人工智能 数据可视化
Python在数据分析中的威力及应用实例
本文探讨了Python在数据分析领域的重要性和灵活性,着重介绍了Python在大数据处理、机器学习和可视化方面的应用实例,展示了其强大的功能和便捷的特点。
|
1月前
|
机器学习/深度学习 数据可视化 数据挖掘
Python在数据分析中的应用及其优势
数据分析在当今信息化时代具有重要意义,而Python作为一种简洁而强大的编程语言,在数据分析领域有着突出的优势。本文将介绍Python在数据分析中的应用及其优势,包括其丰富的库、易读的语法和广泛的社区支持,以及如何利用Python进行数据处理、可视化和建模。
|
6天前
|
数据采集 数据可视化 数据挖掘
SciPy在数据分析中的应用:从数据清洗到可视化
【4月更文挑战第17天】# SciPy在数据分析中的应用:从数据清洗到可视化。文章探讨了SciPy在数据清洗(使用NumPy处理缺失值和异常值)、数据分析(描述性统计和模型拟合)以及数据可视化(结合Matplotlib和Seaborn进行图表绘制)中的作用。SciPy与其他Python库结合,为完整的数据分析流程提供了强大支持。
|
6天前
|
数据采集 数据可视化 数据挖掘
Seaborn在数据分析中的应用:案例分析与实践
【4月更文挑战第17天】本文介绍了Seaborn在数据分析中的应用,它是一个基于Python的可视化库,简化了复杂数据的图表创建。通过一个销售数据分析的案例,展示了数据加载、描述性统计、相关性分析、多变量分析及高级可视化步骤。实践技巧包括数据清洗、图表选择、颜色使用、注释标签和交互性。Seaborn助力高效数据探索和理解,提升分析效率。注意,实际使用需根据数据集和目标调整,并参考最新文档。
|
6天前
|
数据采集 数据可视化 数据挖掘
NumPy在数据分析中的核心应用
【4月更文挑战第17天】NumPy是Python数据分析基础库,核心应用包括数据结构化、预处理、统计分析和可视化。它提供`ndarray`多维数组对象及灵活索引,用于数据存储和处理。数据预处理支持缺失值处理,统计分析涵盖描述性统计和相关性分析。虽不直接支持数据可视化,但能与Matplotlib等库集成绘制图表。掌握NumPy能提升数据分析效率,助于挖掘数据价值。
|
7天前
|
存储 数据可视化 数据挖掘
实战案例:Pandas在金融数据分析中的应用
【4月更文挑战第16天】本文通过实例展示了Pandas在金融数据分析中的应用。案例中,一家投资机构使用Pandas加载、清洗股票历史价格数据,删除无关列并重命名,将日期设为索引。接着,数据被可视化以观察价格走势,进行基本统计分析了解价格分布,以及计算移动平均线来平滑波动。Pandas的便捷功能在金融数据分析中体现出高效率和实用性。
|
26天前
|
数据采集 数据可视化 数据挖掘
Python中的数据分析与可视化技术应用
在当今信息爆炸的时代,数据分析和可视化技术成为了各行各业不可或缺的工具。本文将介绍Python语言在数据分析和可视化领域的应用,包括常用的数据处理库、数据可视化库以及实际案例分析,帮助读者更好地理解和运用Python进行数据分析与可视化。
|
1月前
|
数据可视化 数据挖掘 API
Python数据分析中的数据可视化:Matplotlib与Seaborn的比较
在Python数据分析领域,数据可视化是至关重要的一环。本文将深入探讨两大流行的数据可视化库Matplotlib与Seaborn的异同,帮助读者更好地选择适合自身需求的工具。
|
1月前
|
机器学习/深度学习 数据可视化 数据挖掘
Python在数据分析中的应用及效益探究
本文将深入探讨Python在数据分析领域的应用,不仅介绍了Python在数据处理、可视化和机器学习方面的优势,还分析了其在提升工作效率和决策制定上的重要作用,帮助读者更好地了解Python在数据分析中的实际价值。