基于Flink+ClickHouse构建实时游戏数据分析
基于Flink+ClickHouse构建实时游戏数据分析
在互联网、游戏行业中,常常需要对用户行为日志进行分析,通过数据挖掘,来更好地支持业务运营,比如用户轨迹,热力图,登录行为分析,实时业务大屏等。当业务数据量达到千亿规模时,常常导致分析不实时,平均响应时间长达10分钟,影响业务的正常运营和发展。 本实践介绍如何快速收集海量用户行为数据,实现秒级响应的实时用户行为分析,并通过实时流计算Flink/Blink、云数据库ClickHouse等技术进行深入挖掘和分析,得到用户特征和画像,实现个性化系统推荐服务。 通过云数据库ClickHouse替换原有Presto数仓,对比开源Presto性能提升20倍。 利用云数据库ClickHouse极致分析性能,千亿级数据分析从10分钟缩短到30秒。 云数据库ClickHouse批量写入效率高,支持业务高峰每小时230亿的用户数据写入。 云数据库ClickHouse开箱即用,免运维,全球多Region部署,快速支持新游戏开服。 Flink+ClickHouse+QuickBI
本实践介绍如何快速收集海量用户行为数 据,实现秒级响应的实时用户行为分析,并 通过实时流计算、云数据库 ClickHouse等 技术进行深入挖掘和分析,得到用户特征和 画像,实现个性化系统推荐服务。产品列表 最佳实践频道 阿里云最佳实践分享群 专有网络 VPC 弹性公网 IP EIP 云服务器 ECS 消息队列 Kafka版 云数据库 ...
来自: 最佳实践 相关产品:云服务器ECS,弹性公网IP,实时计算,Quick BI,消息队列 Kafka 版,云数据库 ClickHouse
云Clickhouse冷热数据分层存储
云Clickhouse冷热数据分层存储
基于云ClickHouse可以给电商、游戏、互联网以及其他行业提供高性能、高稳定性、低维护成本、高性价比的实时数据分析、精准营销、业务运营、业务分析、业务预警、业务营销、数仓加速等场景化方案,本实践会向客户提供数据库低维护成本、数据库链路构建、冷热分层存储、快熟分析等操作实践。 解决问题 1. 维护成本低不用建设维护体系,稳定性高,数据倾斜自动均衡。 2. 完善的数据同步链路,可以平滑将业务库、大数据、日志服务的数据同步到Clickhouse,降低研发成本。 3. 平滑升级版本,业务中断小。 冷热分层后透明读取,帮客户节约整体数据存储成本。
利用云控制台水平扩容云 ClickHouse 本章节介绍如何通过云控制台进行水平扩容云 ClickHouse集群,增加节点数,提升集 群 资 源 容 ,水 平 扩 容 参 考 文 档:https://help.aliyun.com/document_detail/172411.html;水平扩容后费用将会发生变化,费用变化参考:...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,数据传输,日志服务(SLS),云数据库 ClickHouse
云服务器基准性能测试
云服务器基准性能测试
本最佳实践适合利用标准的benchmark工具对云服务器的CPU、内存、网络和磁盘性能进行测试的场景。
云服务器基准性能测试 最佳实践 场景描述 业务架构 本最佳实践适合利用标准的 benchmark 具对云服务器的 CPU、内存、网络和磁盘 性能进行测试的场景。解决问题 对云服务器的基准性能进行测试,包括 CPU、内存、网络和磁盘。产品列表 云服务器 ECS 专有网络 VPC 云监控 阿里云最佳实践分享群 最佳实践频道 如二维码过期,...
来自: 最佳实践 | 相关产品:块存储,专有网络 VPC,云服务器ECS,云速搭CADT
互联网电商行业离线大数据分析
互联网电商行业离线大数据分析
电商网站销售数据通过大数据分析后将业务指标数据在大屏幕上展示,如销售指标、客户指标、销售排名、订单地区分布等。大屏上销售数据可视化动态展示,效果震撼,触控大屏支持用户自助查询数据,极大地增强数据的可读性。
说明:这里的方案编号是这个应用的唯一标识,如果提交单,需要提供这个方案 编号。互联网电商行业离线大数据分析 搭建电商网站Demo 步骤11大约等待10-15分钟左右,资源部署成功。单击资源名称的链接可以跳转到对应资 源的控制台,右侧相关信息显示资源的主要信息。1.2.查看资源部署情况 登录到RDS控制台,查看数据库的...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,API网关,云速搭CADT
互联网、电商Elasticsearch搜索
互联网、电商Elasticsearch搜索
场景描述 每一个生活在互联网中的用户,每天都在经 历各种各样的“搜索”,查找电商网站商品、 信用卡账单、查电子发票、查附近的餐厅酒 店、查偶像、查交通等等。相对于传统的关 系型数据库,Elasticsearch只需要几毫秒的 时间,即可查询PB级数据并从中找到匹配 信息。利用Elasticsearch高可用性和易用 性,能够快速处理网站、APP丢给它的文本、 数字、日期、IP以及地理数据。 解决问题 1.电商网站商品、订单、物流等搜索 2.保险行业保单查询 3.互联网教育行业课程搜索 4.O2O行业地理位置搜索等 产品列表 云服务器ECS 专有网络VPC 负载均衡SLB 云数据库RDSMySQL版 Dataworks Elasticsearch 数据传输服务DTS
它底层的数据基础设施为阿里双 11异地多活 基础架构,为数千下游应用提供实时数据,已在线上稳定运行 5年之久。您 可以使用数据传输轻松构建安全、可扩展、高可用的数据架构。更多信息,请参见 DTS简介:(https://www.aliyun.com/product/dts)。云服务器 ECS(Elastic Compute Service):是一种弹性可伸缩的计算服务...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,数据传输,DataWorks,Elasticsearch
云解析PrivateZone
云解析PrivateZone是基于阿里云专有网络VPC环境的内网域名解析和管理服务。能够在自定义的一个或多个VPC中快速构建DNS系统,实现不同VPC的完全数据隔离,更安全。
在应答 DNS 查询时,所有地址按权重计算比例返回,将应用流量分配到不同的服务器上,达到负载均衡的目的.业务灰度切、负载均衡.分权重智能解析.使用“缓存保持”功能,可极大提升对公网域名的解析速度,并确保域名所用 DNS 服务商故障时仍能正常解析.指定域名100%命中缓存,不清除.公网域名解析加速及容灾保护.基于 DNS ...
来自: 云产品
自建K8S集群迁移ACK弹性裸金属集群
自建K8S集群迁移ACK弹性裸金属集群
场景描述 在微服务化改造之后,企业在享受K8S带来应 用管理的便利的同时,存在硬件性能不足,本 地扩展性差,容器容灾难,K8S管理复杂等问 题。 解决问题 1.增强K8S扩展性:如何通过弹性裸金属服务 器的强劲硬件性能,实现云端资源急速扩 展,从容应对应用访问压力大的问题。 2.如何简化云端K8S运维:通过阿里云容器服 务(ACK)实现敏捷开发和部署落地,加速 企业业务迭代。 3.如何综合考虑迁移和容灾:如何整合云上和 云下容器资源实现遇到故障时可以通过健 康检查实现自动容灾。 4.如何不改应用上云:如何实现应用上云数据 库连接零修改。 5.数据库上云及回退:如何实现上云回退; 产品列表 ACK/ECS/SLB/NAT网关/弹性裸金属服务器/DTS/RDS MySQL
遇到线下 IDC机房过保或其他全量上云场景时可以通过修改全局流量管 理统一管理的访问策略实现一键上云,也可以通过对用户地理位置的甄别实现 /用户分批上云。不改应用:应用通过域名访问数据库,云上环境通过 PrivateZone实现数据库域名 解析 RDS域名,实现应用上云数据库连接零修改。云上云下并行场景下,数据库层面...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,负载均衡 SLB,容器服务 ACK,NAT网关,弹性裸金属服务器(神龙),云速搭
游戏数据运营融合分析
游戏数据运营融合分析
场景描述 1.游戏行业有结构化和非结构化数据融合分 析需求的客户。 2.游戏行业有数据实时分析需求的客户,无法 接受T+1延迟。 3.对数据成本有一定诉求的客户,希望物尽其 用尽量优化成本。 4.其他行业有类似需求的客户。 方案优势/解决问题 1.秒级实时分析:依托ADB计算密集型实例, 秒级监控DAU等数据,为广告投放效果提 供有力的在线决策支撑。 2.高效数据融合分析:打通结构化和非结构化 数据,支撑产品体验分析;广告买量投放效 果实时(分钟级)分析,渠道的评估更准确。 3.低成本:DLA融合冷数据分析+ADB存储密 集型温数据分析+ADB计算密集型热数据分 析,在满足各种分析场景需求的同时,有效 地降低的客户的总体使用成本。 4.学习成本低:DLA和ADB兼容标准SQL语 法,无需额外学习其他技术。 产品列表 专有网络VPC、负载均衡SLB、NAT网关、弹性公网IP 云服务器ECS、日志服务SLS、对象存储OSS 数据库RDSMySQL、数据传输服务DTS、数据管理DMS 分析型数据库MySQL版ADS 数据湖分析DLA、QuickBI
数据融合分析:文档版本:20210224 3 游戏数据运营融合分析 最佳实践概述 ᅳ DLA融合分析(冷数据,全周期,低频查询、大范围跨度查询、关联 ADB 维度数据分析)+ADB存储密集型分析(温数据,1-3个月批量数据分析)+ADB计算密集型(热数据,实时分析)。ᅳ 真正实现云原生数据处理、分析链路闭环,极大提高客户收益。方案...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,云原生数据仓库AnalyticDB My,数据湖分析,Quick BI
机场视频监控
机场视频监控
场景描述 该最佳实践适用于国内机场的视频监控行业,将线下视频文件通过混合云阵列缓存后,通过专线上传到阿里云OSS上。 也适用于其他混合云场景中,利用阵列缓存文件,并通过网络传输到阿里云OSS上的场景。 解决问题 1.通过混合云阵列+专线将线下文件传到阿 里云OSS上 2.通过阿里云OSS跨区域复制功能实现异 地文件备份 3.通过OSS的自动生命周期管理功能实现 文件生命周期管理 产品列表 OSS对象存储 混合云阵列 高速通道(专线)
 文件过期策略:选择过期天数,设置对象文件保留天数,以该文件最后修 改时间的天数为起始计算,超过设定天数时即执行规则进行删除或转换为 其他存储类型(低频访问类型或归档类型)。如设置时间为 30 天,最后 修改日期为 2016-1-1 的对象会在2016年 1 月 31 号被后端程序扫描 删除或转换为其他存储类型。 不勾选转换...
来自: 最佳实践 | 相关产品:对象存储 OSS,高速通道,混合云存储阵列 Hybrid Cloud
数据库备份DBS
数据库备份(Database Backup,简称DBS)是为数据库提供连续数据保护、低成本的备份服务。它可以为多种环境的数据提供强有力的保护,包括企业数据中心、其他云厂商、混合云及公共云。通过使用阿里实时数据流技术,实现数据库秒级备份,秒级恢复,保障数据安全。
通过现代化备份平台,实现任意1秒的恢复、单表恢复,恢复能力大幅提升,解决不同云不同云厂商和云产品之间备份保留周期不一致问题,运维工作量大幅减少.通过DBS构建便宜又安全的跨云备份方案,一份数据两地保存,轻松满足合规要求。DBS提供数据加密传输能力,避免数据库的服务端口暴露至公网中,保证安全;支持压缩、分片...
来自: 云产品
分布式云容器平台ACK One
阿里云分布式云容器平台ACK One面向混合云、多集群、分布式计算等场景,支持连接您任何地域、基础设施上的K8s集群,提供一致的社区兼容的API,助力管理分布式云资源
此外,面向批处理、数据处理、科学计算、持续集成等场景提供全托管 Argo 工作流集群,支持大规模工作流编排与高效弹性运行.分布式云容器平台 ACK One.查看 ACK One 使用文档.查看 ACK One 快速入门.加入 ACK One 产品讨论群.从云端、边缘到 IDC,分布式云容器平台可以管理任意环境的 K8s 集群,为企业提供一致的云原生应用...
来自: 云产品
EMR本地盘实例大规模数据集测试
场景描述 阿里云为了满足大数据场景下的存储需求,在云 上推出了本地盘D1机型,这个系列提供了本地 盘而非云盘作为存储,提高了磁盘的吞吐能力, 发挥Hadoop的就近计算优势。阿里云EMR 产品针对本地盘机型,推出了一整套的自动化运 维方案,帮助用户方便可靠地使用本地盘机型, 不需要关注整个运维过程同时数据的高可靠和 服务的高可用。 解决问题 1.云盘多份冗余数据导致成本高 2.磁盘吞吐量不高 3.节点的高可靠分布问题 4.本地盘与节点的故障监控问题 5.数据迁移时自动决策问题 6.自动故障节点迁移与数据平衡问题 产品列表 EMR(E-MapReduce) 本地盘 VPC
一般 进行 PT(Power Test,功耗测试)就可以衡量集群大数据处理性能,因此本实践也选用 pt测试,即一个工作流执行 99个 TPC-DS SQL查询任务 Hive-testbench 是 GitHub 上的一个开源项目,基于 TPC-DS 进行封装利用 MapReduce的方式快速生产 Hive基准测试数据,可以用于进行大数据集群性能测试。关于 hive-testbech 的更多...
来自: 最佳实践 | 相关产品:块存储,云服务器ECS,E-MapReduce
基于DataWorks的大数据一站式开发及数据治理
基于DataWorks的大数据一站式开发及数据治理
概述 基于Dataworks做大数据一站式开发,包含数据实时采集到kafka通过实时计算对数据进行ETL写入HDFS,使用Hive进行数据分析。通过Dataworks进行数据治理,数据地图查看数据信息和血缘关系,数据质量监控异常和报警。 适用场景  日志采集、处理及分析  日志使用Flink实时写入HDFS  日志数据实时ETL  日志HIVE分析  基于dataworks一站式开发  数据治理 方案优势  大数据一站式开发,完善的数据治理能力。  性能优越:高吞吐,高扩展性。  安全稳定:Exactly-Once,故障自动恢复,资源隔离。  简单易用:SQL语言,在线开发,全面支持UDX。  功能强大:支持SQL进行实时及离线数据清洗、数据分析、数据同步、异构数据源计算等Data Lake相关功能 ,以及各种流式及静态数据源关联查询。
自定义 HDFS Sink.47 文档版本:20201020 IV 基于 Dataworks的大数据一站式开发及数据治理 最佳实践概述 最佳实践概述 概述 本实践基于 Dataworks做大数据一站式开发,包含数据实时采集到 kafka通过实时 对数据进行 ETL写入 HDFS,使用 Hive进行数据分析。通过 Dataworks进行数据 治理,数据地图查看数据信息和血缘关系...
来自: 最佳实践 | 相关产品:块存储,云服务器ECS,E-MapReduce,DataWorks,实时计算,云速搭
自建Hadoop迁移到阿里云EMR
自建Hadoop迁移到阿里云EMR
场景描述 场景1:自建Hadoop集群数据(HDFS)迁移到 阿里云EMR集群的HDFS文件系统; 场景2:自建Hadoop集群数据(HDFS)迁移到 计算存储分离架构的阿里云EMR集群,以OSS 和JindoFS作为EMR集群的后端存储。 解决的问题 客户自建Hadoop迁移到阿里云EMR集群的 技术方案; 基于IPSecVPN隧道构建安全和低成本数据 传输链路 产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。
场景2:自建 Hadoop集群数据(HDFS)迁移到 基于 IPSec VPN隧道构建安全和低成本数据 存储分离架构的阿里云 EMR集群,以 OSS 和 传输链路 JindoFS作为 EMR集群的后端存储。产品列表 E-MapReduce,VPC,ECS,OSS,VPN网关。文档模板(手册名称)/Error!Use the Home tab to apply 云服务器 ECS(产品名称)标题 to the ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭
SLS多云日志采集、处理及分析
SLS多云日志采集、处理及分析
场景描述 从第三方云平台或线下IDC服务器上采集 日志写入到阿里云日志服务,通过日志服务 进行数据分析,帮助提升运维、运营效率, 建立DT 时代海量日志处理能力。 针对未使用其他日志采集服务的用户,推荐 在他云或线下服务器安装logtail采集并使用 Https安全传输;针对已使用其他日志采集 工具并且已有日志服务需要继续服务的情 况,可以通过Log producer SDK写入日志 服务。 解决问题 1.第三方云平台或线下IDC客户需要使用 阿里云日志服务生态的用户。 2.第三方云平台或线下IDC服务器已有完 整日志采集、处理及分析的用户。 产品列表 E-MapReduce 专有网络VPC 云服务器ECS 日志服务LOG DCDN
Kafka是一种高吞吐的分布式发布订阅消息系统,它可以处理消费者在网站中的所 有动作数据。这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的 许多社会功能的一个关键因素。这些数据通常是由于吞吐的要求而通过处理日志 和日志聚合来解决。对于像 Hadoop一样的日志数据和离线分析系统,但又要求实时 处理的...
来自: 最佳实践 | 相关产品:云服务器ECS,日志服务(SLS),NAT网关,E-MapReduce,全站加速 DCDN,云速搭CADT
EMR集群安全认证和授权管理 
EMR集群安全认证和授权管理 
场景描述 阿里云EMR服务Kafka和Hadoop安全集群使 用Kerberos进行用户安全认证,通过Apache Ranger服务进行访问授权管理。本最佳实践中以 Apache Web服务器日志为例,演示基于Kafka 和Hadoop的生态组件构建日志大数据仓库,并 介绍在整个数据流程中,如何通过Kerberos和 Ranger进行认证和授权的相关配置。 解决问题 1.创建基于Kerberos的EMR Kafka和 Hadoop集群。 2.EMR服务的Kafka和Hadoop集群中 Kerberos相关配置和使用方法。 3.Ranger中添加Kafka、HDFS、Hive和 Hbase服务和访问策略。 4.Flume中和Kafka、HDFS相关的安全配 置。 产品列表:E-MapReduce、专有网络VPC、云服务器ECS、云数据库RDS版
提供 用户在云上使用开源技术建设数据仓库、离线批处理、在线流式处理、即时查询、机 器 学 习 等 场 景 下 的 大 数 据 解 决 方 案。详 情 请 查 看 www.aliyun.com/product/emapreduce Kerberos:Kerberos是一种网络身份验证协议,它旨在通过使用密钥加密为客户 端/服务器应用程序提供强身份验证。它提供了网络上的身份...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,E-MapReduce
云服务器 ECS
阿里云服务器ECS是一种处理能力可弹性伸缩的云主机虚拟服务器,它使服务器托管更安全稳定,可降低开发运维成本,支持包年包月、按量付费等模式,方便财务更好管理
多种数据处理模型Spark集群支持多种数据处理模型,包括批处理处理、交互式查询和机器学习等。这种灵活性使得Spark集群可以适应不同的数据处理需求,提供更全面的数据处理解决方案。相关产品云服务器ECS本产品专有网络 VPC弹性公网 IP对象存储OSSNAT 网关一键部署产品定价为了满足不同用户需求,我们提供了包年包月、按...
来自: 云产品
云消息队列 Kafka 版
云消息队列 Kafka 版是阿里云基于Apache Kafka构建的大数据消息中间件,广泛用于日志收集和分析、数据处理等场景。可提供全托管服务,用户无需部署运维,更专业、更可靠、更安全。
随着业务的快速发展,大搜车遇到了消息大幅增加、异地消息同步等一系列的问题,需要更稳定可靠的商业版Kafka产品,减少运维工作量,利用云消息队列Kafka对接大数据生态,即开即用,快速扩容,可靠性更高.大搜车:云上多地域高可用消息系统的构建.云消息队列 Kafka 版 V3 系列 Serverless 实例正式发布!云消息队列 Kafka ...
来自: 云产品
云原生数据湖分析DLA
阿里云云原生数据湖分析是新一代大数据解决方案,采取计算与存储完全分离的架构,支持对象存储(OSS)、RDS(MySQL等)、NoSQL(MongoDB等)数据源的消息实时归档建仓,提供Presto和Spark引擎,满足在线交互式查询、流处理、批处理、机器学习等诉求。内置大量优化+弹性,比开源自建集群最高降低50%+的成本,最快可1分钟级拉起300个计算节点,快速满足业务资源要求。
采用云原生架构,大幅降低运维工作量.该场景需要对多种类型的数据源进行联合查询和实时分析,传统方案过程繁琐费时。云原生数据湖提供提供多种数据源之间联邦分析能力,屏蔽各种数据源访问的差异性,快速挖掘数据价值.生产库与分析环境隔离,保持生产库更轻,性能更好,历史数据在分析环境分析,对生产环境不造成影响....
来自: 云产品
基于云速搭CADT快速构建药物筛选批量计算环境-serverless版
基于云速搭CADT快速构建药物筛选<em>批量计算</em>环境-serverless版
本方案基于云速搭 CADT提供一个快速构建云上Serverless版HPC批量计算环境的模板,针对生物制药领域的药物筛选场景,提供开箱即用的整套解决方案工具包,整个云上环境仅需1个小时即可完成自动化部署搭建。
基于云速搭 CADT快速部署药物筛选批量计算环境-Serverless版 场景描述 部署架构 本方案基于云速搭 CADT 提供一个快速构建云上 Serverless版 HPC批量计算环境的模板,针对生物 制药领域的药物筛选场景,提供开箱即用的整套解 决方案工具包,整个云上环境仅需 1个小时即可完 成自动化部署搭建。解决问题 快速构建适用于药物...
来自: 最佳实践 | 相关产品:弹性公网IP,文件存储NAS,日志服务(SLS),容器镜像服务 ACR,操作审计,密钥管理服务,云防火墙,弹性高性能计算E-HPC,云速搭
< 1 2 3 >
共有3页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用