数据湖构建 Data Lake Formation
数据湖构建服务是阿里云上数据湖架构中的核心部分,助力用户构建数据湖系统。支持多数据源实时入湖,实现湖上元数据统一管理,提供企业级权限控制,无缝对接多种计算引擎,打破孤岛,洞察业务价值
数据湖构建 Data Lake Formation.用户过亿的某在线教育平台.用户希望课件素材、应用日志、学习采样等数据能够集中存储,统一管理。用户也希望能够对不同类型数据提供课件播放、离线分析、机器学习,实现在线教育不同场景的应用.数据湖构建完美适配数据存储OSS,同时对接大量计算引擎,满足用户不同的分析需求.在线教育...
来自: 云产品
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
数据湖开源大数据平台 E-MapReduce免费试用云原生开源大数据平台,为客户提供简单易集成的 Hadoop、Hive、Spark、StarRocks、Presto 等开源大数据计算和存储引擎数据湖构建 Data Lake Formation作为云原生数据湖架构核心组成部分,可帮助用户快速地构建云原生数据湖架构。数据应用与可视化DataV 数据可视化一款数据可视化...
来自: 云产品
大数据系统基准性能测试最佳实践
大数据系统基准性能测试最佳实践
本方案适用于在阿里云上进行大数据基准性能测试的场景,包括 Teragen和Terasort测试,TestDFSIO测试。本文采用CADT工具结合阿里云的E-MapReduce服务快速构建测试集群,并提供了Teragen和Terasort测试,TestDFSIO测试的测试脚本,便于迅速开展测试。
✓ 集成了数据湖构建Data Lake Formation),实现数据湖场景下多引擎的统一元数据管理。基准性能测试介绍 本示例提供两个测试脚本:Teragen&Terasort测试 文档版本:20210301 2 大数据系统基准性能测试最佳实践 最佳实践概述 ✓ Teragen程序会根据需要生成一些随机的数据,然后利用 Terasort将这些数据进行 sort排 序。是...
来自: 最佳实践 | 相关产品:专有网络 VPC,E-MapReduce,云速搭CADT
数据管理与服务
数据管理与服务作为阿里云产品六大版块之一,面向不同业务场景,阿里云提供数据存储、分析、应用等全链路能力,满足企业客户全方位的数据处理需求,实现计算和存储分离、资源解耦、数据移动减化,用以满足行业快速发展的需求和趋势,利用数据重塑其业务。
数据湖构建 Data Lake Formation.数据可视化 DataV.数据可视化分析平台 Quick BI.数据总线 DataHub.数据集成 Data Integration.大数据专家服务.数据资源平台.智能数据建设与治理 Dataphin.Databricks 数据洞察.网络安全升级支持IPV6.天弘基金成立于2004年11月8日,是经中国证监会批准设立的全国性公募基金管理公司之一,...
来自: 云产品
阿里云大数据&AI
阿里云大数据和AI产品服务。开放数据处理服务ODPS提供强大的数据分析和管理功能;开源大数据产品支持更加灵活地构建大数据平台;AI和机器学习产品提供AI工程平台和智算服务。
数据湖构建 Data Lake Formation.流式数据的发布和订阅.数据总线DataHub.阿里云ODPS.基于开源大数据体系构建,提升2-10倍查询性.开源大数据平台 E-MapReduce.致力于数据分析数据检索等场景服务.检索分析服务 Elasticsearch版.实现协同合作和数据共享.Databricks 数据洞察.开源大数据产品.灵活组合的AI产品体系.机器学习...
来自: 云产品
云原生企业级数据湖解决方案
云原生企业级数据湖解决方案,数据湖解决方案,无缝对接多种计算分析平台,数据湖中的数据可以直接进行数据分析、处理。
对象存储OSS基于12个9的可靠性设计,可存储任意规模的数据,支持冷热分层,可对接业务应用、各类计算分析平台,非常适合企业基于OSS构建数据湖.海量弹性:计算存储分离,存储规模弹性扩容.生态开放:对Hadoop生态友好,且无缝对接阿里云各计算平台.高性价比:统一存储池,避免重复拷贝,多种类型冷热分层.更易管理:加密、...
来自: 解决方案
可观测链路 OpenTelemetry版结合日志服务SLS关联分析最佳实践
可观测链路 OpenTelemetry版结合日志服务SLS关联<em>分析</em>最佳实践
可观测链路 OpenTelemetry 版为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等工具,可以帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,当应用出现业务异常问题时,您可以在可观测链路 OpenTelemetry 版控制台关联查看日志进行分析,精准定位业务异常。
文档版本:20240428 IV 可观测链路 OpenTelemetry 版结合日志服务 SLS最佳实践 最佳实践概述●进阶查询&分析:基于存储 Trace明细数据的 LogStore提供自定义查询和分析数据 的能力可根据用户需求自定义仪表板和告警,并实现链路关联日志查询的场景。部署架构 架构说明 1个 ACK集群,1个日志服务 SLS实例(跳过部署)●CADT...
来自: 最佳实践 | 相关产品:日志服务(SLS),云速搭
智能商业分析 Quick BI
瓴羊智能商业分析 Quick BI 是阿里云用户臻选的数据可视化工具,大幅提升数据分析和报表开发效率,一站式满足企业各种场景的数据分析和决策的诉求。
产品解决方案文档与社区权益中心定价云市场合作伙伴支持与服务了解阿里云备案控制台智能商业分析 Quick BI产品简介产品优势产品功能产品选型入门与试用技术解决方案产品定价安全合规客户案例常见问题社区智能商业分析 Quick BIQuick BI 提供智能化数据分析及可视化能力,满足用户数据准备、数据分析数据可视化等需求。...
来自: 云产品
游戏数据运营融合分析
游戏<em>数据</em>运营融合<em>分析</em>
场景描述 1.游戏行业有结构化和非结构化数据融合分 析需求的客户。 2.游戏行业有数据实时分析需求的客户,无法 接受T+1延迟。 3.对数据成本有一定诉求的客户,希望物尽其 用尽量优化成本。 4.其他行业有类似需求的客户。 方案优势/解决问题 1.秒级实时分析:依托ADB计算密集型实例, 秒级监控DAU等数据,为广告投放效果提 供有力的在线决策支撑。 2.高效数据融合分析:打通结构化和非结构化 数据,支撑产品体验分析;广告买量投放效 果实时(分钟级)分析,渠道的评估更准确。 3.低成本:DLA融合冷数据分析+ADB存储密 集型温数据分析+ADB计算密集型热数据分 析,在满足各种分析场景需求的同时,有效 地降低的客户的总体使用成本。 4.学习成本低:DLA和ADB兼容标准SQL语 法,无需额外学习其他技术。 产品列表 专有网络VPC、负载均衡SLB、NAT网关、弹性公网IP 云服务器ECS、日志服务SLS、对象存储OSS 数据库RDSMySQL、数据传输服务DTS、数据管理DMS 分析型数据库MySQL版ADS 数据湖分析DLA、QuickBI
本最佳实践基于分析型数据库 AnalyticDB、数据湖分析 Data Lake Analytics、日志服务 SLS、对象存储 OSS、关系型数据库服务 RDS、数据传输服务 DTS、数据分析与展现 Quick BI等产品组合,构建新一代游戏数据(热、温、冷三层)运营融合分析一体化解决方案。应用范围 游戏行业有结构化和非结构化数据融合分析需求的客户。...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,云原生数据仓库AnalyticDB My,数据湖分析,Quick BI
云原生数据湖分析DLA
阿里云云原生数据湖分析是新一代大数据解决方案,采取计算与存储完全分离的架构,支持对象存储(OSS)、RDS(MySQL等)、NoSQL(MongoDB等)数据源的消息实时归档建仓,提供Presto和Spark引擎,满足在线交互式查询、流处理、批处理、机器学习等诉求。内置大量优化+弹性,比开源自建集群最高降低50%+的成本,最快可1分钟级拉起300个计算节点,快速满足业务资源要求。
云原生数据湖分析(Data Lake Analytics,简称数据湖分析)采用弹性架构,提供一站式的数据湖分析与计算服务,支持 ETL、机器学习、流、交互式分析;可以分析与集成对象存储(OSS)、RDS(MySQL等)、NoSQL(MongoDB等)数据源;功能包括数据入湖,元数据管理与自动发现,支持双引擎:Presto、Spark.AnalyticDB数据分析训练营.ADB湖...
来自: 云产品
数据湖-在线学习场景数据分析
<em>数据湖</em>-在线学习场景数据<em>分析</em>
场景描述 本场景以在线教育中一个答题闯关类的应用为 例,使用WebServer来模拟演示这类日志数据 的分析处理。通过Nginx和Pythonflask搭建 WebServer,模拟应用中的关键页面,比如登 录、课程内容等,之后构造若干用户使用的模拟 日志数据,投递到数据湖进行分析后获取应用 PV、UV、课程内容访问排行、平均得分等等。 解决问题 基于数据湖(EMR+OSS)搭建大数据平台。 EMR和OSS使用和配置。 数据统一存储到OSS。 产品列表 E-MapReduce 对象存储OSS 云服务器ECS 访问控制RAM 专有网络VPC
借助EMR 可以简单快速的构建一个基于 Hadoop,Spark,Hive等大数据产品的计算集群,而且可以按需使用,其所有 Job完 文档版本:20200331 5数据湖-在线学习场景数据分析 数据湖 成之后,销毁集群,因为所有的数据都保存在OSS。此外,对于Hadoop集群上的任务,不同类型的任务对于机器配置的要求不同,比如 推荐和算法业务可能...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,访问控制,E-MapReduce
仓一体架构EMR元数据迁移DLF
<em>湖</em>仓一体架构EMR元<em>数据</em>迁移DLF
通过EMR+DLF数据湖方案,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持多源数据入湖以及一站式数据探索的能力。本方案支持已有EMR集群元数据库使用RDS或内置MySQL数据库迁移DLF,通过统一的元数据管理,多种数据源入湖,搭建高效的数据湖解决方案。
数据湖构建Data Lake Formation,DLF)作为云原生数据湖架构核心组成部分,帮助用户简单快速地 云原生数据湖解决方案。数据湖构建提供湖上元数据统一管理、企业级权限控 制,并无缝对接多种计算引擎,打破数据孤岛,洞察业务价值。(https://www.aliyun.com/product/bigdata/dlf)云速搭 CADT:是一款为上云应用提供...
来自: 最佳实践 | 相关产品:E-MapReduce,数据湖构建
Spark on ECI大数据分析
Spark on ECI大<em>数据分析</em>
场景描述 方案优势 1.计算引擎弹性扩缩容,兼顾资源弹性与计 算资源成本优化。 2.计算与存储分离架构,结合阿里云原生云 存储产品,海量数据湖优势。 3.Kubernetes原生的调度性能优势,提升在 大规模分析作业时的分析性能优势分。 4.集群资源隔离和按需分配。 解决问题 1.计算资源弹性能力不足,计算资源成本管 控能力欠缺. 2.集群资源调度能力和隔离能力不足。 3.计算与存储无法分离,大数据量分析时出 现数据存储资源瓶颈。 4.Spark submit方式提交分析作业参数支持 有限等缺点。 产品列表 容器服务Kubernetes版(ACK) 弹性容器实例(ECI) 文件存储HDFS 对象存储OSS 专有网络VPC 容器镜像服务ACR
应用范围 需要使用 Spark on Kubernetes解决方案的用户 对 Spark大数据分析平台计算资源成本控制考虑的用户 需要有灵活可扩展计算平台资源弹性及管控的用户 名词解释 文件存储 HDFS:阿里云文件存储 HDFS是面向阿里云 ECS实例及容器服务等计 算资源的文件存储服务,允许用户像在 Hadoop分布式文件系统中管理和访问 ,...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,容器服务 ACK,弹性容器实例 ECI,文件存储HDFS
基于仓一体架构使用MaxCompute对OSS湖数据分析预测
基于<em>湖</em>仓一体架构使用MaxCompute对OSS<em>湖数据分析</em>预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
步骤2使用数据湖构建之前,还需要在对应地域开通OSS服务和启用数据湖构建服务访问 部数据源的权限,未开通按照提示开通即可。说明:1.阿里云数据湖构建采用OSS作为统一数据湖位置,所以需要开通OSS服务。2.用户从数据源抽取数据到注册的数据湖位置,数据湖构建支持多种形式的数据源,目前RDSMySQL已对外开放。本例中EMR将...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
互联网电商行业离线大数据分析
互联网电商行业离线大<em>数据分析</em>
电商网站销售数据通过大数据分析后将业务指标数据在大屏幕上展示,如销售指标、客户指标、销售排名、订单地区分布等。大屏上销售数据可视化动态展示,效果震撼,触控大屏支持用户自助查询数据,极大地增强数据的可读性。
互联网电商行业离线大数据分析 最佳实践 业务架构 场景描述 本实践介绍了使用阿里云MaxCompute、数据库(RDS)、DataWorks等产品实现电商网站离线数据分 分析后的业务指标数据实时在大屏展示。通过完整 的实践Demo为例,提供从电商网站搭建,数据从RDS 同步到MaxCompute、再到DataWorks进行数据分析,最后在大屏上展示...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,API网关,云速搭CADT
车辆数据安全稳定上云和分析
阿里云物联网平台提供全托管的企业级实例服务,无需自建物联网基础设施即可实现车辆数据的安全稳定上云。
阿里云物联网平台提供全托管的企业级实例服务,无需自物联网基础设施即可实现车辆数据的安全稳定上云,同时通过对车辆数据分析,帮助企业快速实现设备数据和业务数据的融合,实现车辆智能化升级。具有低成本、高可靠、高性能、高安全等优势。方案预估:以1000辆车为例,1500元左右/月起(物联网平台+ECS,不含网络聚合...
来自: 解决方案
AnalyticDB MySQL仓版的用户运营分析实践
本方案只需一个湖仓版实例就能完成“数据入湖+作业开发+在线分析”的一站式用户运营数据分析,提供更高效的数据处理方案与更低的数据存储成本。
方案介绍AnalyticDB MySQL仓版的用户运营分析实践本架构将Kafka数据实时同步到云原生数据仓库AnalyticDB MySQL仓版,在AnalyticDB MySQL仓版中进行数据清洗、库分表、与云数据库RDS MySQL同步到AnalyticDB MySQL仓版的用户维度表进行多表关联聚合分析。最终在Quick BI呈现可视化的用户运营分析看板。解决问题:...
来自: 解决方案
数据库异地灾备
数据库异地灾备
场景描述 适用于不满足于单地域,对数据可靠性 (RPO)和服务可用性(RTO)要求更高 的,希望防范断电、断网等机房故障,抵 御地震、台风等自然灾害,具备异地容灾 备份恢复能力的客户业务场景。 解决问题 1.实时备份,RPO达到秒级 2.表级恢复,故障恢复时间大大缩短 3.长期归档,自动管理备份生命周期 4.异地灾备,构建数据库灾备中心 产品列表 专有网络VPC 云服务器ECS 弹性公网IP(EIP) 负载均衡SLB 云数据库RDSMySQL 数据库备份服务DBS 对象存储服务OSS 数据湖分析服务DLA 数据管理服务DMS 数据传输服务DTS
异地灾备,构建数据库灾备中心 产品列表 最佳实践频道 阿里云最佳实践分享群 专有网络 VPC 云服务器 ECS 弹性公网 IP(EIP)负载均衡 SLB 云数据库 RDS MySQL 数据库备份服务 DBS 对象存储服务 OSS 数据湖分析服务 DLA 数据管理服务 DMS 数据传输服务 DTS 云速搭 CADT 文档模板(手册名称)/文档版本信息 Oracle数据库与...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,数据管理,数据湖分析,数据库备份DBS,云速搭CADT
基于Flink+ClickHouse构建实时游戏数据分析
基于Flink+ClickHouse<em>构建</em>实时游戏<em>数据分析</em>
在互联网、游戏行业中,常常需要对用户行为日志进行分析,通过数据挖掘,来更好地支持业务运营,比如用户轨迹,热力图,登录行为分析,实时业务大屏等。当业务数据量达到千亿规模时,常常导致分析不实时,平均响应时间长达10分钟,影响业务的正常运营和发展。 本实践介绍如何快速收集海量用户行为数据,实现秒级响应的实时用户行为分析,并通过实时流计算Flink/Blink、云数据库ClickHouse等技术进行深入挖掘和分析,得到用户特征和画像,实现个性化系统推荐服务。 通过云数据库ClickHouse替换原有Presto数仓,对比开源Presto性能提升20倍。 利用云数据库ClickHouse极致分析性能,千亿级数据分析从10分钟缩短到30秒。 云数据库ClickHouse批量写入效率高,支持业务高峰每小时230亿的用户数据写入。 云数据库ClickHouse开箱即用,免运维,全球多Region部署,快速支持新游戏开服。 Flink+ClickHouse+QuickBI
结论:云数据库 ClickHouse更加适合海量数据分析型业务、大宽表聚合查询分析 Hash对齐 Join场景、实时日志分析场景等等 文档版本:20201224 6 基于 Flink+ClickHouse构建实时游戏数据分析 架构设计 2.架构设计 2.1.架构图 本实践主要以流处理为主线,搭建实验环境,构建在线用户行为分析平台:2.2.核心模块 游戏服...
来自: 最佳实践 | 相关产品:云服务器ECS,弹性公网IP,实时计算,Quick BI,消息队列 Kafka 版,云数据库 ClickHouse
数据集成 Data Integration
阿里云数据集成 Data Integration是跨异构数据、低成本、弹性扩展的数据采集同步平台,为DataX的商业版,支持ETL,支持50+数据源跨网络离线(全量/增量)同步。
为了快速数智化转型,拥抱新零售,新零售企业通过DataWorks构建数据中台,可以帮助企业降低TCO的同时,更好的依托云上生态,实现数据资产业务化闭环.新零售数据中台建设.业务多维分析.业务数据化,全域数据中台构建数智底座.数据业务化,数据综合治理驱动业务增长.实时计算Flink版.推荐搭配使用.随着新冠疫情等黑天鹅事件的...
来自: 云产品
< 1 2 3 >
共有3页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用