自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察
自建Hive<em>数据</em>仓库跨版本迁移到阿里云Databricks<em>数据</em>洞察
场景描述 客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云Databricks数据洞察集群之后,涉及到数仓数据和元数据的迁移以及Hive版本的订正更新。 方案优势 1. 全托管Spark集群免运维,节省人力成本。 2. Databricks数据洞察与阿里云其他产品(OSS、RDS、MaxCompute、EMR)进行深度整合,支持以这些产品为数据源的输入和输出。 3. 使用Databricks Runtime商业版引擎相比开源Spark性能有3-5倍的提升。 解决问题 1. Hive数仓数据迁移OSS方案。 2. Hive元数据库迁移阿里云RDS方案。 3. Hive跨版本迁移到Databricks数据洞察使用Delta表查询以提高查询效率。
自建 Hive数据仓库跨版本迁移到阿里云 Databricks数据洞察 业务架构 场景描述 客户在 IDC或者公有云环境自建 Hadoop集群 构建数据仓库和分析系统,购买阿里云 Databricks数据洞察集群之后,涉及到数仓 和元数据的迁移以及 Hive版本的订正更新。方案优势 1.全托管 Spark集群免运维,节省人力成 本。2.Databricks数据洞察...
来自: 最佳实践 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储HDFS,spark
互联网电商行业离线大数据分析
互联网电商行业离线大<em>数据</em>分析
电商网站销售数据通过大数据分析后将业务指标数据在大屏幕上展示,如销售指标、客户指标、销售排名、订单地区分布等。大屏上销售数据可视化动态展示,效果震撼,触控大屏支持用户自助查询数据,极大地增强数据的可读性。
作为阿里巴巴数据中台的建设者,互联网电商行业离线大数据分析 最佳实践概述 DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。 云原生大数据计算服务 MaxCompute:是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,API网关,云速搭CADT
电商网站数据埋点及分析
电商网站<em>数据</em>埋点及分析
场景描述 数据埋点是数据产品经理、数据运营以及数据分 析师,基于业务需求(例如:CPC点击付费广 告中统计每一个广告位的点击次数),产品需求 (例如:推荐系统中推荐商品的曝光次数以及点 击的人数)对用户行为的每一个事件对应的位置 进行开发埋点,并通过SDK上报埋点的数据结 果,记录数据汇总后进行分析,推动产品优化或 指导运营。 解决问题 1.电商网站广告位效果统计分析 2.电网网站推荐商品曝光、点击、购买等行为统 计分析 3.电商网站用户分布分析 4.电商网站页面热点图分析等 产品列表 日志服务SLS Dataworks 云服务器ECS 云数据库RDS版 负载均衡SLB 专有网络VPC
文档版本:20220127 I 电商网站数据埋点及分析 前言 前言 概述 本文以电商网站为例,使用日志服务采集日志,RDS作为后端数据存储服务并使用日 志服务对数据进行分析。数据埋点是数据产品经理、数据运营以及数据分析师,基于 业务需求(例如:CPC点击付费广告中统计每一个广告位的点击次数),产品需求(例 如:推荐系统中...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,日志服务(SLS),DataWorks,云速搭CADT
迁移运维管理
阿里云提供一系列的运维管理工具:日志服务SLS、云治理中心等帮助你自动化的开发和运维,能够更加轻松控制云基础产品与基础设施。
从成本、性能、安全、数据保护、稳定性、访问分析六个纬度,提供对存储类、网络类、数据库类等云产品的精细化运维管理能力.云产品可观测平台发布.云治理成熟度模型,帮助企业得以清晰地了解自身在云上的治理成熟度水位,使得企业能够安全、高效地管理云上资源.开放平台重磅发布“云上治理成熟度模型”.日志服务是云原生观测...
来自: 云产品
Function Compute构建高弹性大数据采集系统
Function Compute构建高弹性大<em>数据</em>采集系统
当前互联网很多场景都存在需要将大量的数据信息采集起来然后传输到后端的各类系统服务中,对数据进行处理、分析,形成业务闭环。比如游戏行业中的游戏发行、游戏运营,产互行业中的数字营销,物联网、车联网行业中的硬件、车辆信息上报等等。这些场景普遍存在数据采集量大、数据传输需要稳定且吞吐量大的特点,给整个数据采集传输系统带来很大的挑战。在这个场景中,有三个关键的环节,数据采集、数据传输、数据处理。该最佳实践主要涉
Function Compute构建高弹性大数据采集系统 最佳实践 业务架构 场景描述 当前互联网很多场景都存在需要将大量的数据 信息采集起来然后传输到后端的各类系统服务 中,对数据进行处理、分析,形成业务闭环。比 如游戏行业中的游戏发行、游戏运营,产互行业 中的数字营销,物联网、车联网行业中的硬件、车辆信息上报等等。这些...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,日志服务(SLS),函数计算,消息队列 Kafka 版,云速搭CADT
基于弹性供应组构建大数据分析集群
基于弹性供应组构建大<em>数据</em>分析集群
场景描述 基于弹性供应组(APG)搭建spark计算集 群,提供一键开启跨售卖方式、跨可用区、 跨实例规格的计算集群交付模式的实践。 方案优势 1.超低成本:跨售卖方式提供计算实 例,按秒计费,可全部使用spot实例 交付,最高可省90%成本。 2.稳定可靠:跨可用域、跨实例规格, 降低spot被集体释放的风险;自动托 管,分钟级巡检,动态保证集群的算 力。 3.快速交付:单次可在5分钟内交付 2000个实例。 4.多策略组合:可分别指定spot和按量 实例的交付策略,以及差额补足的策 略,包括成本最低、打散和折中。 解决问题 1.大规模计算集群成本高。 2.创建ECS实例方式单一,无法跨计费 方式、可用区及规格等核心参数。 3.当可用区资源紧张,无法自动保证基于 spot类型的稳定算力。 产品列表 专有网络VPC 云服务器ECS
如果选择释放策略,会释放掉抢占式实 例,请注意及时备份数据。设置全局的抢占式实例上限价格 供应组过期时是否关停供应组内实例 文档版本:20200619 37 基于弹性供应组构建大数据集群分析 Spark集群搭建 超过容量时是否关停供应组内实例 步骤7 确认创建后,弹性供应组会通过动态规划算法,根据您设定的购买量和策略,自动...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,弹性公网IP
对象存储 OSS
阿里云对象存储 OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云备份服务,提供最高可达 99.995 % 的服务可用性。多种存储类型供选择,全面优化存储成本。
25查看教程更多免费试用技术解决方案多媒体数据存储与分发云原生企业级数据湖多媒体数据存储与分发架构采用对象存储 OSS 标准类型提供海量存储空间和高吞吐带宽,结合云弹性计算 ECS、内容分发网络 CDN、智能媒体管理 IMM 等产品,为客户提供源站数据存储和分发完整解决方案,同时结合日志服务 SLS 能力提供可观测数据分析...
来自: 云产品
DTS数据同步集成MaxCompute数仓
DTS<em>数据</em>同步集成MaxCompute数仓
场景描述 本文Step by Step介绍了通过数据传输服务 DTS实现从云数据库RDS到MaxCompute的 数据同步集成,并介绍如何使用DTS和 MaxCompute数仓联合实现数据ETL幂等和数 据生命周期快速回溯。 解决问题 1.实现大数据实时同步集成。 2.实现数据ETL幂等。 3.实现数据生命周期快速回溯。 产品列表 MaxCompute 数据传输服务DTS DataWorks 云数据库RDS MySQL 版
数据抽取不幂等或容错率低,如凌晨 0:00启动的 ETL任务因为各种原因(数据库 HA切换、网络抖动或 MAXC写入失败等)失败后,再次抽取无法获取 0:00时的 状态。2.针对不规范设计表,如没有 create_time/update_time的历史遗留表,传统 ETL需 全量抽取。3.实时性差,抽取数据+重试任务往往需要 1-3小时。另外数据库的数据...
来自: 最佳实践 | 相关产品:专有网络 VPC,云数据库RDS MySQL 版,数据传输,DataWorks,大数据计算服务 MaxCompute
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
存储数据服务日志服务 SLS免费试用行业领先的日志大数据解决方案,一站式提供数据收集、清洗、分析、可视化和告警功能。云备份 Cloud Backup简单易用、敏捷高效、安全可靠的公共云数据管理服务,可为阿里云、本地机房内的多种数据类型提供备份、容灾保护以及策略化归档管理。智能媒体管理 IMM场景化封装数据智能分析管理...
来自: 云产品
数据库异地灾
数据库异地灾<em>备</em>
场景描述 适用于不满足于单地域,对数据可靠性 (RPO)和服务可用性(RTO)要求更高 的,希望防范断电、断网等机房故障,抵 御地震、台风等自然灾害,具备异地容灾 备份恢复能力的客户业务场景。 解决问题 1.实时备份,RPO达到秒级 2.表级恢复,故障恢复时间大大缩短 3.长期归档,自动管理备份生命周期 4.异地灾备,构建数据库灾备中心 产品列表 专有网络VPC 云服务器ECS 弹性公网IP(EIP) 负载均衡SLB 云数据库RDSMySQL 数据库备份服务DBS 对象存储服务OSS 数据湖分析服务DLA 数据管理服务DMS 数据传输服务DTS
备份网络限速:0表示不限速。步骤6 本例保留默认配置,点击 下一步。文档版本:20220207 62 数据库异地灾 配置异地冷环境 全量备份生命周期配置和增量备份生命周期配置:最长支持保存 1825天,保留时间 到期后,备份集自动删除,默认 730天。步骤7 点击 预检并启动。步骤8 待预检全部成功后点击 立即启动,开始第一次...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,数据管理,数据湖分析,数据库备份DBS,云速搭CADT
云原生AI解决方案
云原生AI解决方案利用容器技术全面支持GPU和CPU异构资源集群统一管理和调度,与阿里云其他资源服务深度整合,支持机器学习计算的完整生命周期,提供低门槛、开放、高效的深度学习解决方案。
基于大规模GPU集群部署运维经验,充分利用阿里云计算资源(如ECS、EGS)与数据服务能力(如OSS、NAS、CPFS、EMR等),提供端到端的最佳实践.支持深度学习能力一键服务化发布,与云上应用的轻松集成.默认色值为#ededed,添加后将覆盖默认色值.默认色值为#fafafa,添加后将覆盖默认色值.谢赟辉,靖鑫,也树.大规模围棋离线训练....
来自: 解决方案
企业级云灾解决方案
阿里云企业级云灾备解决方案是一个为企业级应用提供云上容灾保护与备份恢复的服务。它可以支持服务器镜像、文件、应用和数据库等不同保护粒度,确保数据安全性和业务连续性。
混合云灾备存储与阿里云混合云灾服务无缝集成,承载国内外领先备份软件,是云灾的桥梁。灾存储带冗余电源、冗余网口、RAID控制器等硬件加固功能,经阿里云公共云级压力测试,提供了安全稳定的本地灾空间来独 立保存备份数据,并且可以根据策略加密压缩后上传至云端,实现全自动云备份。更可以配合云上服务将数据在...
来自: 解决方案
云数据库MongoDB版
阿里云云数据库MongoDB版是完全兼容MongoDB协议、高度兼容DynamoDB协议的在线文档型数据库服务。支持单节点、双节点、副本集和分片集群四种部署架构,能够满足不同的业务场景需要。
备份存储至对象存储OSS,多层网络防护机制,抵御大多数情况的恶意数据损毁.数据安全:自动备份和一键恢复,多层网络安全防护.数据传输服务(Data Transmission Service,简称DTS).数据库传输平台,支持RDBMS(关系型数据库)、NoSQL、OLAP等多种数据源之间数据进行交互,提供了数据迁移、实时数据订阅及数据实时同步等多种数据...
来自: 云产品
云数据库Redis
云数据库 Redis 版是一种全托管、兼容Redis协议的内存数据库服务,包含社区版Redis和企业版Tair,支持主从、集群和读写分离架构,具备低延迟、大吞吐、弹性扩缩容的特点。Tair提供多种系列满足不同场景的性价比要求,更有全球多活、数据闪回、大热Key探测与优化、丰富的数据结构,赋能大规模高性能要求的在线数据业务。
基于阿里云飞天分布式系列和SSD高性能存储能力的缓存数据库,双机热备架构保障故障自动迁移,两种数据持久化机制确保数据备份可靠,提供数据持久化保障.实例连接网络吞吐量可定制的高并发数据库,灵活的集群版规格适配高并发场景;产品形态丰富,可平滑扩容存储空间、网络吞吐量及连接.资深阿里云专家提供专业护航...
来自: 云产品
云原生数据库
PolarDB是阿里云自研的云原生数据库,在存储计算分离架构下,利用了软硬件结合的优势,为用户提供秒级弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL和PostgreSQL生态,支持分布式扩展,高度兼容Oracle语法。
金融场景下对业务要求高可用和强一致性,PolarDB采用存储和计算分离的架构,支持秒级的故障恢复、全局数据一致性和数据备份容灾等功能,充分满足金融级合规可靠性要求.多可用区架构,在多个可用区内都有数据备份,为数据库提供容灾和备份。通过GDN全球数据库网络功能实现数据的异地灾,跨地域实例可同时读写,且业务无需...
来自: 云产品
自建ElasticSearch迁移阿里云
自建ElasticSearch迁移阿里云
场景描述 以ElasticSearch为例,演示搭建模拟业务系统、 VPN网关和IPSecVPN隧道,介绍如何通过快照 的方式,将ElasticSearch索引数据安全备份到 阿里云OSS存储空间,以及介绍如何将备份在 OSS的快照仓库恢复到阿里云ElasticSearch实 例,进一步达到ElasticSearch迁移上云的目的。 解决的问题 自建ElasticSearch的云上/跨云备份需求。 自建ElasticSearch迁移到阿里云 ElasticSearch服务实例。 产品列表 VPC,ECS,VPN网关,OSS,阿里云ElasticSearch,云速搭CADT
数据高可用和灾需求,将 ElasticSearch中存储的索引 备份至阿里云 OSS的存储空间,同时备份数据流基于 IPSec VPN/专线进行安 全传输。使用者可以进一步将保存在 OSS存储空间中的快照,恢复到自建 ElasticSearch服务器或者阿里云的 ElasticSearch实例。名词解释 云速搭 CADT:是一款为上云应用提供自助式云架构...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,Elasticsearch,云速搭
阿里云盘企业版
阿里云盘企业版(Cloud Drive Enterprise Edition, 简称 CDE)是基于阿里云存储高可用及高安全能力提供的一项企业级云存储服务
阿里云盘企业版(Cloud Drive for Enterprises,简称CDE,原网盘相册服务企业版)是基于阿里云存储高可用及高安全能力提供的一项企业级云存储服务,帮助企业轻松实现数据存储、共享、管理和备份,解决办公文件的搜索、共享、审计等管理难题,助力企业实现数据存储到商业价值变现的一站式文件管理和存储解决方案....
来自: 云产品
云数据库 RDS MySQL版
阿里云云数据库RDS MySQL是一种稳定可靠、可弹性伸缩的在线MySQL数据库服务, 提供了高可用、高可靠、高安全、易运维等一站式的数据库解决方案,帮助您免除MySQL运维的烦恼。
备份回档:RDS 提供数据备份和日志备份两种功能按备份集恢复和按时间点恢复,以及按备份集恢复和按时间点恢复两种恢复功能。容灾安全多可用区实例容灾:通过异步或半同步的数据复制方式和高效的主切换机制,提供高于物理服务器极限的数据库可用性灾实例:通过数据传输服务(DTS)实现主实例和异地灾实例之间的实时...
来自: 云产品
< 1 2 3 4 ... 18 >
共有18页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用