数据库系统和数据仓库_数据库系统和数据仓库相关产品

数据总线Datahub

数据总线(DataHub)服务是阿里云提供的流式数据(Streaming Data)服务，它提供流式数据的发布(Publish)和订阅(Subscribe)的功能，拥有高吞吐量、高稳定性、低成本等特点，与阿里云大数据生态系统完美打通，让您可以轻松构建基于流式数据的分析和应用。

1元体验简单易用的MySQL数据仓库，毫秒级海量数据多维分析！MySQL数据库+Quick BI数据可视化分析最佳实践.云数据库专属集群重磅发布.MySQL 三节点企业版发布通用型规格.MySQL 支持高可用版升级到三节点企业版.谢赟辉,靖鑫,也树.产品售卖通用模板，可支持自定义.旧商品卡片，建议使用「轻量商品卡片」.通用icon文字列表.脱胎...

来自：云产品

数据安全解决方案

数据是企业的核心资产，如何保护企业的云上数据，是每个企业管理者都应当重视的课题。在云平台提供更为安全便捷的数据保护能力的同时，阿里云根据自身多年的经验积累，结合大量云上客户的最佳实践，提供了一套完整的数据安全解决方案，帮助企业提升云上数据风险防御能力，实现企业核心及敏感数据安全可控。

数据不再单纯存储在数据库中，各类数据仓库、中台和非结构化文件、缓存都在企业中扮演着重要角色。分散数据的统一治理和权责定义，对企业提出了要求.理解数据生命周期，评估各阶段潜在风险.数据安全风险评估是企业信息系统建设的根基，从多个维度进行安全评估可以达到“事半功倍”的效果。在分析的过程中结合数据生命周期各...

来自：解决方案

系统可信

系统可信是用于实现云租户计算环境底层高等级安全的主要功能之一。通过在可信ECS实例等计算环境中提供虚拟信任根、启动信任链和远程证明机制，系统可信为用户提供了针对环境启动阶段和运行阶段的全方位可信保障，构建了基于硬件的完善安全体系。系统可信的主体功能是保护系统启动过程中的关键组件，以及保护用户指定的关键应用。产品的优势在于：第一，针对国家等级保护2.0规范要求，助力用户计算环境高分通过合规测评；第二，基于安全芯片，构建涵盖计算环境各层面的完整可信链。产品所针对的场景，主要是用户需要高分通过等级保护测评，彰显安全可信方面的先进性，以及需要底层高等级安全的场景。

1元体验简单易用的MySQL数据仓库，毫秒级海量数据多维分析！MySQL数据库+Quick BI数据可视化分析最佳实践.云数据库专属集群重磅发布.MySQL 三节点企业版发布通用型规格.MySQL 支持高可用版升级到三节点企业版.谢赟辉,靖鑫,也树.通用icon文字列表.主备架构，故障秒级切换.SQL Server实例提供主备架构保证高可用，主实例故障...

来自：云产品

数据传输解决方案

数据传输解决方案支持关系型数据库、NoSQL、大数据(OLAP)等数据源间的数据传输。它是一种集数据迁移、数据订阅及数据实时同步于一体的数据传输服务。数据传输致力于在公共云、混合云场景下，解决远距离、毫秒级异步数据传输难题。

实时数据仓库、实时搜索、数据汇总.RPO：0-亚秒级.RDS MySQL版.蔡伟杰,靖鑫,也树.支持多种数据库的零停机上云迁移.DTS基于数据库日志监听解析的技术实现非侵入式的增量数据实时采集。可将MySQL，PostgreSQL、Oracle、DB2及SQLServer等数据库的增量日志实时采集，实现多种数据库的零停机上云迁移.支持数据异地灾备、双活数据...

来自：解决方案

数据集成 Data Integration

阿里云数据集成 Data Integration是跨异构数据、低成本、弹性扩展的数据采集同步平台，为DataX的商业版，支持ETL，支持50+数据源跨网络离线(全量/增量)同步。

主要通过定义数据来源和去向的数据源和数据集，提供一套抽象化的数据抽取插件(称之为 Reader)、数据写入插件(称之为 Writer)，并基于此框架设计一套简化版的中间数据传输格式，从而达到任意结构化、半结构化数据源之间数据传输之目的.Reader&Writer插件.数据集成支持在数据抽取过程中进行简单的数据转换操作（如日期解析、...

来自：云产品

DTS数据同步集成MaxCompute数仓

场景描述本文Step by Step介绍了通过数据传输服务 DTS实现从云数据库RDS到MaxCompute的数据同步集成，并介绍如何使用DTS和 MaxCompute数仓联合实现数据ETL幂等和数据生命周期快速回溯。解决问题 1.实现大数据实时同步集成。 2.实现数据ETL幂等。 3.实现数据生命周期快速回溯。产品列表 MaxCompute 数据传输服务DTS DataWorks 云数据库RDS MySQL 版

数据抽取不幂等或容错率低，如凌晨 0:00启动的 ETL任务因为各种原因(数据库 HA切换、网络抖动或 MAXC写入失败等)失败后，再次抽取无法获取 0:00时的数据状态。2.针对不规范设计表，如没有 create_time/update_time的历史遗留表，传统 ETL需全量抽取。3.实时性差，抽取数据+重试任务往往需要 1-3小时。另外数据库的数据...

来自：最佳实践 | 相关产品：专有网络 VPC,云数据库RDS MySQL 版,数据传输,DataWorks,大数据计算服务 MaxCompute

Databricks数据洞察

阿里云Databricks数据洞察是基于Apache Spark的全托管数据分析平台, 内核采用更高效、稳定的商业版Databricks Runtime和Delta Lake。可满足数据分析师、数据工程师和数据科学家在大数据场景下对数据湖分析、实时数仓、离线数仓、BI数据分析、AI机器学习等需求

自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察.使用Databricks的Notebook进行机器学习开发.标准商品卡片-标题.旧商品卡片，建议使用「轻量商品卡片」.产品优势-标题.通用icon文字列表.Databricks Runtime内核，性能明显优于社区版Spark，最高可达50倍提升。满足高性能、高稳定性、可弹性的计算需求.Databricks ...

| 产品优势 | 应用场景 | 文档与工具

来自：云产品

游戏数据运营融合分析

场景描述 1.游戏行业有结构化和非结构化数据融合分析需求的客户。 2.游戏行业有数据实时分析需求的客户，无法接受T+1延迟。 3.对数据成本有一定诉求的客户，希望物尽其用尽量优化成本。 4.其他行业有类似需求的客户。方案优势/解决问题 1.秒级实时分析：依托ADB计算密集型实例，秒级监控DAU等数据，为广告投放效果提供有力的在线决策支撑。 2.高效数据融合分析：打通结构化和非结构化数据，支撑产品体验分析；广告买量投放效果实时（分钟级）分析，渠道的评估更准确。 3.低成本：DLA融合冷数据分析+ADB存储密集型温数据分析+ADB计算密集型热数据分析，在满足各种分析场景需求的同时，有效地降低的客户的总体使用成本。 4.学习成本低：DLA和ADB兼容标准SQL语法，无需额外学习其他技术。产品列表 专有网络VPC、负载均衡SLB、NAT网关、弹性公网IP 云服务器ECS、日志服务SLS、对象存储OSS 数据库RDSMySQL、数据传输服务DTS、数据管理DMS 分析型数据库MySQL版ADS 数据湖分析DLA、QuickBI

文档版本：20210224 47 游戏数据运营融合分析部署 RDS-ADB高性能库数据采集步骤8 登录数据库管理系统，创建数据库 appdb_all。文档版本：20210224 48 游戏数据运营融合分析部署 RDS-ADB高性能库数据采集文档版本：20210224 49 游戏数据运营融合分析部署 RDS-ADB高性能库数据采集 2.5.创建和配置 DTS同步链路创建 DTS...

来自：最佳实践 | 相关产品：云数据库RDS MySQL 版,对象存储 OSS,云原生数据仓库AnalyticDB My,数据湖分析,Quick BI

互联网电商行业离线大数据分析

电商网站销售数据通过大数据分析后将业务指标数据在大屏幕上展示，如销售指标、客户指标、销售排名、订单地区分布等。大屏上销售数据可视化动态展示，效果震撼，触控大屏支持用户自助查询数据，极大地增强数据的可读性。

 大数据开发治理平台DataWorks：基于阿里云ODPS/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者，互联网电商行业离线大数据分析最佳实践概述 DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论，同时与数万名政务/金融/零售/互联网/...

来自：最佳实践 | 相关产品：云服务器ECS,云数据库RDS MySQL 版,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,API网关,云速搭CADT

异地双活场景下的数据双向同步

概述随着客户业务规模的扩大，对系统高可用性要求越来越高，越来越多用户采用异地双活/多活架构，多活架构往往涉及业务侧做单元化改造，本方案仅模拟用户已做单元化改造后的数据双向同步，数据库采用双主架构，本地写本地读，同时又保证双库的数据一致性，为业务增加可用性和灵活性。适用场景 数据库双向同步 数据库全局ID不冲突 双活架构的数据库建设问题技术架构本实践方案基于如下图所示的技术架构和主要流程编写操作步骤：方案优势 DTS双向同步，采用独立模块避免数据同步占用系统资源。 奇偶ID涉及，避免数据冲突。 DTS多种处理冲突的方式供业务选择。 安全：原生的多租户系统，以项目进行隔离，所有计算任务在安全沙箱中运行。

对系统高可用性要求越 数据库双向同步来越高，越来越多用户采用异地双活/多活架构，多 数据库全局 ID不冲突活架构往往涉及业务侧做单元化改造，本方案仅模双活架构的数据库建设问题拟用户已做单元化改造后的数据双向同步，数据库 采用双主架构，本地写本地读，同时又保证双库的数据一致性，为业务增加可用性和灵活性。...

来自：最佳实践 | 相关产品：云数据库RDS MySQL 版,负载均衡 SLB,容器服务 ACK,数据传输,云企业网,容器镜像服务 ACR,云解析DNS

智能数据建设与治理Dataphin

Dataphin遵循阿里巴巴集团多年实战沉淀的大数据建设OneData体系（OneModel、OneID、OneService），集产品、技术、方法论于一体，一站式地为您提供集数据引入、规范定义、智能建模研发、数据萃取、数据资产管理、数据服务等的全链路智能数据构建及管理服务。助您打造属于自己的标准统一、资产化、服务化和闭环自优化的智能数据体系，驱动创新。

在线下零售餐饮行业的场景中，随着业务的发展，客户的门店数量及会员数量快速扩张，传统的数据加工处理和管理能力已经无法匹配业务的发展，在此情景下，客户通过阿里云对企业的业务系统和数据平台进行升级，基于Dataphin快速构建企业数据中台的数据，并结合Quick BI进一步实现对会员数据的分析和挖掘，最终实现业务上千人...

来自：云产品

基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测

基于湖<em>仓</em>一体架构使用MaxCompute对OSS湖<em>数据</em>分析预测

本篇最佳实践先创建EMR集群作为数据湖对象，Hive元数据存储在DLF，外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通，实现元数据统一。最后通过一个毒蘑菇的训练和预测demo，演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。

基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测实践业务架构场景描述数据湖和数据仓库是当前大数据技术条件下构建分布式系统的两种数据架构设计取向，数据湖偏向灵活性，数据仓库侧重成本、性能、安全、治理等企业级特性。但是数据湖和数据仓库的边界正在慢慢模糊，数据湖自身的治理能力、数据仓库延伸到外部...

来自：最佳实践 | 相关产品：对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭

利用交互式分析(Hologres)进行数据查询

场景描述：随着收集数据的方式不断丰富，企业信息化程度越来越高，企业掌握的数据量呈TB、 PB或EB级别增长。同时，数据中台的快速推进，使数据应用主要为数据支撑、用户画像、实时圈人及广告精准投放等核心业务服务。高可靠和低延时地数据服务成为企业数字化转型的关键。 Hologres致力于低成本和高性能地大规模计算型存储和强大的查询能力，为您提供海量数据的实时数据仓库解决方案和实时交互式查询服务。解决问题 1.加速查询MaxCompute数据 2.快速搭建实时数据仓库 3.无缝对接主流BI工具产品列表 MaxCompute Hologres 实时计算Flink 专有网络VPC DataWorks DataV

Hologres常见使用场景联邦分析实时数据和离线数据业务数据分为冷数据和热数据，冷数据存储在离线数据仓库MaxCompute中，热数据存储在Hologres中。Hologres可以联邦分析实时数据和离线数据，对接BI分析工具，快速响应简单查询与复杂查询的业务需求。图1.联邦分析架构图实时数据仓库 实时写入业务数据至实时计算，使用...

来自：最佳实践 | 相关产品：大数据计算服务 MaxCompute,DataV数据可视化,实时计算,Hologres,云速搭CADT

函数计算实现弹性音视频处理系统

场景描述本示例通过函数计算部署一个高弹性高可用的音视频处理系统。尤其适合视频网站使用，每天有大量的上传视频，需要及时转码处理以适配各种终端及网络条件，要求短时间内准备大量的计算资源进行大规模并行转码处理，同时希望基于 FFmpeg自建的转码服务能简单迁移。解决问题 1.如何使用函数计算部署音视频处理系统。 2.如何进行系统的压测。产品列表函数计算服务文件存储NAS 对象存储OSS 函数工作流FnF 日志服务SLS

这使您的函数可以像访问本地文件系统一样编写访问存储在其中一个 NAS 文件系统上的文件。详见 https://cn.aliyun.com/product/nas 对象存储 OSS：海量、安全、低成本、高可靠的云存储服务，提供 99.9999999999%的数据可靠性。使用 RESTful API 可以在互联网任何位置存储和访问，容量和处理能力弹性扩展，多种存储类型供...

来自：最佳实践 | 相关产品：专有网络 VPC,对象存储 OSS,文件存储NAS,日志服务（SLS）,Serverless 工作流

EMR集群安全认证和授权管理

场景描述阿里云EMR服务Kafka和Hadoop安全集群使用Kerberos进行用户安全认证，通过Apache Ranger服务进行访问授权管理。本最佳实践中以 Apache Web服务器日志为例，演示基于Kafka 和Hadoop的生态组件构建日志大数据仓库，并介绍在整个数据流程中，如何通过Kerberos和 Ranger进行认证和授权的相关配置。解决问题 1.创建基于Kerberos的EMR Kafka和 Hadoop集群。 2.EMR服务的Kafka和Hadoop集群中 Kerberos相关配置和使用方法。 3.Ranger中添加Kafka、HDFS、Hive和 Hbase服务和访问策略。 4.Flume中和Kafka、HDFS相关的安全配置。产品列表：E-MapReduce、专有网络VPC、云服务器ECS、云数据库RDS版

启用 Hue Hue是用于数据库和数据仓库的开源 SQL Assistant，阿里云 EMR服务将其作为默认组件进行了安装。步骤1 首先启动 HDFS服务的 HttpFS组件。步骤1 新增加安全组规则，允许访问 8888端口，该端口用于访问 Hadoop集群的 Hue管理界面。强烈建议在非维护期间关闭该端口访问。步骤2 获取 Hue的管理员密码。Hue服务默认在...

来自：最佳实践 | 相关产品：专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,E-MapReduce

自建Hive数仓迁移到阿里云EMR

场景描述客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统，购买阿里云EMR集群之后，涉及到将数据仓库和Hive元数据的数据库迁移上云。目前主流Hive数据仓库迁移场景为1.x 版本迁移到阿里云EMR(Hive2.x版本），涉及到数据订正更新步骤。解决的问题 Hive数据仓库的数据迁移方案 Hive元数据库的迁移方案 Hive跨版本迁移后的数据订正产品列表 E-MapReduce，VPC，ECS，OSS，VPN网关。

自建 Hive数据仓库跨版本迁移到阿里云 EMR 场景描述解决的问题客户在IDC或者公有云环境自建Hadoop集群构建 Hive数据仓库的数据迁移方案 数据仓库和分析系统，购买阿里云 EMR集群之后，Hive元数据库的迁移方案涉及到将数据仓库和Hive元数据的数据库迁移上 Hive跨版本迁移后的数据订正云。目前主流 Hive数据仓库迁移场景...

来自：最佳实践 | 相关产品：专有网络 VPC,云服务器ECS,对象存储 OSS,VPN网关,E-MapReduce,云速搭

金融智能数仓解决方案

金融智能数仓解决方案是阿里云自研高性能、海量可扩展数据仓库服务、兼容部分 Oracle/Teradata 语法生态，大量应用于阿里巴巴集团内部电商，物流，文娱，广告等业务部门，服务于阿里云的金融、政企、互联网等各行业用户，支持快速构建新一代云化数据仓库服务。

结合阿里巴巴多年内部应用和数据库的迁移经验，自主研发的应用和数据迁移评估工具 ADAM，能帮助用户最大限度降低数据库和应用迁移上云的风险、技术难度和实施周期.新一代采用 Cascade 框架的 SQL 优化器，面向全并行执行架构，基于代价优化 CBO 和规则优化 RBO 相结合，实现复杂 SQL 免调优，自研向量化引擎和列存储智能...

| 方案架构 | 方案优势

来自：解决方案

阿里云最佳实践离线大数据workshop

本最佳实践，首先搭建一个简化的电商 demo 系统，然后为此 demo 系统构建一套离线大数据分析系统。实践目标 1. 学习搭建一个离线大数据分析系统，学习从数据采集到数据存储和业务分析的业务流程。 2. 整个离线大数据分析系统全部基于阿里云产品进行搭建，学习掌运用各个服务组件及各个组件之间如何联动。背景知识要求熟练掌握 SQL 语法对大数据体系系统知识有一定的了解

MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型，能够更快速的解决用户海量数据计算问题，有效降低企业成本，并保障数据安全。详见：https://help.aliyun.com/product/27797.html  Dataworks：DataWorks基于MaxCompute/EMR/MC-Hologres等大数据计算引文档版本：20210802（发布...

来自：最佳实践 | 相关产品：云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,日志服务（SLS）,大数据计算服务 MaxCompute,DataV数据可视化,数据总线,Quick BI,云速搭

大数据workshop

系统架构设计下图为所设计的系统架构设计，主要包括数据源（两类业务数据：用户行为日志和业务后台数据库）、日志采集、日志传输、实时计算、数据存储和同步、数据展现这几大模块共同构成实时大数据数据仓库。注：对于 DIM（维度层）的维度数据可以主要使用 MySQL、HBase、Hologres三种存储引擎。对于维表数据比较少的...

来自：最佳实践 | 相关产品：块存储,云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,弹性公网IP,数据传输,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,实时计算,数据总线,Quick BI,Hologres

数据库系统和数据仓库_相关内容

新品推荐