大数据产品规划与设计

_相关内容

常见问题

如何理解开源云原生的大数据技术与产品?MaxCompute作为大数据平台,对业务数据是否有好的监控手段?MaxCompute的项目发挥什么作用?如何获取MaxCompute中的Accesskey_ID和AccessKey_Secret?现有账号的AccessKey被禁用,创建一个新的...

Spark集成分析

DLA Ganos是基于云原生数据湖分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储计算的数据引擎产品。基于DLA无服务器化(Serverless)数据湖分析服务内置的Spark计算引擎,DLA Ganos提供了不同级别的数据分析模型,...

Spark集成分析

DLA Ganos是基于云原生数据湖分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储计算的数据引擎产品。基于DLA无服务器化(Serverless)数据湖分析服务内置的Spark计算引擎,DLA Ganos提供了不同级别的数据分析模型,...

产品简介

DLA Ganos是基于云原生数据湖分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储计算的数据引擎产品。基于DLA无服务器化(Serverless)数据湖分析服务内置的Spark计算引擎,DLA Ganos打通了阿里云各个存储系统,如...

数据分析整体趋势

大数据与数据库一体化:早期大数据技术以牺牲一定程度一致性为基础提供分布式能力,解决了传统单机数据库的扩展性不足问题,在MapReduce基础上提供了标准SQL接口,架构上也逐步采用了部分MPP数据库技术;另一方面,分布式数据库也快速发展...

数据仓库研发规范概述

本文将为您介绍数据仓库研发规范的阶段规划、角色职责和整体流程。在大数据时代,规范地进行数据资产管理已成为推动互联网、大数据、...数据仓库研发规范整体流程 下图为根据阶段规划与角色职责的内容,整理出的数据仓库研发规范的整体流程。

产品简介

数据专家服务 数据专家服务(Bigdata Expert Service)是由阿里云数据专家基于阿里云多年数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

Dataphin新手引导

新建流程引导 帮助您从零开始逐步完成数据规划与研发步骤,了解Dataphin的基础操作步骤。单击 去导入 按钮,进入 管理中心-预制模型-模型市场 页面,详情请参见 导入模型。新建流程引导 帮助您按照标准步骤逐步完成模型配置,从第一步到第...

简介

系统兼容开源GeoMesa、GeoServer等生态,内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等,结合云数据库HBase强大的分布式存储能力以及Spark分析平台能力,广泛应用于空间、时空、遥感大数据存储、查询、分析与数据挖掘...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

什么是Dataphin

规范定义 建模研发 基于规范定义的数据元素,进行设计与构建可视化的数据模型。数据模型提交发布后,Dataphin自动化地生成代码与调度任务,大大提升了数据研发效率。规范建模 编码研发 基于通用的代码编辑页面,灵活地进行个性化的数据编码...

数据建模:智能数据建模

智能数据建模是阿里云DataWorks自主研发的智能数据建模产品,沉淀了阿里巴巴十多年来数仓建模方法论的最佳实践,包含数仓规划数据标准、维度建模及数据指标四大模块,帮助企业在搭建数据中台、数据集市建设过程中提升建模及逆向建模的...

设计规范

分区设计与存储逻辑 一张表里有很多个一级分区,每个一级分区都会按时间存储二级分区,每个二级分区都会存储所有的列,如下图所示。分区设计需要注意:设置分区的数量上限。避免每个分区中只存少量数据。以方便数据查询和计算为前提设置...

计费逻辑说明

产品类型 功能介绍 计费项 计费说明 计费标准参考 智能数据建模 智能数据建模是DataWorks自研的建模产品,支持数仓规划设计、制定并沉淀企业数据标准、维度建模、数据指标定义,帮助您将建模设计产出的维度表、明细表、应用表、汇总表物化...

概述

概述 DataWorks数据建模支持数仓规划设计、制定并沉淀企业数据标准、维度建模、数据指标定义,通过使用DataWorks数据建模,您可以将建模设计产出的维度表、明细表和汇总表物化到计算引擎中并进一步应用。数仓规划 使用DataWorks进行数据...

什么是MaxCompute

MaxCompute还深度融合了阿里云如下产品:DataWorks 基于DataWorks实现一站式的数据同步、业务流程设计数据开发、管理和运维功能。人工智能平台PAI 基于机器学习平台的算法组件实现对MaxCompute数据进行模型训练等操作。实时数仓Hologres ...

实施步骤

通过DTS实时同步PolarDB for MySQL数据到分析型数据库MySQL版...如果需要同步的表数量较少且分析型数据库MySQL版表结构源表差异较,可以在分析型数据库MySQL版中提前 创建表,配置同步链路 时需要把步骤7中的中 结构初始化 选项去掉即可。

创建数仓分层

应用数据层 ADS(Application Data Service)ADS层用于存放数据产品个性化的统计指标数据,输出各种报表。例如,某电商企业,在6月9日至6月19日,杭州地域出售的各球类商品的数量及排行情况。公共维度层 DIM(Dimension)DIM层使用维度...

权限管理规范化数据开发

说明 关于简单模式标准模式差异详情可参考文档:必读:简单模式和标准模式的区别 标准模式对使用流程的影响 如图,标准模式“生产、开发隔离”的模式将影响数据模型设计数据处理逻辑代码发布等流程。实践操作流程 以下以一个具体的实践...

合规&认证

个人信息保护 瓴羊智能服务公司积极跟进国内、国际对产品合规的要求,不仅积极对接各级监管机构,确保提供的产品和服务符合要求,也设立专门的团队对⽤户隐私协议、产品的隐私性保护设计、⽤户隐私数据的收集使⽤进⾏审查,确保⽤户的...

2020年

新功能 MC-Hologres 是为大数据设计的实时交互式分析产品,它MaxCompute无缝打通,支持数据实时写入,支持PB级数据进行高并发、低延时的分析处理。兼容PostgreSQL协议,可以使用您最熟悉的BI工具对海量数据进行自助的多维分析透视和业务...

保险行业解决方案案例

技术方案 为保障多个业务系统实现平滑迁移,有效控制实施风险,该保险公司数据中心、研发中心阿里云 PolarDB PostgreSQL版(兼容Oracle)团队共同制定了详实的迁移规划,针对核心系统制定了“主备库”的方案,利用DTS迁移工具实现数据...

设计最佳实践

采集源表的设计 数据采集方式包括流式数据写入、批量数据写入和周期调度条式数据插入。数据量较时,需确保同一个业务单元的数据使用分区表设计数据量较小时,需优化采集频率。流式数据写入 对于流式写入的数据,采集的通道通常较多,...

附录:预设角色权限列表(空间级)

开发 运维 部署 访客 安全管理员 模型设计师 查看数据分析产品页面 有 有 有 有 有 有 有 有 有 使用数据分析产品 有 有 有 有 有 有 无 有 有 说明 自定义角色 默认无 数据分析师 角色权限,该类角色如果需要使用数据分析产品,请联系 ...

文档修订记录

Check节点 2024.1.12 新增功能 最佳实践 新增DataWorks大数据安全治理实践新增指南,为您介绍数据安全治理的常见思路、DataWorks产品的安全能力,以及在DataWorks上基于“基础防护建设”、“数据安全防护措施”、“数据安全持续运营”三个...

发展历程

2019数据“星河(Galaxy)”奖 最佳大数据产品奖(TOP10)。2018年 MaxCompute的多个客户案例荣获“2017数据优秀产品和应用解决方案案例”奖。基于公共云的BigBench在100 TB规模上,MaxCompute的性能指标较2017年10月提升了一倍,达到...

创建逻辑模型:维度表

数据集市 背景信息 结合业务的数据域的规划,提取出各业务数据域中进行数据分析时可能存在的维度,并将维度及其属性通过维度表的方式存储下来。例如,在进行电商业务数据分析时,可用的维度及其属性有:订单维度(属性包括订单ID、订单创建...

安全白皮书概述

Dataphin面向各行各业大数据建设、管理及应用诉求,一站式提供从数据接入到数据消费全链路的智能数据建设资产治理的大数据能力,包括产品、技术和方法论等,可帮助企业一站式构建生产经济、质量可靠、安全稳定、消费便捷的企业级数据资产...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集存储、数据分析处理、数据提取和数据展现分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

功能发布记录(2022年)

英国(伦敦),美国(硅谷),美国(弗吉尼亚),阿联酋(迪拜)所有DataWorks用户 数据集成概述 DataWorks支持EMR新版数据湖DataLake DataWorks支持基于EMR计算引擎新版数据湖DataLake,实现基于EMR引擎的数据集成、数据建模、数据开发...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面最基础的数据分析能力。DataWorks的更...

数据

数据库备份场景下,有4个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量。数据量 说明 数据库磁盘空间 由数据库的数据文件空间、数据库的日志文件空间、操作系统文件空间和空闲空间组成。说明 RDS中为:购买时选择的存储...

需求阶段

分析需求 可行性分析:数据产品经理主导,邀请设计数据安全合规人员,对需求进行评估。需求合理性:评估该需求的合理性。数据可行性:评估当前已有数据能否支撑需求开发,如果缺少数据,则需要另行规划缺失数据的抽取方案。同时建议...

什么是备份数据

本文介绍数据库备份DBS中备份数据量的概念。名词解释 备份数据量,是指通过DBS备份链路的数据量。常见概念 在数据库备份DBS业务场景下,含有常见以下几个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量等。概念 说明 数据库...

开通DataWorks服务

成功登录后,即可进入 申请免费试用DataWorks 页面,左侧导航栏产品类别选择 大数据计算>数据开发服务,单击 大数据开发治理平台DataWorks 产品的 立即试用。在弹出的购买试用面板选择开通的地域,勾选服务协议后单击 立即试用。开通...

冷热分层

背景信息 在海量大数据场景下,随着业务和数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...

数据仓库需求模板

项目涉众 数据产品经理 设计人员 开发人员 测试人员 数据安全合规人员 需求版本变更历史 版本号 版本确认日期 版本变更点 提交人 常规需求申请单 指标需求中通常会涉及到下表中的约定项,如果需要自定义约定项,可以在自定义格式列进行...

DataWorks交流钉钉群

DataWorks作为阿里云...您需要先单击 申请链接 加入“阿里云大数据AI平台”交流群,再扫描下方二维码加入DataWorks产品钉钉交流群,加入后,即可获得专属产品技术支持,技术直播活动,产品新功能内测等福利,阿里云大数据专家线上交流!

DataV产品与BI类产品的差异比较

本文为您介绍DataV产品与传统BI类产品的差异比较。DataV可视化产品提供了强大的页面搭建、组件渲染、交互开发和设计辅助能力,而BI产品更偏向于数据准备、建模和多维分析的能力,可视化搭建、渲染和交互能力较弱。具体请参见下表。对比项 ...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用