在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...
业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功。在数仓建设项目启动前,您需要请相关的业务人员介绍具体的业务,以便明确各个团队的分析员、运营人员的需求,沉淀出相关文档。您可以通过调查表、...
校验成功后,单击 确认并开始数据建设,即可开始数据建设。后续步骤 完成设置Dataphin实例的计算引擎后,您就可以准备后续数据研发过程中用于读取和写入数据的数据源、用于提供计算资源的计算源。具体操作,请参见 准备数据源和计算源。
获取用户所属空间以及预置空间角色列表 获取组织下的工作空间列表 获取指定空间角色的配置信息 获取数据源配置信息 新建数据源 修改数据源基础信息 查询数据集详情 查询用户有权查看的作品列表 根据数据集ID,查询建立在数据集之上的所有...
模型市场为您提供开箱即可试用的模型示例,降低您的学习成本以及理解Dataphin的成本,帮助您快速建立企业模型。本文为您介绍如何导入模型示例。视频介绍 权限说明 仅支持超级管理员、系统管理员导入模型。计算引擎说明 仅当计算设置中的...
当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。主题域 数据域即主题域,是对某个主题分析后确定的主题边界。例如,商品域、交易域、会员域等。项目 ...
当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。主题域 数据域即主题域,是对某个主题分析后确定的主题边界。例如,商品域、交易域、会员域等。项目 ...
计算引擎类型 选择设置 计算引擎设置需要提前采购计算引擎MaxCompute资源,系统以此来支持相关数据的建设工作。需要选择计算引擎类型(目前仅开放MaxCompute计算类型),配置计算引擎所在的集群,例如Endpoint等信息。系统以此来支持该计算...
进行离线数仓建设前您需完成相关云资源的准备。云资源准备包括阿里云账号资源准备、Dataphin开通与AccessKey配置、MaxCompute计算源的开通与配置、以及数据源的准备。本文将指导您完成本教程的云资源准备工作。步骤一:阿里云账号资源准备 ...
计算引擎类型 选择设置 计算引擎设置需要提前采购计算引擎MaxCompute资源,系统以此来支持相关数据的建设工作。需要选择计算引擎类型(目前仅开放MaxCompute计算类型),配置计算引擎所在的集群,例如Endpoint等信息。系统以此来支持该计算...
以数据开发建设为例,数据开发建设为菜单组;研发为一级菜单;数据集成、数据研发等为二级菜单。系统菜单默认顺序 智能工作台 超级X:X-数据工程、X-分析、X-数据标准、X-数据安全、智能应用管理、企业知识库。数据开发建设 研发:数据集成...
X-数据标准:AI驱动自动提取数据标准与码表定义、智能识别标准与字段的映射关系,助力低成本快速开启数据标准建设以提升数据规范化程度,实现精准治理省时省力。X-数据安全:结合数据资产语义与样例数据,智能推荐分类分级;依据特征名称...
背景信息 面对各行各业日趋强烈的大数据建设、管理及应用的诉求,Dataphin应用场景的多样性及复杂性随之增加。因业务系统的原始数据的规范性无法得以保障,所以Dataphin需要定义数据分析的质量,以满足资产质量的时效性、准确性、完整性、...
在资产下架前,评估资产下架后是否影响业务正常运行,为资产管理建立一个结构化和可控的环境,促进资产的有效利用和管理。审批规则能够让您配置哪些资产需要进行上下架审批并可指定审批模板。本文为您介绍如何添加及管理审批规则。权限说明...
背景信息 面对各行各业日趋强烈的大数据建设、管理及应用的诉求,Dataphin应用场景的多样性及复杂性随之增加。因业务系统的原始数据的规范性无法得以保障,所以Dataphin需要定义数据分析的质量,以满足资产质量的时效性、准确性、完整性、...
在阿里云官网,鼠标悬停至 产品 后,再将鼠标悬停至左侧导航栏的 大数据计算 上,单击 数据开发和服务 列下的 智能数据建设与治理Dataphin。在Dataphin产品详情页,单击 管理控制台/立即开通(半托管版),进入Dataphin管理控制台页面。...
本文为您介绍如何基于阿里巴巴OneData方法论最佳实践,使用Dataphin助力企业数据中台的建设与管理,快速构建标准、规范的数据仓库。数仓构建流程 下图为使用Dataphin构建数据仓库的基本流程。基本概念 在正式学习本教程之前,您需要了解...
进行离线数仓建设前您需完成相关云资源的准备。云资源准备包括MaxCompute计算源的开通与配置、以及数据源的准备。本文将指导您完成本教程的云资源准备工作。步骤一:MaxCompute开通与配置 主流程 描述 操作指导 开通MaxCompute 购买...
X-数据标准:AI驱动自动提取数据标准与码表定义、智能识别标准与字段的映射关系,助力低成本快速开启数据标准建设以提升数据规范化程度,实现精准治理省时省力。X-数据安全:结合数据资产语义与样例数据,智能推荐分类分级;依据特征名称...
示例代码如下:#加载包 from pyhive import hive#建立连接 conn=hive.connect(host='100.100.*.100',#HiveServer port=10000,#端口 username='xxx',#账号 database='xxx',#数据库 password='xxx')#密码#查询 cursor=conn.cursor()cursor....