数据治理工具开发

_相关内容

大数据开发治理平台 DataWorks

大数据开发治理平台 DataWorks基于MaxCompute/EMR/Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。每天阿里巴巴集团内部有数万名...

开发流程管控

任务运行前校验示例 任务提交前校验示例 任务发布前校验示例 您可以通过DataWorks的开放平台、数据治理等功能模块,实现在关键节点对数据开发流程的管控校验。涉及的功能模块 运行前校验 提交前校验 发布前校验 流程管控能力引导介绍 数据...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

操作检查

涉及的功能模块 运行前校验 发布到开发环境前校验 发布到生产环境前校验 流程管控能力引导介绍 数据治理中心 DataWorks的数据治理中心为您内置了多个检查项,您可以根据业务需要选择开启对应的检查项,开启后,后续在涉及到对应操作时即会...

数据开发问题诊断

DataWorks全新推出了实时数据开发治理功能,通过集成数据治理插件和LSP(Language Server Protocol)技术,在代码保存时可触发智能检测,并提供针对性的修复建议。开发者可以选择一键确认修复,快速解决问题。该功能依托预设的治理规则库和...

大数据开发治理平台 DataWorks系统权限策略参考

本文描述大数据开发治理平台 DataWorks支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云...

ETL工作流快速体验

案例提供的数据仅用于阿里云大数据开发治理平台DataWorks数据应用体验。仅 空间管理员 角色可导入ETL模板至目标工作空间。如需给账号授予空间管理员角色,请参见 空间级模块权限管控。导入ETL工作模板时选择的资源组若是Serverless资源组,...

DataWorks on EMR Serverless StarRocks最佳实践

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据治理 数据地图,在右侧页面中单击 进入数据地图。在左侧导航栏单击 图标,然后单击StarRocks模块右上角的 管理 按钮。切换至 未采集列表 页签,在 操作 列单击 元数据采集。...

使用OpenAPI

本文为您介绍使用大数据开发治理平台DataWorks OpenAPI的基本信息、使用限制、计费及调用说明。基本信息 版本 OpenAPI门户 支持的API列表 支持的地域 2024-05-18(新版OpenAPI)OpenAPI门户 支持的API列表 华东1(杭州)、华东2(上海)、...

大数据AI公共数据集分析

操作难度 低 所需时间 30分钟 使用的阿里云产品 DataWorks:一站式大数据开发治理平台,创建数据源并在数据开发绑定数据源后可在DataWorks上开发调度对应引擎的数据开发治理任务。MaxCompute:适用于数据分析场景的企业级SaaS模式云数据...

准备环境

本案例提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(DataStudio)(旧版)进行数据加工。MaxCompute环境准备 一、开通MaxCompute产品 本教程基于MaxCompute实现,请...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。MaxCompute环境准备 一、开通MaxCompute产品 本教程基于MaxCompute实现,...

操作指南

您可以在Dataphin工作台进行数据开发数据治理等操作。功能 文档 Dataphin共享模式(全托管版)数仓规划概述 数据引入概述 数据开发概述 发布中心概述 运维中心 分析平台概述 标签工厂概述 资产清单概述 数据标准概述 资产质量概述 资源...

DataWorks On CDP/CDH使用说明

安全中心概述 数据保护伞概述 审批中心概述 数据治理中心 数据治理中心针对多个治理领域,通过数据领域规则沉淀、自动识别资产待优化问题项、覆盖事后及事前的治理优化策略等方式帮助用户主动式、体系化完成数据治理工作。说明 仅支持使用...

标签管理

背景信息 使用标签管理功能前,请先了解以下相关概念:数据资产:泛指DataWorks中与数据开发数据治理、数据分析、数据服务有关的数据实体对象。例如:表、API、节点任务、数据分析任务、质量规则、工作空间、治理优化流程等。资产标签:...

产品生态

DM(达梦)数据源 Milvus数据源 TiDB数据源 DRDS(PolarDB-X 1.0)数据源 MongoDB数据源 TSDB数据源 Elasticsearch数据源 MySQL数据源 Vertica数据源 FTP数据源 OpenSearch数据源 TOS数据源 GBase8a数据源 Oracle数据源 HBase数据源 Graph ...

工作空间管理

工作空间管理员将成员添加至工作空间中,并赋予该成员不同的角色,例如:空间管理员、数据分析师、部署、开发数据治理管理员、模型设计师、访客、运维、项目所有者、安全管理员,以实现多角色协同工作的业务场景。选择工作空间类型 ...

升级

在阿里云官网,鼠标悬停至 产品 后,再将鼠标悬停至左侧导航栏的 大数据 上,单击 数据开发治理 列下的 Dataphin。在Dataphin产品详情页,单击 产品控制台,进入Dataphin管理控制台页面。在Dataphin管理控制台页面,单击已开通版本详情后...

超级X(智能应用)

X-编码助手是语法校验/自动生成与性能优化,几大模块协同运作,构建覆盖数据交互、数据开发数据运维的一体化智能服务体系。前提条件 需满足以下条件才能使用对应的智能化功能。需开通智能研发版才能使用X-数据工程。需开通基础研发版才能...

超级X(智能应用)

X-编码助手是语法校验/自动生成与性能优化,几大模块协同运作,构建覆盖数据交互、数据开发数据运维的一体化智能服务体系。前提条件 需满足以下条件才能使用对应的智能化功能。需开通智能研发版才能使用X-数据工程。需开通基础研发版才能...

元数据仓库共享模型

业务租户:统称为 开发租户,进行数据中台建设的租户,即进行数据开发治理的核心使用租户。一个Dataphin实例可以创建多个开发租户,由元仓租户在租户设置页面创建并分配可用资源(数据处理单元数、质量规则数等)。元仓共享模型数据说明 ...

优雅下线

对于数据治理过程中的无效任务或表,数据资产治理为您提供完整的下线方案,包含下线风险评估、下线通知推送、下线过程管理等全流程功能,为您解决人工识别下线风险、任务存在正常调度的下游任务时不能下线、因无法预知风险而不敢轻易下线等...

配置检查项

工作空间管理员 拥有租户级数据治理管理员权限的空间成员 工作空间级数据治理管理员 普通用户仅支持查看其所在DataWorks工作空间的检查项列表。进入检查项配置页面 进入数据资产治理页面。登录 DataWorks控制台,切换至目标地域后,单击...

什么是DataWorks

适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等数十种大数据和AI计算服务,为数据仓库、数据湖、湖仓一体、Data+AI解决方案提供全链路智能化的数据集成、大数据AI一体化开发数据分析与主动式数据...

产品教程

适用于各引擎,本教程以MaxCompute为例 数据集成 数据建模 数据开发 运维中心 数据治理 数据服务 数据治理 相关教程 说明 教程使用的计算引擎 涉及模块 高效数据治理实施指南 本教程通过治理负责人的实操过程,为您介绍如何通过数据治理...

更多场景案例/教程

适用于各引擎,本教程以MaxCompute为例 数据集成 数据建模 数据开发 运维中心 数据治理 数据服务 数据治理 相关教程 说明 教程使用的计算引擎 涉及模块 高效数据治理实施指南 本教程通过治理负责人的实操过程,为您介绍如何通过数据治理...

Dataphin亮点功能早知道

通过规范化管理和智能推荐机制,能够有效解决字段命名不规范的问题,从而提升开发效率和数据治理水平。词根库由专人负责管理,并提供查重提醒;在建表过程中,系统能够自动进行分词并匹配词根库,实时推荐标准化字段名称。此外,词根库也...

Dataphin亮点功能早知道

通过规范化管理和智能推荐机制,能够有效解决字段命名不规范的问题,从而提升开发效率和数据治理水平。词根库由专人负责管理,并提供查重提醒;在建表过程中,系统能够自动进行分词并匹配词根库,实时推荐标准化字段名称。此外,词根库也...

Dataphin亮点功能早知道

通过规范化管理和智能推荐机制,能够有效解决字段命名不规范的问题,从而提升开发效率和数据治理水平。词根库由专人负责管理,并提供查重提醒;在建表过程中,系统能够自动进行分词并匹配词根库,实时推荐标准化字段名称。此外,词根库也...

DataWorks Copilot

使用DataWorks Agent,可以通过自然语言交互来自动化完成DataWorks上数据开发数据治理的部分任务,例如数据集成、数据开发、数据地图、数据治理等。通过大模型的深度思考及规划能力,Agent可以充分理解用户的任务,对任务进行步骤分解并...

数据治理能力解读

以下为您系列讲解阿里云数据治理能力解读。数据治理的产品介绍 主要产品:DataWorks 课程时长:25分钟 DataWorks数据治理能力的最佳实践 主要产品:DataWorks、MaxCompute 课程时长:19分钟

附录:预设角色权限列表(空间级)

DataWorks提供项目所有者、空间管理员、数据分析师、开发、运维、部署、访客、安全管理员、模型设计师、数据治理管理员等多种角色,本文将为您介绍具体角色的权限说明。DataWorks提供的空间预设角色默认拥有所有空间级模块的可读权限,但...

配置治理

数据治理人员可通过 全局视角、个人视角 或 工作空间视角 查看对应项目的待治理项,快速发现并解决存在的问题,推进团队内的数据治理目标。本文为您介绍如何查看并配置治理项。背景信息 数据资产治理会默认生成初始治理项。您可以针对不同...

制定数据治理计划

数据治理计划提供不同治理场景下的治理计划模板,并可设置治理计划完成时间内的治理目标,同时,系统自动根据治理计划类型,快速选择治理项,圈定可优化对象,帮助负责人持续跟踪数据治理成效,推动团队及时达成治理目标。使用限制 版本...

数据地图

数据地图是阿里云DataWorks的核心数据治理功能。本文深度解析其核心功能、数据血缘、应用场景与治理实践,助您构建企业级数据资产目录,全面释放数据价值。

治理项管理流程

治理项的管理流程如下:元数据管理:配置和管理数据治理所需要的元数据指标。治理项管理:基于元数据指标,配置和管理数据治理所需的规则及判定策略(即治理项)。推送管理:对于单一或多个被治理项规则触发的待治理数据对象(表或任务节点...

治理项管理流程

治理项的管理流程如下:元数据管理:配置和管理数据治理所需要的元数据指标。治理项管理:基于元数据指标,配置和管理数据治理所需的规则及判定策略(即治理项)。推送管理:对于单一或多个被治理项规则触发的待治理数据对象(表或任务节点...

附录:元数据采集相关白名单列表

深入解析DataWorks元数据采集白名单,助您理解其网络通信机制,避免因安全组策略错误导致采集失败,并提供各地域完整IP列表,保障数据治理顺畅运行。

使用总览

权限控制 如需选择任意空间查看资源使用情况,需要具备如下权限之一:阿里云主账号 拥有 AliyunDataWorksFullAccess 权限的RAM用户 租户管理员 租户级数据治理管理员 其他用户只能选择其加入的工作空间。进入资源使用总览 进入数据资产治理...

软件版本选择与计费

版本 适合群体推荐 推荐场景 核心差异 基础版 学生、个人开发者、初创团队 POC:快速验证数据项目可行性 开发非关键性、小规模数据应用 低成本入门数据开发实践 提供数据上云、基础开发调度、简易数据治理能力,满足快速验证与轻量级需求。...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用