java数据开发流程

_相关内容

流程管控

背景信息 DataWorks的工作空间分为 标准模式和简单模式,不同模式工作空间下任务的开发流程存在一定差异,两种模式的数据开发流程示意如下。标准模式工作空间开发流程 简单模式工作空间开发流程 如上图所示,在通用流程的关键节点,例如,...

技术架构选型

在数据模型设计之前,您需要首先完成技术架构的选型。本教程中使用阿里云大数据产品MaxCompute配合...MaxCompute作为整个大数据开发过程中的离线计算引擎。DataWorks则包括数据开发、数据质量、数据安全、数据管理等在内的一系列功能。

通用开发流程

本文将为您介绍数据开发任务的通用开发流程。前提条件 已绑定所需数据源。详情请参见 开发前准备:绑定数据源或集群。已拥有 开发 角色权限。授权详情请参见 添加空间成员并管理成员角色权限。进入数据开发 登录 DataWorks控制台,切换至...

阶段一:基础防护建设

在该阶段,DataWorks为您提供了数据分类分级、规范数据开发流程、企业级身份认证、开源身份隔离等多个场景的最佳实践,帮助企业做好数据安全治理的相关基础防护工作。场景一:数据分级分类 无论在任何行业,数据分级分类都是监管首要检查的...

应用示例:数据开发过程触发事件检查

本文将为您介绍数据开发DataStudio中支持的扩展点事件,以及使用扩展点触发扩展程序的操作过程。前提条件 已开启消息订阅操作,详情请参见 开启消息订阅。已完成扩展程序的开发部署操作,详情请参见 开发部署扩展程序。背景信息 启动扩展...

必读:简单模式和标准模式的区别

无法对数据开发流程进行管控。说明 开发角色可以不经过任何人审批,随时新增、修改代码并提交至调度系统,给生产带来不稳定因素。流程相对复杂,一般情况下无法一人完成所有数据开发、生产流程。场景示例:标准模式对使用流程的影响 如图,...

数据治理中心概述

您可基于该事件处理暴露的问题,以便数据开发流程可以正常执行。治理项检测。用于提交发布后的管控治理。可使用数据治理中心的治理功能,通过 全局视角、个人视角 或 工作空间视角,查看对应的待治理项。数据治理人员可以基于暴露的待治理...

配置检查项

在进行数据开发前,可通过检查项对数据开发功能相关的约束进行检查,当检查出不符合约束规范的内容时,系统会生成影响开发流程正常执行的问题事件,您可基于该事件处理暴露的问题,以保障数据开发流程可以正常执行。本文为您介绍如何查看并...

创建业务流程

DataWorks的 业务流程 开发结构满足根据业务视角来组织数据开发任务的需求,也提供了 周期业务流程 和 手动业务流程 两种,以满足需要周期性调度和无需周期性调度手动触发运行的场景。本文为您介绍如何创建、设计、提交和查看业务流程,...

开发管控:管理者

作为工作空间的管理者,在使用数据开发(DataStudio)时,您可以针对用户的开发行为实施有效的管控措施,进行开发流程、数据安全、审计等相关操作,本文将帮助您快速掌握DataStudio的相关功能,实现对数据开发过程的有效管控。背景信息 ...

权限管理与规范化数据开发

实践操作流程 以下以一个具体的实践为您演示,标准模式下规范化的数据开发流程。Step1:开通产品与创建空间 Step2:角色管理 Step3:权限管理 Step4:数据建模 Step5:数据开发与生产 Step1:开通产品与创建空间 开通DataWorks与MaxCompute...

用户价值

数据开发更简单:平台提供的各种工具产品能够极大的简化数据开发过程,缩短数据治理周期,降低数据治理成本。通过标准化、精细化、规格化的智能数据生产流程,完成流水线式的数据生产作业,提升数据资源生产效率、消除数据供应品质差异。...

任务调试流程

调试运行业务流程 数据开发概述,在左侧导航栏的数据开发或手动业务流程模块,双击目标业务流程,进入该业务流程面板。调试运行业务流程。单击业务流程面板工具栏的运行(图标),即可按照依赖关系,依次运行整个业务流程中的任务。说明 当...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序...机器资源实时监控 在数据开发过程中,可以实时展示CPU、RAM的使用情况。

数据开发:开发者

本文以使用MaxCompute数据源,在DataWorks上运行MaxCompute作业任务为例,为您介绍开发人员如何使用数据开发(DataStudio)创建一个周期调度任务,帮助您快速了解数据开发(DataStudio)模块的基本使用。前提条件 已完成开发前的环境准备,...

项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据...同时要为在数据开发过程中的资源使用赋权,并做好数据安全隔离。关于MaxCompute数仓安全和权限配置详情,请参见 权限概述。

创建和使用EMR资源

DataWorks支持可视化创建EMR(E-MapReduce)JAR、EMR(E-MapReduce)FILE资源,用于上传提交自定义函数或开源MR示例源码作为资源,便于EMR 计算节点的数据开发过程中引用。本文为您介绍如何创建资源,并上传提交资源,为资源的使用做好前期...

环境准备

说明 DataWorks的工作空间分为 简单模式 和 标准模式:简单模式:指一个DataWorks工作空间对应一个引擎项目,无法设置开发和生产环境,只能进行简单的数据开发,无法对数据开发流程以及表权限进行强控制。标准模式:指一个DataWorks工作...

扩展程序概述

DataWorks通过OpenEvent能力为您提供消息推送订阅能力,同时您可以将服务程序注册为DataWorks的扩展程序,通过扩展程序来卡点并响应...更多扩展点的触发应用示例可参见 应用示例:数据开发过程触发事件检查、应用示例:运维中心触发事件检查。

API概览

UpdateIDEEventResult 更新扩展点事件的检查结果 用于在数据开发过程中触发扩展点时,通过将扩展程序对扩展点事件的检查结果返回给数据开发系统。GetIDEEventDetail 查询触发扩展点事件时的数据快照 根据DataWorks开放消息的消息ID,查询...

权限自查建议

这种情况符合数据开发的实际情况,如果可以用SQL处理,通常优先使用SQL处理数据。某账号提交的任务非常多,经了解,其将自己的AccessKey通过SDK的方式配置了一个查询软件,并提供多人进行查询。不推荐该方式,请谨慎开放权限,避免多人共用...

创建并管理工作空间

参数 描述 允许下载Select结果 设置是否能够下载数据开发过程中查询的数据结果。关闭后则无法下载SELECT的数据查询结果。说明 仅空间管理员权限可开启或关闭该功能。允许子账号变更自己的节点责任人 设置是否允许子账号变更自己的节点责任...

数据开发概述

流程管控:任务在开发过程可结合数据开发(DataStudio)自带的 代码评审、冒烟测试 等功能,以及 数据治理中心 预设的检查项、开放平台 基于扩展程序实现自定义逻辑校验等功能,保障开发任务符合规范。说明 不同工作空间模式涉及的流程管控...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

用户授权与管理

角色规划 使用数据建模并应用至数据开发过程中,通常需要进行定义标准、数据建模、数据开发、部署运维等任务,下图为您示例不同流程中操作人员的角色以及所需的角色权限。建议您参考下图进行用户角色及权限规划。开通权限 建议您参考 ...

创建并使用AnalyticDB for PostgreSQL节点

数据开发(DataStudio)基于业务流程执行不同引擎的具体开发操作,因此,创建节点前需先创建业务流程,操作详情请参见 创建业务流程。已创建AnalyticDB for PostgreSQL数据源并绑定至数据开发(DataStudio)。您需先将您的AnalyticDB for ...

功能简介

AnalyticDB PostgreSQL版 的企业数据智能平台是数据资产定义、加工、管理、服务的全流程平台,提供数据同步、数据查询、数据建模、数据开发、质量评估、资产管理等功能,为智能数据应用持续稳定供给全量、标准、干净、智能的数据资源。...

概览

为了更好地指导您使用数据管理DMS(Data Management),DMS推出解决方案系列文档,旨在通过最佳实践(Step by Step)的形式向您介绍DMS研发流程、数据安全、数据开发的解决方案。研发流程解决方案 DMS为在线流程化系统,可统一管理企业内...

AnalyticDB for MySQL

数据开发(DataStudio)基于业务流程执行不同引擎的具体开发操作,因此,创建节点前需先创建业务流程,操作详情请参见 创建业务流程。已创建AnalyticDB for MySQL数据源并绑定至数据开发(DataStudio)。您需先将您的AnalyticDB for MySQL...

创建并管理MaxCompute节点

数据开发(DataStudio)基于业务流程对不同开发引擎进行具体开发操作,所以您创建节点前需要先新建业务流程,操作详情请参见 创建业务流程。已创建MaxCompute数据源并绑定至数据开发(DataStudio)。创建MaxCompute相关节点并开发...

ClickHouse SQL

数据开发(DataStudio)基于业务流程执行不同引擎的具体开发操作,因此,创建节点前需先创建业务流程,操作详情请参见 创建业务流程。已创建EMR ClickHouse或数据库ClickHouse集群,且完成相关准备工作。EMR引擎类型包括新版数据湖...

使用节点组

详情请参见 创建业务流程数据开发概述。注意事项 引用节点组时,节点组中节点的配置及依赖关系保持不变。如果创建的节点组里包含 人工智能平台 PAI 节点,则在其他业务流程中引用节点组并使用PAI节点时,需重新创建实验。引用节点组时,...

创建EMR Hive节点

数据开发(DataStudio)基于业务流程对不同开发引擎进行具体开发操作,所以您创建节点前需要先新建业务流程,操作详情请参见 创建业务流程。已创建阿里云EMR集群,并注册EMR集群至DataWorks。创建EMR相关节点并开发EMR任务前,您需要先将...

创建EMR Impala节点

数据开发(DataStudio)基于业务流程对不同开发引擎进行具体开发操作,所以您创建节点前需要先新建业务流程,操作详情请参见 创建业务流程。已创建阿里云EMR集群,并注册EMR集群至DataWorks。创建EMR相关节点并开发EMR任务前,您需要先将...

创建EMR Presto节点

数据开发(DataStudio)基于业务流程对不同开发引擎进行具体开发操作,所以您创建节点前需要先新建业务流程,操作详情请参见 创建业务流程。已创建阿里云EMR集群,并注册EMR集群至DataWorks。创建EMR相关节点并开发EMR任务前,您需要先将...

大数据开发治理平台 DataWorks

数据开发治理平台 DataWorks基于MaxCompute/EMR/MC-Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。每天阿里巴巴集团内部有数万...

Doris节点

数据开发(DataStudio)基于业务流程执行不同引擎的具体开发操作,因此,创建节点前需先创建业务流程,操作详情请参见 创建业务流程。已创建Doris数据源。您需先将您的Doris数据库创建为DataWorks的Doris数据源,才可通过该数据源访问相应...

DRDS节点

数据开发(DataStudio)基于业务流程执行不同引擎的具体开发操作,因此,创建节点前需先创建业务流程,操作详情请参见 创建业务流程。已创建DRDS数据源。您需先将您的DRDS数据库创建为DataWorks的DRDS数据源,才可通过该数据源访问相应数据...

Vertica节点

数据开发(DataStudio)基于业务流程执行不同引擎的具体开发操作,因此,创建节点前需先创建业务流程,操作详情请参见 创建业务流程。已创建Vertica数据源。您需先将您的Vertica数据库创建为DataWorks的Vertica数据源,才可通过该数据源...

创建CDH Hive节点

数据开发(DataStudio)基于业务流程对不同开发引擎进行具体开发操作,所以您创建节点前需要先新建业务流程,操作详情请参见 创建业务流程。已创建阿里云CDH集群,并注册CDH集群至DataWorks。创建CDH相关节点并开发CDH任务前,您需要先将...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用