什么是大数据开发工程师-什么是大数据开发工程师文档介绍内容-移动阿里云

创建OSS数据源

如果您使用的是阿里云对象存储OSS，在对接Dataphin进行数据开发或将Dataphin的数据写入至OSS时，您需要先完成OSS数据源的创建。更多OSS信息，请参见 什么是对象存储OSS。权限说明仅支持拥有新建数据源权限点的自定义全局角色和超级管理...

创建Tablestore数据源

如果您使用的是阿里云Tablestore，在对接Dataphin进行数据开发或将Dataphin的数据写入至Tablestore的场景中，您需要先完成Tablestore数据源的创建。更多阿里云Tablestore信息，请参见 什么是表格存储。权限说明仅支持拥有新建数据源权限...

新建Amazon S3数据源

如果您使用的是Amazon S3，在对接Dataphin进行数据开发或将Dataphin的数据写入至Amazon S3时，您需要先完成Amazon S3数据源的创建。更多Amazon S3信息，请参见 什么是Amazon S3。权限说明仅支持拥有新建数据源权限点的自定义全局角色和 ...

创建MongoDB数据源

测试结果为成功有风险时，代表应用集群连接成功、调度集群连接失败，当前数据源无法用于数据开发和集成。您可以单击图标查看日志信息。说明仅公共调度集群的测试结果包含成功有风险、连接成功、连接失败三种连接状态；在Dataphin...

创建EMR Spark SQL节点

登录 DataWorks控制台，切换至目标地域后，单击左侧导航栏的数据建模与开发 数据开发，在下拉框中选择对应工作空间后单击进入数据开发。新建EMR Spark SQL节点。右键单击目标业务流程，选择新建节点 EMR EMR Spark SQL。说明您也可以...

创建MongoDB数据源

更多阿里云MongoDB信息，请参见云数据库MongoDB-什么是云数据库MongoDB版。权限说明仅支持拥有新建数据源权限点的自定义全局角色和超级管理员、数据源管理员、板块架构师、项目管理员系统角色创建数据源。操作步骤在Dataphin首页，...

创建OSS数据源

如果您使用的是阿里云对象存储OSS，在对接Dataphin进行数据开发或将Dataphin的数据写入至OSS时，您需要先完成OSS数据源的创建。更多OSS信息，请参见 什么是对象存储OSS。权限说明仅支持拥有新建数据源权限点的自定义全局角色和超级管理...

创建MaxCompute数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数说明 Endpoint MaxCompute的...

新建Amazon S3数据源

如果您使用的是Amazon S3，在对接Dataphin进行数据开发或将Dataphin的数据写入至Amazon S3时，您需要先完成Amazon S3数据源的创建。更多Amazon S3信息，请参见 什么是Amazon S3。权限说明仅支持拥有新建数据源权限点的自定义全局角色和 ...

创建AnalyticDB for MySQL 2.0数据源

如果您使用的是云原生数仓AnalyticDB MySQL，在对接Dataphin进行数据开发时，您需要先完成AnalyticDB for MySQL数据源的创建。更多云原生数仓AnalyticDB MySQL信息，请参见云原生数据仓库AnalyticDB MySQL版-什么是云原生数据仓库...

Serverless Spark集成 Notebook

Notebook 促进了数据分析师和数据工程师之间的协作，支持快速原型设计和实验，是探索数据、开发机器学习模型以及进行数据驱动决策的关键工具。EMR Serverless Spark支持通过Notebook进行交互式开发。本文带您快速体验Notebook的创建、运行...

创建OceanBase数据源

如果您使用的是阿里云数据库OceanBase，在对接Dataphin进行数据开发或将Dataphin数据写入至OceanBase时，您需要先完成OceanBase数据源的创建。更多OceanBase信息，请参见 什么是OceanBase。权限说明仅支持拥有新建数据源权限点的自定义...

数据开发与运维中心：数据加工

DataWorks的 数据开发（DataStudio）是数据加工的开发平台，运维中心是智能运维平台，基于这两个功能模块，您可以在DataWorks上规范、高效地构建和运维数据开发工作流。功能概述 DataWorks的数据开发的亮点功能如下。DataStudio支持...

注册CDH或CDP集群至DataWorks

以下简称CDH）和CDP（Cloudera Data Platform，以下简称CDP）集群对接的能力，您可在DataWorks中注册CDH及CDP集群，进行任务开发、调度、数据地图（元数据管理）和数据质量等一系列的数据开发和治理操作。背景信息 CDH是Cloudera的开源平台...

创建OceanBase数据源

如果您使用的是阿里云数据库OceanBase，在对接Dataphin进行数据开发或将Dataphin数据写入至OceanBase时，您需要先完成OceanBase数据源的创建。更多OceanBase信息，请参见 什么是OceanBase。权限说明仅支持拥有新建数据源权限点的自定义...

周期任务基本运维操作

节点版本如果通过发布流程发布的操作无详细记录，您可以在数据开发界面，通过节点版本与生产环境版本对比，获取版本变更的详细情况。详情请参见：发布任务。操作历史操作历史可以查看任务、实例、基线的操作记录。需求请参见：查看运维...

元数据仓库共享模型概述

业务租户：统称为开发租户，进行数据中台建设的租户，即进行数据开发和治理的核心使用租户。一个Dataphin实例可以创建多个开发租户，由元仓租户在租户设置页面创建并分配可用资源（数据处理单元数、质量规则数等）。元仓共享模型数据说明 ...

创建PolarDB数据源

如果您使用的是PolarDB，在对接Dataphin进行数据开发时，您需要先完成PolarDB数据源的创建。更多PolarDB信息，请参见 什么是PolarDB。权限说明仅支持具备新建数据源权限点的自定义全局角色和超级管理员、数据源管理员、板块架构师、...

什么是IoT Studio

快速了解IoT Studio 物联网应用开发提供了Web可视化开发、移动可视化开发、业务逻辑开发与物联网数据分析等一系列便捷的物联网开发工具，解决物联网开发领域的开发链路长、定制化程度高、投入产出比低、技术栈复杂、协同成本高、方案移植...

新建AnalyticDB for MySQL 3.0数据源

更多信息，请参见云原生数据仓库AnalyticDB MySQL版-什么是云原生数据仓库AnalyticDB MySQL版。权限说明仅支持拥有新建数据源权限点的自定义全局角色和超级管理员、数据源管理员、板块架构师、项目管理员系统角色创建数据源。操作...

产品概述

产品介绍 DataV是一款数据可视化应用搭建产品，让数据可视、价值可见。DataV数据可视化应用搭建平台以丰富的图表组件...具有一站式开放平台、多源数据融合计算、三维城市快速构建和多角色协同开发等特点，详情请参见 什么是DataV-TwinFabric。

开通DataWorks服务

说明开通按量付费资源组后，后续使用DataWorks各项服务时，不同功能模块（例如，任务开发、定时任务调度、数据同步、数据质量监控、数据服务API调用）会根据使用量和占用的资源量按量计费，详情请参见 DataWorks按量计费概述。新版资源组...

新建AnalyticDB for MySQL 3.0数据源

更多信息，请参见云原生数据仓库AnalyticDB MySQL版-什么是云原生数据仓库AnalyticDB MySQL版。权限说明仅支持拥有新建数据源权限点的自定义全局角色和超级管理员、数据源管理员、板块架构师、项目管理员系统角色创建数据源。操作...

什么是Dataphin

在您开始数据开发前，需要完成数据仓库的规划，包括定义业务板块、数据域、项目、数据源、计算源和统计周期。数仓规划数据引入基于全局设计定义的项目空间与物理数据源，将各业务系统、各类型的数据抽取加载至目标数据库。这个过程可以...

数据开发

本文从需求分析、规划业务流程、规划表管理、同步数据以及加工数据几方面，为您介绍数据开发。需求分析将MySQL的数据采集到MaxCompute 贴源层表中，进行清洗和加工，产出最终的概览应用表。规划业务流程业务流程是DataWorks针对业务实体...

创建Elasticsearch数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数说明 ES URL Elasticsearch的...

安全中心

数据管理和安全中心是什么关系？为什么在申请时，有时可以选择字段，有时不可以选择？提交申请后，需要谁进行审批？为什么提交了一个申请，在我的申请中却看到两个申请单？为什么有的字段只申请1个月权限，审批完成后查看变为永久？为什么...

离线同步任务运维

表数据质量监控数据集成部分目标端数据源支持配置产出表的数据质量监控，您可以进入数据质量规则页面，对数据同步写入的目标表配置数据质量校验规则。对于配置了数据质量监控规则的表，当表关联的调度节点运行（执行节点代码逻辑）完成后...

创建Teradata数据源

如果您使用的是Teradata，在对接Dataphin进行数据开发或导出Dataphin数据至Teradata，您需要先完成Teradata数据源的创建。更多Teradata信息，请参见 Teradata官网。权限说明仅支持拥有新建数据源权限点的自定义全局角色和超级管理员、...

PostgreSQL节点

登录 DataWorks控制台，切换至目标地域后，单击左侧导航栏的数据建模与开发 数据开发，在下拉框中选择对应工作空间后单击进入数据开发。右键单击目标业务流程，选择新建节点数据库 PostgreSQL。在新建节点对话框输入节点名称，单击 ...

概览

为了更好地指导您使用数据管理DMS（Data Management），DMS推出解决方案系列文档，旨在通过最佳实践（Step by Step）的形式向您介绍DMS研发流程、数据安全、数据开发的解决方案。研发流程解决方案 DMS为在线流程化系统，可统一管理企业内...

Azure Blob Storage数据源

不写"nullFormat"这个参数，等同于“未配置”，代表来源是什么数据就直接按照什么数据写入目标端，不做任何转换。否无 skipHeader CSV格式文件通过 skipHeader 配置是否读取表头内容。True：同步数据源的时候读取表头内容。False：同步...

创建Teradata数据源

如果您使用的是Teradata，在对接Dataphin进行数据开发或导出Dataphin数据至Teradata，您需要先完成Teradata数据源的创建。更多Teradata信息，请参见 Teradata官网。权限说明仅支持拥有新建数据源权限点的自定义全局角色和超级管理员、...

HttpFile数据源

未配置"nullFormat"参数：表示来源是什么数据就直接按照什么数据写入目标端，不做任何转换。否无 skipHeader 类CSV格式文件可能存在表头为标题情况，同步数据时可选择是否需要跳过表头（即不同步表头数据）。true：跳过。false：不跳过。...

数据治理

数据地图为什么数据地图数据总览页存储量和存储趋势图相差较大？数据地图血缘展示延迟问题数据地图新建表搜不到当前表业务逻辑变更如何通知下游？哪些类型的Hive表支持在数据地图中预览？数据保护伞数据保护伞为什么有时候查询脱敏有...

数据开发：开发者

本文以使用MaxCompute数据源，在DataWorks上运行MaxCompute作业任务为例，为您介绍开发人员如何使用数据开发（DataStudio）创建一个周期调度任务，帮助您快速了解数据开发（DataStudio）模块的基本使用。前提条件已完成开发前的环境准备，...

创建逻辑模型：维度表

存储策略维度表基于什么策略（即存储数据的时间周期及数据量范围）存储数据。维度维度表关联的维度，用于配置维度表分析数据的视角。说明创建维度，详情请参见创建概念模型：维度。表名规则通过已配置的检查器规范维度表的命名规则。...

标签工厂概述

标签工厂是通过从标签创建到服务全链路的构建，为企业数据研发团队以及开发工程师提供一站式标签开发以及服务平台，适合多种场景（如风控、营销），提供离线、实时、服务标签的开发、管理、探索以及服务能力，赋能上层各端业务应用，为企业...

HoloStudio一键迁移至DataStudio

为给您提供一致的开发体验，HoloStudio产品能力将整合至DataStudio中，届时您可使用DataStudio相关功能继续进行Hologres的数据开发。在指定时间内，您可参考本文手动迁移HoloStudio的已有文件至DataStudio；超过该时间，系统将自动为您完成...

API概览

本产品（大数据开发治理平台 DataWorks/2024-05-18）的OpenAPI采用 RPC 签名风格，签名细节参见签名机制说明。我们已经为开发者封装了常见编程语言的SDK，开发者可通过下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...