网络开发工具-网络开发工具文档介绍内容-移动阿里云

EMR Kyuubi节点

在工具栏的参数对话框中选择已创建的数据源，单击运行 SQL任务。如需定期执行节点任务，请根据业务需求配置调度信息。配置详情请参见节点调度。节点任务配置完成后，需对节点进行发布。详情请参见节点/工作流发布。任务发布后，您可以在...

同地域多VPC网络设计

多TR平面隔离设计：使用多TR平面可以将不同的网络环境隔离开，例如将生产环境、开发环境和管理网络的环境分别隔离，或者以不同的子公司维度进行环境隔离。每个TR可以有自己的路由表和安全策略，从而实现更细粒度的网络隔离和控制。这种设计...

ClickHouse SQL

单击工具栏的选择数据源下拉框，在弹窗中选择已创建的ClickHouse数据源，单击运行 SQL任务。如需定期执行节点任务，请根据业务需求配置调度信息。配置详情请参见节点调度。节点任务配置完成后，需对节点进行发布。详情请参见节点/工作...

EMR Trino节点

在工具栏的参数对话框中选择已创建的数据源，单击运行 SQL任务。说明使用EMR Trino节点查询数据时，返回的查询结果最大支持10000条数据，并且数据总量不能超过10MB。如需定期执行节点任务，请根据业务需求配置调度信息。配置详情请参见 ...

个人开发环境制作MaxCompute镜像

DataWorks支持在创建个人开发环境的自定义镜像时，同步生成MaxCompute的自定义镜像，方便您在DataWorks节点（如PyODPS 3节点、Notebook节点）中使用MaxCompute自定义镜像。本文将为您介绍在DataWorks构建并使用MaxCompute自定义镜像。背景...

EMR Impala节点

在工具栏的参数对话框中选择已创建的Hive数据源，单击运行 SQL任务。说明使用EMR Impala节点查询数据时，返回的查询结果最大支持10000条数据，并且数据总量不能超过10MB。单击保存节点任务。如需定期执行节点任务，请根据业务需求配置...

ADB for PostgreSQL节点

DataWorks的ADB for PostgreSQL节点可进行AnalyticDB for PostgreSQL任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用ADB for PostgreSQL节点进行任务开发的主要流程。前提条件（可选，RAM账号需要）进行任务开发的RAM...

创建EMR Presto节点

Presto（即PrestoDB）是一款灵活、可扩展的分布式SQL查询引擎，支持使用标准的SQL查询语言进行大数据的交互式分析查询，DataWorks为您提供EMR Presto节点，便于您在DataWorks上进行Presto任务的开发和周期性调度。本文为您介绍使用EMR ...

EMR Hive节点

DataWorks提供的EMR（E-MapReduce）Hive节点支持云端大规模数据的批处理分析，能够操作存储在分布式系统中的数据，简化大数据处理流程并提高开发效率。在EMR Hive节点中，您可以使用类SQL语句读取、写入和管理大数据集，从而高效地完成海量...

创建EMR Impala节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。使用限制仅支持使用 Serverless资源组（推荐）或独享调度资源组运行该类型任务。EMR Impala仅...

创建EMR Kyuubi节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。使用限制仅支持使用 Serverless资源组（推荐）或独享调度资源组运行该类型任务。步骤一：创建EMR...

工具市场

AgentRun的工具市场提供了丰富的工具，用户可以实现工具的一键部署，通过工具市场，你可以像“应用商店”一样，快速获取并集成高质量工具，极大提升 Agent 开发效率，加速业务落地。一、功能简介 AgentRun 提供了丰富的预置工具市场，内含...

创建EMR Hive节点

您可以创建EMR（E-MapReduce）HIVE节点，通过类SQL语句读写、管理存储在分布式存储系统上的大数据集的数据仓库，完成海量日志数据的分析和开发工作。前提条件已创建阿里云EMR集群，并注册EMR集群至DataWorks。操作详情请参见旧版数据开发...

SSH节点

登录 DataWorks控制台，切换至目标地域后，单击左侧导航栏的数据开发与运维数据开发，在下拉框中选择对应工作空间后单击进入数据开发。右键单击目标业务流程，选择新建节点 SSH。在新建节点对话框输入节点名称，单击确认。节点创建...

基础：购房群体简单分析

本案例指导您完成购房群体分析，帮助您掌握DataWorks的数据开发与数据分析流程。案例介绍本案例基于用户买房数据，分析不同群体的购房情况。通过DataWorks进行数据开发和数据分析。将本地数据通过DataWorks上传至MaxCompute的 bank_data ...

什么是DataWorks

DataWorks是一站式智能大数据开发治理平台，适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等数十种大数据和AI计算服务，为数据仓库、数据湖、湖仓一体、Data+AI解决方案提供全链路智能化的数据集成、...

创建EMR Spark Streaming节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。使用限制仅支持使用 Serverless资源组（推荐）或独享调度资源组运行该类型任务。不支持EMR on ...

创建EMR Spark SQL节点

前提条件开始进行节点开发前，若您需要定制组件环境，此时即可基于官方镜像 dataworks_emr_base_task_pod 创建自定义镜像，并在数据开发中使用镜像。例如：在创建自定义镜像时替换Spark Jar包或是依赖特定的库、文件或 jar包。已注册...

创建EMR Shell节点

数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。在DataWorks资源组本地运行Python脚本时，代码需要调用第三方包，需要根据任务使用的资源组不同，...

PAI DLC节点

在工具栏的参数对话框中选择单击运行节点任务。如需定期执行节点任务，请根据业务需求配置调度信息。配置详情请参见调度配置。节点任务配置完成后，需对节点进行发布。详情请参见节点发布。任务发布后，您可以在运维中心查看周期任务的...

EMR Spark Streaming节点

在工具栏的参数对话框中选择已创建的数据源，单击运行 SQL任务。如需定期执行节点任务，请根据业务需求配置调度信息。配置详情请参见节点调度。节点任务配置完成后，需对节点进行发布。详情请参见节点/工作流发布。任务发布后，您可以在...

MaxCompute MR节点

在工具栏的参数对话框中选择已创建的MaxCompute数据源，单击运行 MR任务。（可选）查询结果在MaxCompute SQL节点中查询输出表 wc_out 的数据。SELECT*FROM wc_out;返回结果：+-+-+|key|cnt|+-+-+|package|1|pad|1|problem|1|project|1|...

创建EMR MR节点

在EMR任务开发中，通过创建EMR（E-MapReduce）MR节点，可将大规模数据集分为多个Map任务并行处理，加速数据集的并行运算。本文将以创建EMR MR节点实现从OSS中读取文本，并统计文本中的单词数为例，为您展示EMR MR节点的作业开发流程。前提...

连接VS Code进行本地开发

本方案面向希望提升开发效率的DataWorks用户，通过SSH安全连接，将本地Visual Studio Code编辑器与云端个人开发环境打通，让开发者在享受本地工具体验的同时，无缝利用云端计算与数据能力，实现编码、调试效率的提升。流程概览环境准备：...

iOS 环境切换

mPaaS 提供工具可帮助您在开发过程中方便地进行环境切换。根据切换环境的需求不同，分为以下两种方式：静态切换环境动态切换环境静态切换环境静态切换环境指客户端手动替换工程中默认的 meta.config 配置文件后，重新打包访问新环境。...

用户画像分析（MaxCompute简化版）

通过本教程，您可以了解如何使用DataWorks和MaxCompute产品组合进行数仓开发与分析，并通过案例体验DataWorks数据集成、数据开发和运维中心模块的相关能力。案例介绍为了更好地制定企业经营策略，现需要从用户网站行为中获取网站用户群体...

CDH Hive节点

在节点编辑页面上方工具栏，单击运行任务。后续步骤节点调度：若项目目录下的节点需要周期性调度执行，您需要在节点右侧的调度配置中设置调度策略，配置相关的调度属性。节点发布：若任务需要发布至生产环境执行，请单击界面图标...

CDH Impala节点

在节点编辑页面上方工具栏，单击运行任务。后续步骤节点调度：若项目目录下的节点需要周期性调度执行，您需要在节点右侧的调度配置中设置调度策略，配置相关的调度属性。节点发布：若任务需要发布至生产环境执行，请单击界面图标...

CDH Presto节点

在节点编辑页面上方工具栏，单击运行任务。后续步骤节点调度：若项目目录下的节点需要周期性调度执行，您需要在节点右侧的调度配置中设置调度策略，配置相关的调度属性。节点发布：若任务需要发布至生产环境执行，请单击界面图标...

API概览

本产品（大数据开发治理平台 DataWorks/2024-05-18）的OpenAPI采用 RPC 签名风格，签名细节参见签名机制说明。我们已经为开发者封装了常见编程语言的SDK，开发者可通过下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...

MaxCompute SQL节点

在工具栏的参数对话框中选择已创建的MaxCompute数据源，单击运行 MaxCompute SQL任务。返回结果查看运行结果会直接以电子表格的形式展示。您可以在DataWorks中执行操作，或者在电子表格中打开，也可以自由复制内容粘贴至本地Excel中。...

DRDS节点

DataWorks的DRDS节点可进行DRDS任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用DRDS节点进行任务开发的主要流程。背景信息 DRDS是一种分布式数据库服务。它允许您将关系数据库水平扩展到分布式系统，支持海量数据存储...

DB2节点

DataWorks的DB2节点可进行DB2任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用DB2节点进行任务开发的主要流程。背景信息 DB2是一款关系型数据库管理系统（RDBMS），用于存储、检索及管理数据，适用于处理高吞吐量、大...

Doris节点

DataWorks的Doris节点可进行Doris任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用Doris节点进行任务开发的主要流程。背景信息 Apache Doris是一个高性能、实时的分析型数据库，能较好地满足报表分析、即席查询、数据...

DM（达梦）节点

DataWorks的DM节点可进行DM任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用DM节点进行任务开发的主要流程。背景信息达梦（DM）是集成在业务系统中的OLTP类型数据库，它融合了分布式、弹性计算与云计算的优势，具有...

SAP HANA节点

DataWorks的SAP HANA节点可进行SAP HANA任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用SAP HANA节点进行任务开发的主要流程。背景信息 SAP HANA是一个高性能的内存数据库和应用平台，结合了数据库、数据处理和应用...

创建EMR Spark节点

包括绑定工作空间、网络配置等。详情请参见使用Serverless资源组。已创建业务流程。数据开发（DataStudio）基于业务流程对不同开发引擎进行具体开发操作，所以您创建节点前需要先新建业务流程，操作详情请参见创建业务流程。如果您在开发...

Vertica节点

DataWorks的Vertica节点可进行Vertica任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用Vertica节点进行任务开发的主要流程。背景信息 Vertica是一个高性能的列式存储数据库管理系统（DBMS），可高速处理和查询大规模...

MariaDB节点

DataWorks的MariaDB节点可进行MariaDB任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用MariaDB节点进行任务开发的主要流程。背景信息 MariaDB是一种开源的关系型数据库管理系统（RDBMS），与MySQL高度兼容。它可以无缝...

SelectDB节点

DataWorks的SelectDB节点可进行SelectDB任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用SelectDB节点进行任务开发的主要流程。背景信息 SelectDB是基于Apache Doris打造的新一代多云原生实时数据仓库，聚焦于满足企业...