大数据应用与开发-大数据应用与开发文档介绍内容-移动阿里云

功能特性

DataWorks 提供一站式大数据开发与治理平台，涵盖数据集成、开发、建模、分析、质量、服务、地图及开放能力，支持全链路数据处理与企业级数据中台建设。本文为您介绍DataWorks的核心功能特性。数据集成：全领域数据汇聚 DataWorks的数据...

Dify on DMS

背景信息 Dify:一款全球流行的开源、可视化的大语言模型（LLM）应用开发平台。它提供了创建、编排和运营AI应用所需的全套工具，包括提示词工程、上下文管理、RAG（检索增强生成）引擎等。更多Dify的信息，请参见 Dify官网文档。DMS:阿里云...

技术架构选型

最终目标是支撑商家增长、行业增量分析与精细化运营等多类数据应用场景。数据采集层数据采集层采用DataWorks数据集成作为统一的数据入口，用于接入三类核心数据源：业务系统数据库（如商品中心、交易中心、品牌库）。埋点数据。日志数据...

Dify管理与开发

本文介绍通过 DMS 控制台使用 Dify 的核心流程，包括工作空间管理、成员协作与大模型应用开发，助力企业快速构建智能应用。前提条件在进行本文操作前，您已完成相关准备工作。具体操作，请参见一键购买资源并创建Dify+Qwen3/DeepSeek。...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台，满足大数据和AI融合下的数据处理需求，为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

什么是云原生应用组装平台BizWorks

BizWorks提供的一站式云原生应用开发平台，支持微服务应用的全代码开发与轻应用的低代码开发两种模式，并提供了云原生应用架构与组件选型的最佳实践，通过整合各类阿里云产品，降低云产品的使用门槛，大幅提升应用开发与运维效率。...

同步数据

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用，所有数据均为人工Mock数据，并且只支持在数据集成模块读取数据。进入数据开发登录 DataWorks控制台，切换至目标地域后，单击左侧导航栏的数据开发与运维数据...

创建Teradata数据源

说明通常情况下，生产数据源和开发数据源需配置为不同的数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数描述 JDBC URL 链接地址的格式为 ...

Notebook

本文权威汇总了DataWorks Notebook开发的核心问题，涵盖从节点创建、多语言开发、交互式运行到高级应用场景，助您扫清开发障碍，提升数据分析与AI建模效率。

客户案例

打造离线实时一体化数据中台，构建统一、完整的大数据应用链路，服务内部几大核心业务。全链路数据治理提高数据可用性，让数据在中台进行自由流动，保证数据准确、准时、一致，成本削减1亿元。提高业务迭代效率，数据更新频率由1天变成10...

管理控制概述

容器载体：它作为容器，承载数据开发、数据集成等一系列功能模块，并与数据源、计算资源、资源组等外部实体进行关联。架构与实体关系解析下图展示DataWorks各核心实体之间的依赖与关联关系：工作空间：位于架构图的中心，是所有操作的最小...

数据集成

低代码开发与智能运维通过可视化配置与流程，降低数据同步的开发复杂度与运维成本。低代码开发：向导模式提供可视化的配置界面，通过简单的点选即可完成大部分同步任务的配置，无需编写代码；脚本模式支持通过JSON脚本进行高级配置，...

数据集成概述

低代码开发与智能运维通过可视化配置与流程，降低数据同步的开发复杂度与运维成本。低代码开发：向导模式提供可视化的配置界面，通过简单的点选即可完成大部分同步任务的配置，无需编写代码；脚本模式支持通过JSON脚本进行高级配置，...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用，所有数据均为人工Mock数据，并且只支持在数据集成模块读取数据。在私有OSS环境准备步骤中创建的OSS对象存储的 Bucket 将用于接收MySQL数据源的用户信息数据与...

组件操作

数据开发数据开发层提供可视化工具和代码管理，涵盖数据的采集、清洗、建模、分析以及任务调度等一系列开发过程，旨在支持企业对数据资产的高效管理与利用。在EMR中数据开发的服务推荐使用阿里云产品DataWorks 和EMR Workflow。具体如下：...

自定义可观测页面

背景信息阿里云可观测监控 Prometheus 版默认集成了ARMS应用监控数据源，您可以直接在可观测监控 Prometheus 版下获取应用监控相关数据、查看应用监控预置大盘，并根据需求进行二次开发。前提条件 ARMS应用监控服务会根据地域自动创建...

创建Hologres数据源

说明通常情况下，生产数据源和开发数据源需配置非同一个数据源，以使开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数说明 Endpoint Hologres实例的...

创建DolphinDB数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数描述服务器地址输入服务器的IP...

产品概述

DataV-Board（数据看板）DataV-Board面向数据可视化应用开发场景，提供专业的低代码搭建工具Board，帮助开发人员通过拖拽式画布编辑和蓝图编辑器，实现大中小屏各类可视化应用的低代码搭建.满足会议展览、业务监控、风险预警、地理信息分析...

数据服务入门

背景信息 DataWorks数据服务作为数据库和数据应用之间的桥梁，旨在为个人、团队及企业提供全面的数据服务及共享能力，帮助用户统一管理面向阿里云内外部的API服务。数据服务已与API网关连通，支持一键发布API至API网关。数据服务与API网关...

DataWorks On MaxCompute使用说明

权限类别描述 MaxCompute开发项目权限 DataWorks通过空间级预设角色与开发环境MaxCompute数据源Role的映射关系，让被授予空间角色的RAM用户（子账号）拥有该角色映射的开发数据源权限，默认拥有开发环境对应的数据源项目权限，但无生产...

基础概念

变更与部署 应用开发阶段的所有配置变更将被暂存于云原生应用开发平台 CAP，仅当应用开发完毕，开发者选择项目级别或者服务级别部署时，对应的变更才会真正在云产品资源层面生效。开发和部署分离将最大程度避免意外故障。

应用场景

本文详细介绍DataWorks 的应用场景：如何构建离线与实时一体化的企业级智能云数仓，打破数据时效性壁垒，加速业务决策。构建离线实时一体化企业级智能云数仓业务挑战在数字化竞争日益激烈的今天，企业对数据时效性的要求越来越高，但传统...

DataWorks On Hologres使用说明

二、数据开发与运维模块描述相关文档数据建模数据建模是全链路数据治理的第一步，沉淀阿里巴巴数据中台建模方法论，从数仓规划、数据标准、维度建模、数据指标四个方面，以业务视角对业务的数据进行诠释，让企业内部实现“数同文”的...

最佳实践

适用场景需要对接分布式数据库的用户的应用场景总是多种多样的。PolarDB-X 2.0结合新老应用的库表使用、SQL复杂情况以及对性能吞吐的要求，将用户的应用场景大体上划分为四种典型类型，如下表所示：应用类型示例总体概况 SQL 特点大量...

创建DolphinDB数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数描述服务器地址输入服务器的IP...

创建飞书多维表格数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数描述飞书多维表格URL 飞书多维...

创建DataHub数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数描述 Endpoint DataHub的...

应用场景

这一机制确保了开发与生产环境的彻底隔离，确保符合企业级用户在研发和发布流程方面的严格要求。这些特性共同保障了数据处理的可靠性和效率，同时满足企业级应用的高标准要求。该方案优势如下：全托管免运维弹性扩展能力开放数据湖架构 ...

创建TiDB数据源

说明通常情况下，生产数据源和开发数据源需配置为不同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数描述 JDBC URL 链接地址的格式为...

IoT数据自动化同步至云端解决方案

单击当前页面左上角的图标，选择全部产品 数据开发与运维 DataStudio（数据开发），在数据开发页面新建业务流程，详情请参见通过脚本模式配置离线同步任务。新建离线同步节点，详情请参见通过脚本模式配置离线同步任务。在离线同步节点...

创建Vertica数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数描述 JDBC URL 链接地址的格式为...

创建Greenplum数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数说明 JDBC URL 填写目标数据库的...

客户案例

MaxCompute已被广泛应用于各大领域处理云上大数据，帮助众多企业解决了海量数据分析问题，同时降低企业运维成本，企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息，请参见行业客户案例...

基础：购房群体简单分析

本案例指导您完成购房群体分析，帮助您掌握DataWorks的数据开发与数据分析流程。案例介绍本案例基于用户买房数据，分析不同群体的购房情况。通过DataWorks进行数据开发和数据分析。将本地数据通过DataWorks上传至MaxCompute的 bank_data ...

EMR数据开发停止更新公告

作为一站式大数据开发治理平台，DataWorks沉淀阿里巴巴十多年大数据建设方法论，为客户完成从入湖、建模、开发、调度、治理、安全等全链路数据湖开发治理能力，帮助客户提升数据的应用效率。迁移流程阿里云DataWorks on EMR团队提供了完善...

SAP HANA节点

登录 DataWorks控制台，切换至目标地域后，单击左侧导航栏的 数据开发与运维数据开发，在下拉框中选择对应工作空间后单击进入数据开发。右键单击目标业务流程，选择新建节点数据库 Saphana。在新建节点对话框输入节点名称，单击 ...

Data+AI概览

Notebook Notebook结合大语言模型，可以给业务开发、数据开发、分析师和数据运营同学赋能，提升数据交付效率和数据自助分析的效率。用户使用该功能可以以文档形式交付查询、测试的数据及数据变化趋势等信息。文档交付后，您可以使用DMS提供...

数据库节点

DataWorks支持创建多种数据库节点，以便于SQL任务的开发、周期性调度及与其他作业的集成操作。前提条件 RAM账号添加至对应空间（可选）。进行任务开发的RAM账号已被添加至对应工作空间中，并具有开发或空间管理员（权限较大，谨慎添加）...

创建SelectDB数据源

说明通常情况下，生产数据源和开发数据源需配置为非同一个数据源，以实现开发数据源与生产数据源的环境隔离，降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源，即相同参数值。参数描述 JDBC URL 填写SelectDB的...