大数据应用与开发

_相关内容

功能特性

DataWorks 提供一站式大数据开发与治理平台,涵盖数据集成、开发、建模、分析、质量、服务、地图及开放能力,支持全链路数据处理与企业级数据中台建设。本文为您介绍DataWorks的核心功能特性。数据集成:全领域数据汇聚 DataWorks的数据...

Dify on DMS

背景信息 Dify:一款全球流行的开源、可视化的语言模型(LLM)应用开发平台。它提供了创建、编排和运营AI应用所需的全套工具,包括提示词工程、上下文管理、RAG(检索增强生成)引擎等。更多Dify的信息,请参见 Dify官网文档。DMS:阿里云...

技术架构选型

最终目标是支撑商家增长、行业增量分析精细化运营等多类数据应用场景。数据采集层 数据采集层采用DataWorks数据集成 作为统一的数据入口,用于接入三类核心数据源:业务系统数据库(如商品中心、交易中心、品牌库)。埋点数据。日志数据...

Dify管理与开发

本文介绍通过 DMS 控制台使用 Dify 的核心流程,包括工作空间管理、成员协作与大模型应用开发,助力企业快速构建智能应用。前提条件 在进行本文操作前,您已完成相关准备工作。具体操作,请参见 一键购买资源并创建Dify+Qwen3/DeepSeek。...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

什么是云原生应用组装平台BizWorks

BizWorks提供的一站式云原生应用开发平台,支持微服务应用的全代码开发与轻应用的低代码开发两种模式,并提供了云原生应用架构与组件选型的最佳实践,通过整合各类阿里云产品,降低云产品的使用门槛,大幅提升应用开发与运维效率。...

同步数据

本教程提供数据仅作为阿里云数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据,并且只支持在数据集成模块读取数据。进入数据开发 登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据开发与运维 数据...

创建Teradata数据

说明 通常情况下,生产数据源和开发数据源需配置为不同的数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 JDBC URL 链接地址的格式为 ...

Notebook

本文权威汇总了DataWorks Notebook开发的核心问题,涵盖从节点创建、多语言开发、交互式运行到高级应用场景,助您扫清开发障碍,提升数据分析AI建模效率。

客户案例

打造离线实时一体化数据中台,构建统一、完整的大数据应用链路,服务内部几核心业务。全链路数据治理提高数据可用性,让数据在中台进行自由流动,保证数据准确、准时、一致,成本削减1亿元。提高业务迭代效率,数据更新频率由1天变成10...

管理控制概述

容器载体:它作为容器,承载数据开发数据集成等一系列功能模块,并数据源、计算资源、资源组等外部实体进行关联。架构实体关系解析 下图展示DataWorks各核心实体之间的依赖关联关系:工作空间:位于架构图的中心,是所有操作的最小...

数据集成

低代码开发与智能运维 通过可视化配置与流程,降低数据同步的开发复杂度与运维成本。低代码开发:向导模式 提供可视化的配置界面,通过简单的点选即可完成部分同步任务的配置,无需编写代码;脚本模式 支持通过JSON脚本进行高级配置,...

数据集成概述

低代码开发与智能运维 通过可视化配置与流程,降低数据同步的开发复杂度与运维成本。低代码开发:向导模式 提供可视化的配置界面,通过简单的点选即可完成部分同步任务的配置,无需编写代码;脚本模式 支持通过JSON脚本进行高级配置,...

准备环境

本教程提供数据仅作为阿里云数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据,并且只支持在数据集成模块读取数据。在 私有OSS环境准备 步骤中创建的OSS对象存储的 Bucket 将用于接收MySQL数据源的用户信息数据...

组件操作

数据开发 数据开发层提供可视化工具和代码管理,涵盖数据的采集、清洗、建模、分析以及任务调度等一系列开发过程,旨在支持企业对数据资产的高效管理利用。在EMR中数据开发的服务推荐使用阿里云产品DataWorks 和EMR Workflow。具体如下:...

自定义可观测页面

背景信息 阿里云 可观测监控 Prometheus 版 默认集成了ARMS应用监控数据源,您可以直接在 可观测监控 Prometheus 版 下获取应用监控相关数据、查看应用监控预置大盘,并根据需求进行二次开发。前提条件 ARMS应用监控服务会根据地域自动创建...

创建Hologres数据

说明 通常情况下,生产数据源和开发数据源需配置非同一个数据源,以使开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 说明 Endpoint Hologres实例的...

创建DolphinDB数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 服务器地址 输入服务器的IP...

产品概述

DataV-Board(数据看板)DataV-Board面向数据可视化应用开发场景,提供专业的低代码搭建工具Board,帮助开发人员通过拖拽式画布编辑和蓝图编辑器,实现大中小屏各类可视化应用的低代码搭建.满足会议展览、业务监控、风险预警、地理信息分析...

数据服务入门

背景信息 DataWorks数据服务作为数据库和数据应用之间的桥梁,旨在为个人、团队及企业提供全面的数据服务及共享能力,帮助用户统一管理面向阿里云内外部的API服务。数据服务已API网关连通,支持一键发布API至API网关。数据服务API网关...

DataWorks On MaxCompute使用说明

权限类别 描述 MaxCompute开发项目权限 DataWorks通过空间级预设角色与开发环境MaxCompute数据源Role的映射关系,让被授予空间角色的RAM用户(子账号)拥有该角色映射的开发数据源权限,默认拥有开发环境对应的数据源项目权限,但无生产...

基础概念

变更部署 应用开发阶段的所有配置变更将被暂存于 云原生应用开发平台 CAP,仅当应用开发完毕,开发者选择项目级别或者服务级别部署时,对应的变更才会真正在云产品资源层面生效。开发和部署分离将最大程度避免意外故障。

应用场景

本文详细介绍DataWorks 的应用场景:如何构建离线实时一体化的企业级智能云数仓,打破数据时效性壁垒,加速业务决策。构建离线实时一体化企业级智能云数仓 业务挑战 在数字化竞争日益激烈的今天,企业对数据时效性的要求越来越高,但传统...

DataWorks On Hologres使用说明

二、数据开发与运维 模块 描述 相关文档 数据建模 数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让企业内部实现“数同文”的...

最佳实践

适用场景 需要对接分布式数据库的用户的应用场景总是多种多样的。PolarDB-X 2.0结合新老应用的库表使用、SQL复杂情况以及对性能吞吐的要求,将用户的应用场景大体上划分为四种典型类型,如下表所示:应用类型 示例 总体概况 SQL 特点 大量...

创建DolphinDB数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 服务器地址 输入服务器的IP...

创建飞书多维表格数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 飞书多维表格URL 飞书多维...

创建DataHub数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint DataHub的...

应用场景

这一机制确保了开发与生产环境的彻底隔离,确保符合企业级用户在研发和发布流程方面的严格要求。这些特性共同保障了数据处理的可靠性和效率,同时满足企业级应用的高标准要求。该方案优势如下:全托管免运维 弹性扩展能力 开放数据湖架构 ...

创建TiDB数据

说明 通常情况下,生产数据源和开发数据源需配置为不同一个数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 JDBC URL 链接地址的格式为...

IoT数据自动化同步至云端解决方案

单击当前页面左上角的 图标,选择 全部产品 数据开发与运维 DataStudio(数据开发),在数据开发页面新建业务流程,详情请参见 通过脚本模式配置离线同步任务。新建离线同步节点,详情请参见 通过脚本模式配置离线同步任务。在离线同步节点...

创建Vertica数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 JDBC URL 链接地址的格式为...

创建Greenplum数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 说明 JDBC URL 填写目标数据库的...

客户案例

MaxCompute已被广泛应用于各领域处理云上大数据,帮助众多企业解决了海量数据分析问题,同时降低企业运维成本,企业人员可更专注于业务开发。本文为您介绍MaxCompute的精选客户案例。MaxCompute的全量客户案例信息,请参见 行业客户案例...

基础:购房群体简单分析

本案例指导您完成购房群体分析,帮助您掌握DataWorks的数据开发与数据分析流程。案例介绍 本案例基于用户买房数据,分析不同群体的购房情况。通过DataWorks进行数据开发和数据分析。将本地数据通过DataWorks上传至MaxCompute的 bank_data ...

EMR数据开发停止更新公告

作为一站式大数据开发治理平台,DataWorks沉淀阿里巴巴十多年大数据建设方法论,为客户完成从入湖、建模、开发、调度、治理、安全等全链路数据开发治理能力,帮助客户提升数据应用效率。迁移流程 阿里云DataWorks on EMR团队提供了完善...

SAP HANA节点

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据开发与运维 数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。右键单击目标业务流程,选择 新建节点 数据库 Saphana。在 新建节点 对话框输入节点 名称,单击 ...

Data+AI概览

Notebook Notebook结合语言模型,可以给业务开发数据开发、分析师和数据运营同学赋能,提升数据交付效率和数据自助分析的效率。用户使用该功能可以以文档形式交付查询、测试的数据及数据变化趋势等信息。文档交付后,您可以使用DMS提供...

数据库节点

DataWorks支持创建多种数据库节点,以便于SQL任务的开发、周期性调度及其他作业的集成操作。前提条件 RAM账号添加至对应空间(可选)。进行任务开发的RAM账号已被添加至对应工作空间中,并具有 开发 或 空间管理员(权限较,谨慎添加)...

创建SelectDB数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 JDBC URL 填写SelectDB的...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用