开发 大数据

_相关内容

大数据开发治理平台 DataWorks

大数据开发治理平台 DataWorks基于MaxCompute/EMR/Hologres等大数据计算引擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴巴数据中台与数据治理最佳实践,赋能各行业数字化转型。每天阿里巴巴集团内部有数万名...

大数据开发治理平台 DataWorks系统权限策略参考

本文描述大数据开发治理平台 DataWorks支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云...

什么是DataWorks

适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等数十种数据和AI计算服务,为数据仓库、数据湖、湖仓一体、Data+AI解决方案提供全链路智能化的数据集成、数据AI一体化开发数据分析与主动式数据...

DataWorks on EMR数据安全方案

数据安全能力:任务管理 DataWorks提供了大数据开发运维等能力,其中工作空间、安全中心等功能模块可实现对大数据计算任务的管理。工作空间:通过DataWorks的工作空间规划可以实现工作空间的人员管理、设置大数据作业可见性和可运维性。...

技术架构选型

在数据模型设计之前,您需要首先完成技术架构的选型。本教程中使用阿里云数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。...DataWorks则包括数据开发数据质量、数据安全、数据管理等在内的一系列功能。

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

实现开发生产等多套环境隔离

使用DataWorks进行大数据开发时,支持对开发、测试、生产等环境进行隔离,当您联合使用了其他阿里云产品时,也可根据环境隔离诉求进行对应业务的环境设置与隔离,本文以DataWorks联合EMR、OSS等产品为例,为您介绍如何实现开发生产等多套...

功能特性

数据服务:低成本快速发布API DataWorks的数据服务功能模块是灵活轻量、安全稳定的数据API构建平台,旨在为企业提供全面的数据共享能力,帮助用户从发布审批、授权管控、调用计量、资源隔离等方面实现数据价值输出及共享开放。功能概述 ...

Serverless资源组抵扣包

DataWorks资源组提供资源组抵扣包,用于抵扣大数据开发过程中Serverless资源组的资源消耗。本文介绍资源组抵扣包的基本详情和使用方法。重要 DataWorks资源组抵扣包仅用于抵扣Serverless按量付费资源组的资源消耗,抵扣包失效以及DataWorks...

DataWorks服务等级协议(SLA)

DataWorks服务等级协议(SLA)的详情,请参见 阿里云大数据开发治理平台DataWorks服务等级协议。

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。MaxCompute环境准备 一、开通MaxCompute产品 本教程基于MaxCompute实现,...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和StarRocks产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和StarRocks产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和Spark产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为中...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和EMR产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为中获取...

ETL工作流快速体验

案例提供的数据仅用于阿里云大数据开发治理平台DataWorks数据应用体验。仅 空间管理员 角色可导入ETL模板至目标工作空间。如需给账号授予空间管理员角色,请参见 空间级模块权限管控。导入ETL工作模板时选择的资源组若是Serverless资源组,...

使用OpenAPI

本文为您介绍使用大数据开发治理平台DataWorks OpenAPI的基本信息、使用限制、计费及调用说明。基本信息 版本 OpenAPI门户 支持的API列表 支持的地域 2024-05-18(新版OpenAPI)OpenAPI门户 支持的API列表 华东1(杭州)、华东2(上海)、...

产品生态

DataWorks作为阿里云一站式大数据开发与治理平台,通常会与计算引擎产品联合使用,此外使用DataWorks进行数据集成时通常联合进行数据传输的数据源产品一起使用。本文为您介绍典型场景下,使用DataWorks时通常会使用到的其他云产品。计算...

使用旧版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和Spark产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为中...

EMR Studio(已不支持新购)

EMR Studio是E-MapReduce提供的开源大数据开发套件,包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等开源组件。能够无缝关联EMR集群(EMR on ECS和EMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度和任务监控等...

DataWorks on EMR Serverless StarRocks最佳实践

数据源介绍详情请参见 StarRocks数据源,数据源的创建入口及配置要点如下。进入数据源页面。登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 更多 管理中心,在下拉框中选择对应工作空间后单击 进入管理中心。进入工作空间管理...

创建工作空间

步骤三:绑定计算资源 创建工作空间后,为其绑定计算资源(如 MaxCompute),以进行相关大数据开发任务。若 使用新版数据开发Data Studio,则自动进入绑定计算资源页步骤,具体操作请参见 绑定计算资源。若尚未准备好计算资源,也可以在...

DataWorks模块使用指引

DataWorks 是阿里云提供的一站式大数据开发与治理平台,旨在帮助用户解决从数据接入、处理、治理到服务化的全链路数据问题。它通过一系列高度协同的功能模块,将复杂的数据工程流程化、可视化,显著降低了大数据开发的门槛。本文将为您逐一...

购买指引

资源组是执行数据开发数据集成等任务时,所消耗的计算资源的成本,是运行成本的核心。DataWorks推荐您使用Serverless资源组,不再推荐使用旧版资源组(独享资源组、公共资源组)。Serverless资源组具有两种付费模式,您可以根据业务负载...

综合:网站用户画像分析

开源全托管服务EMR Serverless StarRocks 开源大数据平台 E-MapReduce 开源全托管服务EMR Serverless Spark 数据中台 一站式大数据开发治理DataWorks 在本案例中,DataWorks作为数据中台,用于对原始数据进行同步、加工、质量监控、数据...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和EMR产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站行为中获取...

API概览

本产品(大数据开发治理平台 DataWorks/2024-05-18)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...

大数据AI公共数据集分析

操作难度 低 所需时间 30分钟 使用的阿里云产品 DataWorks:一站式大数据开发与治理平台,创建数据源并在数据开发绑定数据源后可在DataWorks上开发调度对应引擎的数据开发治理任务。MaxCompute:适用于数据分析场景的企业级SaaS模式云数据...

使用新版数据开发体验

通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行大数据开发和分析,并通过用户画像分析案例体验DataWorks在数据集成、数据开发和运维中心模块方面的相关能力。案例介绍 为了更好地制定企业经营策略,现需要从用户网站...

准备环境

本案例提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(DataStudio)(旧版)进行数据加工。MaxCompute环境准备 一、开通MaxCompute产品 本教程基于MaxCompute实现,请...

准备环境

本案例提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本案例使用 数据开发(DataStudio)(旧版)进行数据加工。EMR环境准备 创建EMR集群 本教程需要您创建一个EMR集群,用于集成到...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。OSS对象存储环境准备 本案例将使用自定义函数,注册函数所用资源将上传至...

使用DataWorks连接

DataWorks基于MaxCompute等引擎,提供统一的全链路大数据开发治理平台。本文为您介绍如何通过DataWorks使用MaxCompute服务。背景信息 DataWorks支持将计算引擎绑定至DataWorks的工作空间,绑定后您可以创建计算任务并进行周期调度。使用...

数据开发工作台(已停止新购)

EMR数据开发于2022年2月21日停止功能更新,2023年9月30日停止全面支持。如果您在2022年2月21日21点前未使用过数据开发功能,推荐您通过EMR Workflow进行...您也可以迁移到大数据开发治理平台DataWorks,详情请参见 EMR数据开发停止更新公告。

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。OSS对象存储环境准备 本教程需要您创建一个OSS Bucket,后续会将用户信息...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。EMR环境准备 本教程需要您创建一个EMR集群并集成到DataWorks,以便在...

EMR数据开发停止更新公告

作为一站式大数据开发治理平台,DataWorks沉淀阿里巴巴十多年大数据建设方法论,为客户完成从入湖、建模、开发、调度、治理、安全等全链路数据开发治理能力,帮助客户提升数据的应用效率。迁移流程 阿里云DataWorks on EMR团队提供了完善...

个人开发环境制作DataWorks镜像

python 文件名.py"我是大数据治理开发平台文档"Python文件运行成功后,即代表jieba类在个人开发环境安装成功。安装三方 依赖 通过Git clone 克隆Python项目安装 通过 git clone 克隆Python项目,需为VPC配置公网,请参见 配置公网NAT网关。...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用