软件开发大数据方向

_相关内容

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据,并且只支持在数据集成模块读取数据。在 私有OSS环境准备 步骤中创建的OSS对象存储的 Bucket 将用于接收MySQL数据源的用户信息数据与...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。OSS对象存储环境准备 本案例将使用自定义函数,注册函数所用资源将上传至...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。OSS对象存储环境准备 本教程需要您创建一个OSS Bucket,后续会将用户信息...

同步数据

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据,并且只支持在数据集成模块读取数据。进入数据开发 登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据开发与运维 数据...

准备环境

本案例提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(DataStudio)(旧版)进行数据加工。MaxCompute环境准备 一、开通MaxCompute产品 本教程基于MaxCompute实现,请...

API概览

本产品(大数据开发治理平台 DataWorks/2020-05-18)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...

管理控制概述

容器载体:它作为容器,承载数据开发数据集成等一系列功能模块,并与数据源、计算资源、资源组等外部实体进行关联。架构与实体关系解析 下图展示DataWorks各核心实体之间的依赖与关联关系:工作空间:位于架构图的中心,是所有操作的最小...

使用公开数据集进行数据查询、分析和可视化

公开数据集列表 类型 数据数据来源及说明 数据类型 数字商业 阿里电商数据集 本数据集来源天池阿里移动推荐算法挑战赛,基于阿里巴巴100万条脱敏的商品数据,可以基于各类商品、操作、时间等字段,体验阿里云大数据分析能力。静态数据 ...

管理控制

管理控制台丰富多样的功能模块,可以帮助用户进行数据集成、数据开发与运维、数据治理、数据分析以及数据服务,以及监控和管理数据服务的运行状态和性能。注意事项 管理控制台存在RAM用户(即子账号)访问控制,若您无法看到部分界面功能或...

个人开发环境制作DataWorks镜像

Data Studio新版数据开发支持将个人开发环境制作成镜像,以供数据开发与其他个人开发环境使用。本文将介绍如何在个人开发环境制作个人开发实例镜像。背景介绍 在个人开发环境开发测试时,若您想要使用不同的三方依赖,您不仅可以在个人开发...

用户价值

用户角色 功能 能力 详述 数据生产方 数据开发 设计数据模型 开发数据加工逻辑 设计标准、稳定的数据模型:通过数据标准和数据建模,设计标准化数据模型,提高数据模型的稳定性,减少重复开发工作。高效完成数据加工与运维:通过数据同步、...

跨云发布

环境限制 源工作空间跨云发布到目标工作空间时,环境限制如下:源工作空间 目标工作空间 工作空间模式 数据开发版本 简单模式 新版数据开发 简单模式 旧版数据开发 标准模式 新版数据开发 标准模式 旧版数据开发 简单模式 新版数据开发 不...

ClickHouse数据

数据同步任务开发 数据同步任务的配置入口和通用配置流程可参见下文的配置指导。单表离线同步任务配置指导 操作流程请参见 通过向导模式配置离线同步任务、通过脚本模式配置离线同步任务。脚本模式配置的全量参数和脚本Demo请参见下文的 ...

元数据采集

代码来源 采集口径 触发采集方式 数据开发 数据开发-创建节点并编辑代码 自动采集 数据开发(旧版)数据开发(旧版)-创建节点并编辑代码 数据分析 数据分析-新建SQL查询并编辑代码 数据服务 数据服务-新建API数据推送服务 API资产 数据...

概览

功能项 说明 任务编排 通过一个或多个任务编排而成的任务组,实现数据归档、数据集成、数仓数据开发数据挖掘等需求。数据服务 将DMS上管控的数据以API的形式快速对外输出。视频介绍 研发流程解决方案 数据安全解决方案 数据开发解决方案

什么是DataWorks

适配阿里云MaxCompute、E-MapReduce、Hologres、Flink、AnalyticDB、StarRocks、PAI 等数十种数据和AI计算服务,为数据仓库、数据湖、湖仓一体、Data+AI解决方案提供全链路智能化的数据集成、数据AI一体化开发数据分析与主动式数据...

创建数据脱敏场景

DataWorks提供的 数据开发/数据地图展示脱敏、数据分析展示脱敏、MaxCompute引擎层脱敏、Hologres引擎层脱敏 等动态脱敏,及 数据集成静态脱敏 等静态脱敏均为一级脱敏场景,属于固定场景,不支持执行新增、编辑、删除等操作。同时,...

Notebook 查询与分析

多引擎开发:DataWorks Notebook拥有SQL Cell功能,支持多种大数据引擎的SQL开发与分析。交互式分析:交互式SQL查询:通过Python编写Widgets组件,通过在组件中直观选择或设置参数的取值,后续可以进一步在SQL中引用相同参数及取值,从而...

后续指引

介绍:数据迁移 实践:数据迁移最佳实践 常见问题:数据上传下载常见问题 规模数据迁移 MaxCompute提供MMA(MaxCompute Migration Assist)迁移工具支撑规模数据迁移。开发与分析 数据类型 MaxCompute支持三种数据类型版本,为您介绍各...

准备环境

为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和 人工智能平台 PAI。前提条件 注册阿里云账号,详情请参见 注册阿里云账号。实名认证,详情请参见 个人实名认证 背景信息 本次...

什么是MaxFrame

MaxFrame是阿里云MaxCompute为了满足用户在Python生态中日益增长的高效大数据处理和AI开发需求,提供的基于Python编程接口的分布式计算框架。您可直接利用MaxCompute的海量计算资源及数据通过MaxFrame进行TB/PB级数据处理、可视化数据探索...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

实时数据集概述

实时数据集是通过指标映射创建实时标签的前提条件。实时数据集通过不同的定义方式所创建的虚拟表结构。定义好实时数据集后,可以通过指标映射的方式创建...通过PostgreSQL创建实时数据集 通过SQL加工方式加工PostgreSQL数据源开发数据集指标。

客户案例

基于飞天大数据平台产品DataWorks+MaxCompute大大提高了数据业务的开发效率,构建大润发的数据中台体系。新金融行业:某互联网金融公司湖仓一体案例 客户简介 公司的第一代数据湖是基于Hadoop+OSS搭建的,同时引入的数据中台的执行引擎和...

Notebook开发

多引擎开发:DataWorks Notebook拥有SQL Cell功能,支持多种大数据引擎的SQL开发与分析。交互式分析:交互式SQL查询:通过Python编写Widgets组件,通过在组件中直观选择或设置参数的取值,后续可以进一步在SQL中引用相同参数及取值,从而...

基于MaxCompute进行大数据BI分析

本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行规模数据计算,详情请...

开放事件(OpenEvent)

数据下载前置事件-文件下载 不支持 支持 数据上传前置事件 不支持 支持 空间级事件 数据开发 数据开发消息格式详情请参见:数据开发事件列表。事件类型 事件 普通事件 扩展点事件 示例(产生事件消息的操作)节点变更 新增节点 支持 不支持...

实践示例:E-MapReduce底层脱敏使用方法

新增脱敏场景 DataWorks提供的 数据开发/数据地图展示脱敏、数据分析展示脱敏、MaxCompute引擎层脱敏、Hologres引擎层脱敏 等动态脱敏,及 数据集成静态脱敏 等一级脱敏场景为固定场景,不支持执行新增、编辑、删除等操作,可基于业务需要...

创建Redis数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 部署方式 支持 集群 和 ...

工作空间管理

工作空间管理员将成员添加至工作空间中,并赋予该成员不同的角色,例如:空间管理员、数据分析师、部署、开发数据治理管理员、模型设计师、访客、运维、项目所有者、安全管理员,以实现多角色协同工作的业务场景。选择工作空间类型 ...

其他问题

为什么不能在调度资源组上进行大数据计算?其他 如何设置任务优先级?如何查看任务优先级?周期任务与周期实例、补数据实例、测试实例是什么关系?DataWorks每晚将根据周期任务,批量生成第二天自动调度的周期实例,周期实例自动生成并且...

数据开发流程引导

DataWorks将不同类型引擎任务封装为不同节点,通过创建节点来生成数据开发任务。同时,数据开发(DataStudio)支持使用资源、函数以及不同的逻辑处理节点开发复杂任务。本文将为您介绍数据开发任务的通用开发流程。前提条件 已绑定所需数据...

执行冒烟测试

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据开发与运维 数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。开启强制冒烟测试 空间管理员可开启工作空间强制进行冒烟测试,开启强制冒烟测试功能后,当前工作...

创建FTP数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Protocol 基于FTP服务器...

创建FTP数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Protocol 基于FTP服务器...

配置数据脱敏规则

DataWorks为您提供了 数据开发/数据地图展示脱敏、数据集成静态脱敏、数据分析展示脱敏、MaxCompute引擎层脱敏、Hologres引擎层脱敏 等一级脱敏场景,您可直接使用。若该类场景指定生效的数据范围及用户范围无法满足您更细化的脱敏需求,则...

管理开放数据

使用开放数据 将开放数据安装到目标工作空间的 MaxCompute 计算资源后,您可以在数据开发数据分析模块中,基于该目标工作空间的MaxCompute计算资源,直接访问已授权的元数据视图信息。在数据地图左侧导航栏中,单击 图标,进入数据目录...

绑定Hologres计算资源

创建完成后,可在DataWorks的各功能模块使用该计算资源连接Hologres实例,进行相应的数据同步、数据开发数据分析等操作。前提条件 已 购买Hologres实例 并 创建数据库。重要 购买Hologres实例时,请确保其与DataWorks工作空间位于同一...

EMR Hive节点

DataWorks提供的EMR(E-MapReduce)Hive节点支持云端规模数据的批处理分析,能够操作存储在分布式系统中的数据,简化大数据处理流程并提高开发效率。在EMR Hive节点中,您可以使用类SQL语句读取、写入和管理大数据集,从而高效地完成海量...

绑定AnalyticDB for MySQL3.0计算资源

创建完成后,可在DataWorks的各功能模块使用该计算资源连接AnalyticDB for MySQL3.0集群,进行相应的数据同步、数据开发数据分析等操作。前提条件 已 创建AnalyticDB for MySQL3.0集群。说明 建议购买AnalyticDB for MySQL3.0集群时,...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用