大数据软件开发是什么

_相关内容

管理控制

管理控制台丰富多样的功能模块,可以帮助用户进行数据集成、数据开发与运维、数据治理、数据分析以及数据服务,以及监控和管理数据服务的运行状态和性能。注意事项 管理控制台存在RAM用户(即子账号)访问控制,若您无法看到部分界面功能或...

创建EMR Hive节点

您可以创建EMR(E-MapReduce)HIVE节点,通过类SQL语句读写、管理存储在分布式存储系统上的大数据集的数据仓库,完成海量日志数据的分析和开发工作。前提条件 已创建阿里云EMR集群,并注册EMR集群至DataWorks。操作详情请参见 旧版数据开发...

创建RocketMQ数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint RocketMQ实例的...

准备环境

本案例提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(DataStudio)(旧版)进行数据加工。MaxCompute环境准备 一、开通MaxCompute产品 本教程基于MaxCompute实现,请...

创建MaxCompute数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 说明 Endpoint MaxCompute的...

核心收费场景解析

数据开发场景费用 进行 数据开发 与运维可能产生的费用如下:DataWorks侧收费(费用在DataWorks相关账单中)资源组费用:节点开发和个人开发环境使用依赖资源组进行。根据资源组不同,将产生 Serverless资源组费用 或 独享调度资源组费用。...

创建CDH Hive节点

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据开发与运维 数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。右键单击某个业务流程,选择 新建节点 CDH CDH Hive。说明 鼠标悬停至顶部 新增 按钮,根据界面提示...

DataWorks On CDP/CDH使用说明

一、数据集成 DataWorks的数据集成模块为您提供读取和写入数据至CDP/CDH Hive、CDP/CDH HBase的能力,您需要将Hive或HBase组件创建为 DataWorks的 Hive或HBase数据源,实现将其他数据源的数据同步至Hive或HBase数据源,或将Hive或HBase数据...

创建CDH Presto节点

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据开发与运维 数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。右键单击某个业务流程,选择 新建节点 CDH CDH Presto。说明 鼠标悬停至顶部 新增 按钮,根据界面...

创建RocketMQ数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint RocketMQ实例的...

进阶:商品订单畅销类目分析

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。本文以DataWorks的部分核心功能为例,指导您使用DataWorks接入数据并进行业务处理、...

创建Tablestore数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint 即实例访问地址。...

数据源配置

数据源用于连接各类数据库和存储服务(如MaxCompute、MySQL、OSS等),是 数据集成同步任务 的必备配置,决定任务读取(数据来源)和写入(数据去向)的数据库。数据源的作用 在数据集成任务中,数据源扮演着数据流动两端的“端点”角色:...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。MaxCompute环境准备 一、开通MaxCompute产品 本教程基于MaxCompute实现,...

创建OSS数据

说明 通常情况下,生产数据源和开发数据源需配置非同一个数据源,以使开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint OSS所在地域对应的...

创建CDH MR节点

在DataWorks任务开发中,您可以通过创建CDH MR(MapReduce)节点处理超大规模的数据集。本文为您介绍如何在DataWorks中创建并使用CDH MR节点。前提条件 数据开发(DataStudio)中已创建业务流程。数据开发(DataStudio)基于业务流程对不同...

创建Amazon S3数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint Amazon S3所在...

周期任务基本运维操作

当发生范围的数据质量问题时,您可以右键单击实例,选择 紧急操作 强制重跑或强制重跑下游。详情请参见 附录:强制重跑下游。部分极端情况下(如服务器异常断电、主备切换等),DataWorks可能无法彻底终止MaxCompute的相关任务进程,此时...

使用资源组进行精细化资源控制

支持资源组的资源类型 大数据开发治理平台DataWorks支持资源组的资源类型如下表所示:云服务 云服务代码 资源类型 大数据开发治理平台DataWorks dide Proyek:大数据开发治理平台DataWorks dide dwresourcegroup:DataWorks资源组 大数据开发...

创建EMR Spark SQL节点

前提条件 开始进行节点开发前,若您需要定制组件环境,此时即可基于官方镜像 dataworks_emr_base_task_pod 创建 自定义镜像,并在 数据开发中使用镜像。例如:在创建自定义镜像时替换Spark Jar包或是依赖特定的 库、文件 或 jar包。已注册...

创建Tablestore数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint 即实例访问地址。...

创建OSS数据

说明 通常情况下,生产数据源和开发数据源需配置非同一个数据源,以使开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint OSS所在地域对应的...

创建Amazon S3数据

说明 通常情况下,生产数据源和开发数据源需配置为非同一个数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint Amazon S3所在...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。EMR环境准备 本教程需要您创建一个EMR集群并集成到DataWorks,以便在...

创建EMR Trino节点

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据开发与运维 数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。右键单击目标业务流程,选择 新建节点 EMR EMR Trino。在 新建节点 对话框中,输入 名称,并选择 ...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。OSS对象存储环境准备 本教程需要您创建一个OSS Bucket,后续会将用户信息...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。本教程使用 数据开发(Data Studio)(新版)进行数据加工。OSS对象存储环境准备 本案例将使用自定义函数,注册函数所用资源将上传至...

准备环境

本教程提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据,并且只支持在数据集成模块读取数据。在 私有OSS环境准备 步骤中创建的OSS对象存储的 Bucket 将用于接收MySQL数据源的用户信息数据与...

权限自查建议

随着项目演进中,人员权限会更新,您需要及时审视人员权限合理性,提升项目数据安全。本文为您介绍权限查询要点及调整建议。背景信息 在项目创建初期,为了提升业务处理效率,通常在用户和权限管理上相对宽松。但是当项目进入稳定发展的...

产品概述

产品介绍 DataV是一款数据可视化应用搭建产品,让数据可视、价值可见。DataV数据可视化应用搭建平台以丰富的图表组件和二三维时空地理组件为特色,搭配强大的低代码可视化搭建编排能力,可以高效、低成本地完成可视化大屏、PC数据看板、...

什么是EMR Serverless Spark

该产品为企业提供了一站式的数据平台服务,包括任务开发、调试、调度及运维等功能,显著简化了数据处理与模型训练的全流程。同时,它100%兼容开源Spark生态,能够无缝集成到客户现有的数据平台。通过使用EMR Serverless Spark,企业可以...

基本概念

本文为您介绍DataWorks中,数据集成、数据建模、数据开发数据分析、数据服务等模块开发过程中涉及的相关基本概念。通用概念 工作空间 工作空间 是DataWorks管理任务、成员,分配角色和权限的基本单元。工作空间管理员可以为工作空间加入...

旧版数据开发:绑定CDH计算资源

以下简称CDH)和CDP(Cloudera Data Platform,以下简称CDP)集群对接的能力,您可在DataWorks中注册CDH及CDP集群,进行任务开发、调度、数据地图(元数据管理)和数据质量等一系列的数据开发和治理操作。背景信息 CDH是Cloudera的开源平台...

HttpFile数据

未配置"nullFormat"参数:表示来源是什么数据就直接按照什么数据写入目标端,不做任何转换。否 无 skipHeader 类CSV格式文件可能存在表头为标题情况,同步数据时可选择是否需要跳过表头(即不同步表头数据)。true:跳过。false:不跳过。...

安全中心

数据管理和安全中心是什么关系?为什么在申请时,有时可以选择字段,有时不可以选择?提交申请后,需要谁进行审批?为什么提交了一个申请,在我的申请中却看到两个申请单?为什么有的字段只申请1个月权限,审批完成后查看变为永久?为什么...

数据治理常见问题

问题分类 数据地图 为什么数据地图数据总览页存储量和存储趋势图相差较?数据地图新建表搜不到 当前表业务逻辑变更如何通知下游?哪些类型的Hive表支持在数据地图中预览?数据保护伞 数据保护伞为什么有时候查询脱敏有时候查询不脱敏 为...

使用Hologres动态表

DataWorks数据目录融合了Hologres动态表引擎的功能,提供了一套可视化工具用于动态表管理、调度依赖以及任务维护等操作。方便您在DataWorks中创建使用Hologres动态表。前提条件 已创建新的工作空间并勾选 使用新版数据开发(Data Studio)...

数据质量

数据质量的主要功能模块及其在控制台的对应页面如下:模块名称 模块描述 数据质量大盘 数据质量大盘为您展示当前工作空间下,需要重点关注的数据质量总览指标、实例运行后触发的质量规则校验状态的趋势及分布情况、TOP质量问题表及质量问题...

创建Teradata数据

说明 通常情况下,生产数据源和开发数据源需配置为不同的数据源,以实现开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 JDBC URL 链接地址的格式为 ...

数据目录

不支持 认证身份与鉴权说明 数据目录是否能够正常读取数据源下的数据信息,取决于数据源添加至数据目录的方式,具体规则如下:从工作空间绑定的数据源实例添加到数据目录时,该数据目录将使用 数据源配置的身份信息 从数据源读取数据至...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用