阿里大数据平台

_相关内容

从HDFS迁移数据到OSS/OSS-HDFS

本文为您介绍如何使用阿里云JindoDistCp从HDFS迁移数据到OSS/OSS-HDFS。前提条件 已根据 JindoDistCp使用说明 进行环境适配和工具包下载。注意事项 JindoSDK 4.4.0及以上版本默认使用域名分离的方式,数据读写域名默认使用内网标准OSS域名...

发展历程

关键性里程碑 2009年9月,ODPS(即现在的MaxCompute)大数据平台飞天项目正式启动。2010年10月,阿里巴巴集团自主研发的第一代云计算平台稳定运行。2013年8月,平台的单集群规模已达到5000台。2014年7月,平台开始对外提供服务,完全替换...

相关的云服务

DataWorks作为阿里云一站式大数据开发与治理平台,通常会与计算引擎产品联合使用,此外使用DataWorks进行数据集成时通常联合进行数据传输的数据源产品一起使用。本文为您介绍典型场景下,使用DataWorks时通常会使用到的其他云产品。计算...

DataWorks on EMR Serverless StarRocks最佳实践

了解DataWorks on EMR Serverless StarRocks DataWorks作为阿里云一站式大数据开发治理平台,通过数据源对接EMR Serverless StarRocks,可实现EMR Serverless StarRocks的数据集成、作业周期性调度,同时结合StarRocks引擎在数据分析和数据...

查询OSS数据

本文为您介绍如何使用StarRocks的数据湖分析能力查询阿里云OSS。前提条件 已创建StarRocks集群,详情请参见 创建StarRocks集群。说明 此文档仅适用于EMR-5.12.0之前版本或EMR-3.46.0之前版本的StarRocks集群。已开通OSS服务,详情请参见 ...

什么是数据湖构建

阿里数据湖构建(Data Lake Formation,简称DLF)是一款全托管的统一元数据和数据存储及管理平台,旨在为客户提供元数据管理、存储管理、权限管理、存储分析和存储优化等功能。DLF与多个阿里大数据计算引擎无缝对接,打破数据孤岛,...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

云产品事件触发器概述

事件总线EventBridge 作为一种Serverless的事件总线服务,支持包括弹性计算、存储服务、数据库、容器、大数据处理、可观测性服务及中间件服务在内的几乎所有阿里云官方事件源。事件总线EventBridge 与 函数计算 集成后,接入 事件总线...

EMR on ACK商业化公告

阿里云EMR on ACK提供了一种全新的构建大数据平台的方式。您可以将开源数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注数据任务...

阿里云官方事件源

大数据 E-MapReduce事件 E-MapReduce事件类型包括阿里平台对资源执行的操作事件、API调用和控制台的操作事件等。阿里云Elasticsearch事件 阿里云Elasticsearch事件类型包括阿里平台对资源执行的操作事件、API调用和控制台的操作事件。...

云产品事件触发器概述

大数据 E-MapReduce事件 E-MapReduce事件类型包括阿里平台对资源执行的操作事件、API调用和控制台的操作事件等。阿里云Elasticsearch事件 阿里云Elasticsearch事件类型包括阿里平台对资源执行的操作事件、API调用和控制台的操作事件。...

数据导入概览

使用DataWorks数据集成同步数据到GDB DataWorks 是阿里云上的一站式大数据智能云研发平台,其中数据集成服务支持导出数据到GDB,您也可以使用平台完成数据计算、筛选、转换等处理再同步到GDB。DataWorks的GDB数据源底层由GdbWriter插件提供...

产品服务协议

提示条款 欢迎您与阿里云计算有限公司(以下简称“阿里云”)共同签署本《阿里云产品服务协议》(下称“本协议”)并使用阿里云服务!协议中条款前所列索引关键词仅为帮助您理解该条款表达的主旨之用,不影响或限制本协议条款的含义或解释...

数据湖构建服务条款

提示条款 欢迎您与阿里云计算有限公司(以下简称“阿里云”)共同签署本《阿里云产品服务协议》(下称“本协议”)并使用阿里云服务!协议中条款前所列索引关键词仅为帮助您理解该条款表达的主旨之用,不影响或限制本协议条款的含义或解释...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

阿里云主账号访问

本文以不同阿里云主账号下的DataWorks资源组与数据源(目标网络环境下的数据库、数据服务或其他数据)为例,介绍如何进行网络连通。背景信息 网络连通方案选择取决于数据源与DataWorks工作空间(资源组)间的环境关系。详情请参见 网络连通...

产品概述

阿里云工业互联网企业级平台 阿里云工业互联网企业级平台为制造企业搭建基于业务中台和数据中台的云上数字工厂解决方案。平台基于阿里云的物联网、云计算和工业大数据的技术,构建用数字化控制并管理资源、收集分析历史信息、基于数据分析...

阿里云主账号访问

本文以不同阿里云主账号下的DataWorks资源组与数据源(目标网络环境下的数据库、数据服务或其他数据)为例,介绍如何进行网络连通。背景信息 网络连通方案选择取决于数据源与DataWorks工作空间(资源组)间的环境关系。详情请参见 网络连通...

1.1.1版本

新功能发布 数字工厂 1)数据开发-专业版以上提供 增加同步作业类型,支持工业应用或者边缘端自建数据库同步到数字工厂数据中心 支持数据中心的数据表实时预览 数据可视化支持集成 DataV数据大屏 2)基于阿里云物联网区块链平台记录和追溯...

创建阿里云账号

阿里云控制台页面,鼠标悬停至右上方的用户图像,单击 AccessKey管理。在 安全提示 对话框中,选择 继续使用AccessKey,为主账号创建AccessKey。如果选择 开始使用子用户AccessKey,则系统进入创建子账号页面,您可以为子账号创建...

OSS/OSS-HDFS概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括 JindoFS 存储系统(原JindoFS Block模式)...

DataWorks on EMR数据安全方案

大数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限、大数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...

使用OpenAPI

本文为您介绍使用开源大数据平台E-MapReduce OpenAPI的基本信息。关于使用阿里云OpenAPI的详细介绍,请参见 使用OpenAPI。基本信息 版本说明 E-MapReduce 版本号 说明 2021-03-20 推荐使用。EMR Workbench 版本号 说明 2024-04-30 推荐使用...

准备环境

实名认证,详情请参见 个人实名认证 背景信息 本次实验涉及的阿里云产品如下:大数据计算服务 MaxCompute 数据工场 DataWorks 人工智能平台 PAI MaxCompute DataWorks PAI 开通大数据计算服务MaxCompute 说明 如果您已经开通MaxCompute,请...

阿里云产品服务协议

阿里云产品的服务协议,请参见 阿里云产品服务协议。

概述

EMR数据开发于2022年2月21日停止功能更新,2023年9月30日停止全面支持。如果您在2022年2月21日21点前未使用过数据开发功能,推荐您通过EMR Workflow进行...您也可以迁移到大数据开发治理平台DataWorks,详情请参见 EMR数据开发停止更新公告。

阿里云账号角色授权

阿里云E-MapReduce服务(例如Hadoop和Spark),在运行时需要有访问其他阿里云资源和执行操作的权限。每个E-MapReduce集群必须有服务角色以及ECS应用角色。更多信息介绍,请参见 阿里云账号角色授权。

阿里云账号角色授权

阿里云E-MapReduce服务(例如Hadoop和Spark),在运行时需要有访问其他阿里云资源和执行操作的权限。本文为您介绍EMR角色授权的流程及其关联的角色。背景信息 阿里云E-MapReduce为确定权限的角色提供默认角色和默认系统策略。系统策略由...

阿里云账号角色授权

使用EMR Serverless Spark前,需要授予您的阿里云账号 AliyunServiceRoleForEMRServerlessSpark 和 AliyunEMRSparkJobRunDefaultRole 系统默认角色。本文为您介绍角色授权的基本操作。授权流程 通常,第一次 购买产品 时,需要您进行自动化...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

准备阿里云账号(主账号)

使用DataWorks产品服务前,您需先创建阿里云账号。本文为您介绍如何创建阿里云账号(主账号)。注册阿里云账号 进入 阿里云官网,单击右上角的 立即注册,即可按照界面指引创建阿里云账号,该账号即为您的主账号。更多创建详情请参见 阿里...

安全责任共担

责任包括:针对阿里云安全中心发现的EMR大数据服务组件安全漏洞,发布相关公告,并提供相应的漏洞补丁及操作流程。基于完备的阿里云综合安全产品体系,保障EMR产品内部使用的计算、存储、网络等基础设施的安全性。基于阿里云账号认证体系,...

计费概述

本文介绍阿里云E-MapReduce的计费项、计费方式、转换计费方式、续费说明、欠费说明、查看消费明细、退费说明、查看账单和计费常见问题。相关项 描述 相关文档 计费项 为您介绍E-MapReduce的计费项,以及相关计算公式,以便您对支付的费用...

大数据专家服务

数据专家服务(Bigdata Expert Service)是由阿里数据专家基于阿里云多年数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的...赋能技术团队具备大数据平台建设、架构设计、AI算法建模以及运维保障能力。

技术支持的范围和方式

阿里云E-MapReduce(简称EMR)是云原生开源大数据平台,能够为用户提供简单易集成的开源数据解决方案。EMR on ECS集群主要构建于ECS之上,集群资源归属于用户,EMR提供基于该资源的半托管云服务能力,用户对集群拥有完全的管理操作权限,...

SmartData常见问题

JindoFS是阿里云开源大数据E-MapReduce产品提供的一套Hadoop文件系统,主要对Hadoop和Spark大数据生态系统使用阿里云OSS提供多层次的封装支持和优化。基础功能提供适配OSS和支持访问,您可以直接使用JindoFS SDK;标准功能针对OSS提供分布...

E-MapReduce本地盘实例规模数据集测试

数据基准测试用于公平、客观评测不同数据产品/平台的功能和性能,对用户选择合适的大数据平台产品具有重要的参考价值,TPC-DS逐渐成为了业界公认的数据系统测试基准。本文以阿里云E-MapReduce+D1本地盘方案模拟TPC-DS测试的演示方案...

准备工作

开通企业数据智能平台 企业数据智能平台默认为关闭状态,使用前需要前往 AnalyticDB PostgreSQL版 控制台开通。登录 云原生数据仓库AnalyticDB PostgreSQL版控制台。...单击左侧导航栏中的 数据平台。单击 开通数据中台。

配置自建RDS

本文介绍如何配置自建的阿里云RDS,作为E-MapReduce(简称EMR)上DataLake集群、Custom集群或Hadoop集群的元数据。前提条件 已购买RDS MySQL实例(EMR所有版本均支持MySQL 5.7,仅EMR-3.35.0以上版本、EMR-5.0.0以上版本同时支持MySQL 5.7...

退款说明

本文介绍阿里云E-MapReduce的退款规则和退款方式。退款规则与方式 计费方式 退款规则 退款方式 包年包月 包年包月的集群在购买时已经根据购买时长预先支付了费用。在释放ECS实例时,系统将同时退还您EMR未使用部分的款项。说明 释放ECS实例...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用