云平台开源-云平台开源文档介绍内容-移动阿里云

Knox

cd/opt/apps/KNOX/knox-current/templates sh ldap-sample-users.sh 访问Web UI 访问Web UI的详情，请参见通过控制台访问开源组件Web界面。常见问题 Q：Knox组件异常停止，启动Knox的时候报错 Failed to start gateway:org.apache.hadoop....

阿里云账号角色授权

使用EMR Serverless Spark前，需要授予您的阿里云账号 AliyunServiceRoleForEMRServerlessSpark 和 AliyunEMRSparkJobRunDefaultRole 系统默认角色。本文为您介绍角色授权的基本操作。授权流程通常，第一次购买产品时，需要您进行自动化...

Zeppelin常见问题

EMR Studio上的Zeppelin与开源版本一致吗？如何设置Zeppelin Note的权限？Zeppelin执行时无法正常启动Interpreter EMR Studio上的Zeppelin与开源版本一致吗？EMR Studio上的Zeppelin是增强版的Zeppelin，与开源版本不一致。E-MapReduce的...

常见问题

登录Ranger UI，详情请参见通过控制台访问开源组件Web界面。选择 Settings Users/Groups/Roles。在 Users 页签中，您可以查看是否有新创建的Unix用户。例如，在步骤1中创建了test用户。场景二：集群已部署OpenLDAP 如果集群中已部署...

SSH隧道访问开源组件Web界面

除了通过EMR控制台提供的链接地址访问开源组件Web界面外，还可通过SSH隧道方式进行安全访问。通过SSH隧道和SOCKS代理，您可在不暴露集群内部网络结构的情况下访问开源组件Web界面。说明开源组件Web界面访问方式选择，请参见查看开源组件 ...

身份管理

对于RAM用户的使用，建议您：使用阿里云账号创建一个RAM用户，并为RAM用户授予管理员权限，后续使用有管理员权限的RAM用户创建并管理其他RAM用户。将人员用户和程序用户分离。创建RAM用户时，支持设置控制台访问和使用永久AccessKey访问...

Spark Shell作业配置

通过阿里云账号登录阿里云E-MapReduce控制台。在顶部菜单栏处，根据实际情况选择地域和资源组。单击上方的数据开发页签。单击待编辑项目所在行的作业编辑。新建Spark Shell类型作业。在页面左侧，在需要操作的文件夹上单击右键，选择 ...

JindoCache

JindoCache（原JindoFSx）是阿里云EMR提供的用于加速云原生数据湖的一个服务。他提供了数据缓存和元数据缓存等加速功能，并根据不同的CacheSet提供不同的读写策略，以满足数据湖在不同使用场景下对访问加速的需求。背景信息 CacheSet是...

支持地域

支持的地域说明如果您有其他地域的需求，可以提交工单申请，阿里云EMR团队将评估是否增加新的地域。中国地区地域名称地域ID 华北2（北京）cn-beijing 华东1（杭州）cn-hangzhou 华东2（上海）cn-shanghai 华南1（深圳）cn-shenzhen ...

StartSessionCluster-启动会话

条件关键字：是指云产品自身定义的条件关键字。关联操作：是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限，操作才能成功。操作访问级别资源类型条件关键字关联操作 emr-serverless-spark:StartSessionCluster*...

账单查询

如果您对阿里云EMR Serverless Spark的消费情况产生疑问，可以通过费用与成本查看费用账单以及消费明细。操作步骤登录费用与成本控制台。在左侧导航栏，选择。根据需要查看消费情况或导出账单。账单详细内容，可参见费用与成本的账单...

常用工具参考

EMR-3.52.0及其后续版本，以及EMR-5.18.0及其后续版本，...阿里云CLI 阿里云CLI（Command Line Interface）是一种命令行工具，允许用户在终端或命令行界面调用阿里云API，来创建、配置、管理阿里云云资源。更多信息，请参见什么是阿里云CLI。

查看开源组件 Web 界面

在EMR集群中，为了确保集群安全，Hadoop、Spark和Flink等开源组件的Web界面端口均未对外开放。如果您想直接访问开源组件的Web界面，可根据实际场景选择原生UI地址、Knox代理地址、SSH本地端口转发或 SSH动态端口转发方式进行访问。快速...

DataDisk

取值范围：cloud_efficiency：高效云盘。cloud_ssd：SSD 云盘。cloud_essd：ESSD 云盘。cloud：普通云盘。cloud_essd Size integer 单位 GB。80 PerformanceLevel string 创建 ESSD 云盘作为数据盘使用时，设置云盘的性能等级。取值范围：...

NodeAttributes

EAQ#86*SystemDiskEncrypted boolean 是否启用云盘加密。取值范围：true：启用加密。false（默认值）：不加密。false SystemDiskKMSKeyId string KMS 密钥 ID。0e478b7a-4262-4802-b8cb-00d3fb40*DataDiskEncrypted boolean 数据盘是否启用...

云监控事件编码

在云监控的事件监控模块中，您可以订阅E-MapReduce数据开发相关的系统事件，监控集群的核心组件服务状态。云监控系统事件编码及其含义如下。事件编码事件描述事件类型 EMR-110401002 工作流已成功。FLOW EMR-110401003 工作流已提交。...

Flink DataStream参考

DataFlow集群的Flink DataStream API完全兼容开源的Flink版本，关于Flink DataStream API的详细信息，请参见 Flink DataStream API Programming Guide。上下游存储（Connector）EMR-5.17.0&3.51.0及之后版本开源Flink的上下游存储，详情请...

其他漏洞汇总说明

本文为您汇总了部分漏洞说明。Apache Hadoop与Hadoop ...重要阿里云E-MapReduce的YARN服务的 yarn.scheduler.configuration.store.class 默认为file，即未开启ZKConfigurationStore。修复建议：升级Hadoop至2.10.2、3.2.4、3.3.4或更高版本。

EMR元数据迁移公告

数据湖元数据DLF是阿里云提供的统一元数据服务，具有高可用、免运维和高性能等优点，兼容Hive Metastore，无缝对接EMR上开源计算引擎，并支持多版本管理和Data Profile功能。另外，DLF还支持数据探索、湖管理和数据权限控制等功能，并与...

身份管理

对于RAM用户的使用，建议您：使用阿里云账号创建一个RAM用户，并为RAM用户授予管理员权限，后续使用有管理员权限的RAM用户创建并管理其他RAM用户。将人员用户和程序用户分离。创建RAM用户时，支持设置控制台访问和使用永久AccessKey访问...

ResourceSpec

3 storagePerformanceLevel string 云盘的性能级别。包含以下取值：pl0：单盘最高随机读写 IOPS 1 万。pl1：单盘最高随机读写 IOPS 5 万。pl2：单盘最高随机读写 IOPS 10 万。pl3：单盘最高随机读写 IOPS 100 万。pl1 ...

支持地域

本文为您介绍阿里云地域的概念、选择指导以及阿里云EMR Serverless Spark支持的地域列表。背景信息地域（Region）：指数据中心所在的地理区域，通常按照数据中心所在的城市划分。例如，华北2（北京）地域表示数据中心所在的城市是北京。...

Spark Streaming作业配置

通过阿里云账号登录阿里云E-MapReduce控制台。在顶部菜单栏处，根据实际情况选择地域和资源组。单击上方的数据开发页签。单击待编辑项目所在行的作业编辑。新建Spark Streaming类型作业。在页面左侧，在需要操作的文件夹上单击右键，...

数据加密

阿里云EMR on ECS支持数据加密功能，可有效降低数据在云端的潜在安全风险。同时支持数据备份与恢复，避免数据丢失。OSS数据加密 OSS（Object Storage Service）是阿里云提供的一种高效、安全、低成本且高可靠的云存储服务。该服务采用基于...

阿里云账号角色授权

在云资源访问授权页面，单击页面下方的同意授权。系统已默认勾选AliyunEMROnACKDefaultRole角色。手动授权如果您不小心删除了AliyunEMROnACKDefaultRole角色或者变更了授权策略导致EMR on ACK不可用，请按照以下操作步骤重新授权。创建...

什么是EMR Notebook

兼容开源 EMR Notebook兼容开源Jupyter Notebook，您可以通过文件导入、导出的方式实现开发工具的自由切换，从而降低了使用门槛。产品功能交互式编程环境支持逐步执行SQL和Python代码，并根据运行结果调整后续代码。多种数据源类型支持...

引擎版本介绍

阿里云EMR Serverless Spark是基于Apache Spark引擎构建的无服务器化大数据处理服务。Spark应用在标准的Java虚拟机（JVM）上运行，所有Spark任务都是通过Java或Scala代码执行。引擎版本号及其含义引擎版本的格式为 esr-*(Spark*,Scala*)。...

管理工作空间

工作空间是EMR Notebook管理数据库、外部集群和笔记本的基本单元。通过工作空间，您可以创建和编辑Notebook文件，方便地上传和下载文件，与其他用户共享Notebook和数据，并灵活地管理访问权限。前提条件已完成系统角色授权，详情请参见 ...

作业提交

阿里云EMR集群提供多种作业提交方式，全面涵盖从开发调试（Master节点）到生产管控（Gateway节点）以及自动化调度（DataWorks）等各个场景，以满足不同角色的需求。本文将为您介绍三种方式的优缺点及其适用场景。提交方式说明提交方式优...

Hive

EMR-3.30.0 Hive 2.3.5 支持阿里云DLF（Data Lake Formation）元数据。解决了读Delta表空目录时写DUMMY文件问题。升级HAS依赖至2.0.1。EMR-3.29.0 Hive 2.3.5 Hive升级至2.3.5.6.0。支持第三方Metastore的功能。增加datalake metastore-...

2025-07-31版本

概述 2025年07月31日，我们正式对外发布 Serverless Spark 新版本，涵盖了平台管理能力。平台侧功能分类功能更新说明相关文档数据目录支持同时添加多个 DLF（之前称为DLF 2.5）数据目录，以便进行联邦查询。在添加DLF数据目录之前，请...

集群规划

考虑因素说明考虑因素描述相关文档业务场景阿里云EMR预定义了四类业务场景，分别为数据湖集群、数据分析集群、实时数据流集群和数据服务集群。此外，系统还支持自定义集群，您可以根据具体的业务选择相应的业务场景。选择业务场景 ...

旧版API接口下线公告

阿里云EMR部分旧版的API接口将于2024年6月15日下线。下线时间 2024年6月15日下线内容本次下线涉及的API版本如下：2016-01-10 2015-09-10 2015-08-10 影响说明自2024年6月15日起，所有依赖上述旧版本API的调用将无法正常执行。为避免因...

2024-12-11版本

概述 2024年12月11日，我们正式对外发布Serverless Spark新版本，包括平台管理、性能优化以及引擎能力。平台侧功能分类功能更新说明 Gateway 支持Kyuubi Gateway（Beta），部署Kyuubi服务，并通过Kyuubi Thrift接口实现向Serverless ...

产品计费

本文介绍阿里云E-MapReduce的计费项、计费方式、计费方式转换、欠费说明、续费说明、查看消费明细、退费说明、查看账单和计费常见问题。相关项描述相关文档计费项为您介绍E-MapReduce的计费说明、计费方式概要和可能涉及到的相关产品...

Streaming SQL作业配置

通过阿里云账号登录阿里云E-MapReduce控制台。在顶部菜单栏处，根据实际情况选择地域和资源组。单击上方的数据开发页签。单击待编辑项目所在行的作业编辑。新建Streaming SQL类型作业。在页面左侧，在需要操作的文件夹上单击右键，...

Hive统一元数据

EMR上可以支持将数据存放在阿里云OSS中，在大数据量的情况下将数据存储在OSS上会大大降低使用的成本，EMR集群主要用来作为计算资源，在计算完成之后可以随时释放，数据在OSS上，同时也不用再考虑元数据迁移的问题。数据共享。使用统一的...

EMR on ACK计费说明

计费资源 2024年04月01日起阿里云E-MapReduce（简称EMR）on ACK正式商业化。阿里云EMR on ACK正式商业化后，将根据集群实际使用的POD资源规格和数量，计算每小时需支付的服务费，收费标准如下表所示。计费项单价（元/小时）vCPU 0.03528 ...

SmartData 3.2.x版本简介

通过阿里云TableStore实现对Rename的并发操作的互斥。支持通过Delta或Hudi写入数据至OSS。JindoFS缓存优化优化在AI训练场景下小文件元数据的缓存，提升元数据预加载操作和List操作的性能。JindoTable计算优化 JindoTable集成了AliORC，...

2024-09-14版本

概述 2024年09月14日，我们正式对外发布Serverless Spark新版本，包括平台升级、生态对接、性能优化以及引擎能力。平台侧功能分类功能更新说明工作空间管理支持调整额配。支持RAM角色添加或删除工作空间。优化工作空间状态流转，支持...