您需要在SSH连接中创建隧道以查看开源组件的Web页面,详情请参见 通过SSH隧道方式访问开源组件Web UI。默认用户名和密码均为admin,请您登录后及时修改密码。说明 首次登录后默认是英文界面。在Superset页面,单击右上角的 图标,选择 ...
通过访问链接与端口功能,您可方便地通过控制台方式访问集群中已安装开源组件Web界面的地址。本文将介绍如何设置安全组规则和访问链接,以便查看集群中开源组件的UI界面。说明 开源组件Web界面访问方式选择,请参见 查看开源组件 Web 界面...
由于ACK控制台上 访问链接与端口 不可用,您可通过以下配置访问开源组件的Web UI。登录 容器服务管理控制台。在 集群列表 页面,单击EMR on ACK所关联集群的 集群名称。鼠标悬浮在左边菜单栏 网络,单击 服务,在服务页面更新YAML文件。...
高性能计算引擎:内置 Fusion Engine,性能可达开源 Spark 的 4 倍;支持 Remote Shuffle Service Celeborn,提供 PB 级 Shuffle 能力并降低计算成本。高扩展性与弹性:基于阿里云 Serverless 底座,提供秒级资源弹性伸缩,按实际计算资源...
通过Kyuubi Gateway,以兼容开源Kyuubi的方式提交SQL任务。数据目录 支持使用RAM用户(子账号)身份访问DLF。支持访问DLF 2.0 Hive Catalog。资源观测 支持观测工作空间、队列的资源消耗情况。运行环境 Spark Submit工具支持通过配置参数-...
添加依赖 需要判断的依赖任务,可以是某一个项目中的工作流具体的任务执行情况。依赖失败策略 失败(默认):依赖的上游工作流失败后,当前任务会立即标记为失败。等待:依赖的上游工作流失败后,当前任务不会立即失败,而是保持等待状态,...
EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 SparkThriftServer 操作列的 enableLDAP。...
E-Mapreduce(简称EMR)开源组件运行过程中会产生大量的日志。日志管理功能将EMR与日志服务SLS相结合,允许您在EMR控制台直接查询开源组件的日志。前提条件 已在EMR控制台上创建集群,具体操作请参见 创建集群。已 开通日志服务。使用限制 ...
Hive语法 EMR产品最大程度的保持了开源社区的语法以及体验,在Hive语法上保持与开源社区Hive语法100%的兼容性。关于Apache Hive的更多介绍,请参见 Apache Hive官网。相关文档 如何使用Hive客户端连接Hive,请参见 Hive连接方式。Hive服务...
EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 TrinoMaster 操作列的 enableLDAP。在弹出...
说明 本文部分内容来源于开源StarRocks的 什么是StarRocks。StarRocks特性 StarRocks的架构设计融合了MPP数据库,以及分布式系统的设计思想,其特性如下所示。架构精简 StarRocks内部通过MPP计算框架完成SQL的具体执行工作。MPP框架能够...
示例如下:列出运行时项目中的所有数据项。SHOW TABLES FROM jmx.current;获取每个节点的JVM信息。SELECT node,vmname,vmversion FROM jmx.current."java.lang:type=runtime;返回信息如下所示。node|vmname|vmversion-+-+-ddc4df17-xxx|...
稳定可靠的开源组件 100%采用社区开源组件,随开源版本升级迭代,详情请参见 发行版本。适配开源组件,避免开源组件之间的版本兼容性问题。基于开源组件,优化和增强阿里云部署环境,性能远高于开源版本。易用性 分钟级搭建大数据计算环境...
公测面向所有用户开放,您可以在 E-MapReduce控制台,选择 EMR Workbench Workflow,进入EMR Workflow页面创建项目并进行测试。重要 公测期间您可以免费试用EMR Workflow服务,但EMR Workflow工作流运行时需要关联EMR集群,创建或使用已有...
说明 在创建集群时,如果没有您想使用的组件,或者想使用的开源组件仅对存量用户开放,您可以自行安装并自行管理。EMR主要由开源组件、自研组件、集成的阿里云产品和集群管理四部分组成。您可以根据产品架构图查看EMR提供的大数据组件及...
EMR Studio上的Zeppelin与开源版本一致吗?如何设置Zeppelin Note的权限?Zeppelin执行时无法正常启动Interpreter EMR Studio上的Zeppelin与开源版本一致吗?EMR Studio上的Zeppelin是增强版的Zeppelin,与开源版本不一致。E-MapReduce的...
首次开通EMR Workflow服务时,将免费为您提供一个默认调度资源组。工作流定义 工作流定义是对一系列按照特定逻辑进行编排的任务及其执行顺序的描述。它包括分配给各个任务的调度节点和制定的调度策略,确保任务能在预定的时间内按照DAG...
Presto(即PrestoDB)是一款灵活、可扩展的分布式SQL查询引擎。本文介绍Presto的基本特性、系统组成和优势等信息。...例如,如果您的Presto版本号为0.279,则可以访问https://prestodb.io/docs/0.279/,查看相应版本的开源Presto文档。
2022年2月21日21点起,E-MapReduce(简称EMR)数据开发功能停止更新,进入维护状态,会影响创建项目、新建和运行作业、工作流、数据开发运维等功能。如果您还在使用数据开发功能,请尽快迁移到DataWorks构建数据开发平台。本文为您介绍数据...
地域名称 地域ID 美国(硅谷)us-west-1 新加坡 ap-southeast-1 德国(法兰克福)eu-central-1 马来西亚(吉隆坡)ap-southeast-3 优惠活动及产品计费 当您首次在支持地域开通EMR Workflow服务时,通常会获得以下资源:获得一个免费的默认...
EMR-3.27.x及之前版本使用Flink社区开源版本,EMR-3.27.x之后版本使用完全兼容开源Flink的企业版(VVR)。本文介绍如何配置Flink(VVR)类型的作业。背景信息 Flink企业版由Apache Flink创始团队官方出品,拥有全球统一商业化品牌。VVR提供...
说明 首次开通EMR Workflow服务时,将免费为您提供一个默认调度资源组。默认资源组开通时已自动关联至default工作空间。如果默认调度资源组不能满足您的需求,您也可以选择购买付费调度资源组。付费调度资源组的规格指标及计费规格详情,请...
说明 首次开通EMR Workflow服务时,将免费为您提供一个默认调度资源组。默认资源组开通时已自动关联至default工作空间。如果默认调度资源组不能满足您的需求,您也可以选择购买付费调度资源组。付费调度资源组的规格指标及计费规格详情,请...
EMR Workflow支持配置内置时间参数、任务级别参数(本地参数)、工作流级别参数(全局参数)和项目级别参数,同时还支持参数传递功能。参数配置 内置时间参数 参数定义 内置时间参数无需定义,可以直接在任务中使用。参数使用 EMR Workflow...
本文描述开源大数据平台E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权RAM身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。前置概念 阅读本文前,您可能需要了解如下概念:什么...
内置函数清单 Serverless Spark 兼容开源内置函数的使用,开源具体函数说明请参见 Spark SQL Functions。此外,Serverless Spark 还支持多个特有内置函数,以下是特有支持的内置函数及其相关说明。函数 说明 PARQUET_SCHEMA 获取Parquet...
Hadoop DistCp和Jindo DistCp的区别 DistCp类型 功能 使用场景 Hadoop DistCp 开源Hadoop内置的DistCp工具,用于大型集群间或集群内数据的复制。HDFS到HDFS间的数据复制。Jindo DistCp JindoFS的数据迁移工具,支持OSS、OSS-HDFS服务、兼容...
与开源Delta Lake对比 EMR-Delta Lake丰富了开源Delta Lake的特性,例如对SQL和Optimize的支持等。下表列出了Delta Lake的基本特性,并对比EMR-Delta Lake与开源Delta Lake(0.6.1)。特性 EMR-Delta 开源Delta SQL ALTER CONVERT CREATE ...
EMR on ECS 功能集 功能 功能描述 参考文档 集群管理 创建集群 您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行大规模数据处理和分析等操作。创建集群 释放集群 在完成EMR集群任务后及时释放集群,可以释放资源...
在使用阿里云E-MapReduce服务时,为了避免数据泄露、误操作等安全风险,有必要对项目内成员的权限进行合理的管控。本文将为您介绍E-MapReduce服务的权限管理体系。权限体系 类别 说明 权限主体 E-MapReduce支持的权限主体如下:用户:包含...
应用场景 E-MapReduce目前提供了三种大数据存储系统,E-MapReduce OssFileSystem、E-MapReduce HDFS和E-MapReduce JindoFS,其中OssFileSystem和JindoFS都是云上存储的解决方案,下表为这三种存储系统和开源OSS各自的特点。特点 开源OSS E-...
版本说明 MSE Nacos 版本 开源控制台默认状态 是否支持鉴权 描述 1.x及2.2.3.1之前的2.x版本 开启 不支持 默认开启开源控制台,且不支持鉴权,开源控制台的URL可被任何人访问,建议使用商业化控制台。若确实需要使用,建议 设置白名单 来...
EMR on ECS发布基于大模型构建的新版监控诊断功能 适用客户 全网用户 新增功能/规格 EMR on ECS新版监控诊断是基于大模型构建的智能运维辅助功能,结合了阿里云EMR团队在开源大数据领域的知识经验、阿里云EMR可观测能力和技术专家的诊断...
默认情况下,Spring Cloud SOFA 会自动配置该参数以便让应用接入商业版 SOFA 中间件,如果要使用非商业版中间件,需要手动修改此配置。重要 修改此配置将导致应用无法连接任何商业版 SOFA中间件,如 DRM、SOFAMQ 等,因此正常情况下请勿...
本文为您介绍开源大数据开发平台E-MapReduce(简称EMR)的产品生命周期策略及产品终止策略(包含产品粒度与发行版本粒度),以便您知晓详细规则,提早做好相应准备。背景信息 产品的更新换代是基础技术软件领域的常态。在开源大数据社区蓬勃...
在这种高安全级别的集群中,所有开源组件均采用Kerberos安全模式启动,确保只有经过Kerberos认证的客户端能够访问集群提供的服务(例如HDFS)。背景信息 集群开启Kerberos之后:客户端:可以对可信任的客户端提供认证,使得可信任客户端...
后续操作 创建完工作空间后,您可以在弹出的对话框中单击 管理项目成员,或者进入工作空间单击 设置,为该工作空间配置成员,方便RAM用户可以快速使用该工作空间,详情请参见 管理用户。创建笔记本前,您需要先绑定集群或添加数据库,详情...
为了优化用户的账单管理体验,EMR Serverless StarRocks现调整出账粒度,满足用户企业内部管理需求。变更概览 账单详情字段 优化前 优化后 实例ID(出账粒度)RegionID+Instance/nodeGroupID+Time ...按项目、部门等组织维度进行成本归集。
资源是您在阿里云创建的云服务实体,E-MapReduce支持资源组的云资源为集群和项目。在集群加入一个资源组时,集群每个节点ECS实例会同步加入集群所属资源组。资源组是项目、环境或者栈的基础设施集合,在资源组里管理资源能集中监控和执行...