阿里云EMR Serverless Spark SDK支持Java、TypeScript、Go、PHP、Python、C#、C++、Swift语言...使用EMR Serverless Spark SDK 阿里云SDK使用指南、请求结构等,请参见 通过IDE使用阿里云Java SDK。如何获取AccessKey,请参见 创建AccessKey。
在项目中您可以进行任务的编辑和工作流的调度。文为您介绍如何在EMR Workflow上创建项目。前提条件 已创建工作空间,详情请使用 管理工作空间。操作步骤 进入项目管理页面。...在左侧导航栏,选择 EMR Workbench Workflow。...
数据湖元数据DLF是阿里云提供的统一元数据服务,具有高可用、免运维和高性能等优点,兼容Hive Metastore,无缝对接EMR上开源计算引擎,并支持多版本管理和Data Profile功能。另外,DLF还支持数据探索、湖管理和数据权限控制等功能,并与...
在使用阿里云E-MapReduce服务时,为了避免数据泄露、误操作等安全风险,有必要对项目内成员的权限进行合理的管控。本文将为您介绍E-MapReduce服务的权限管理体系。权限体系 类别 说明 权限主体 E-MapReduce支持的权限主体如下:用户:包含...
兼容开源 EMR Notebook兼容开源Jupyter Notebook,您可以通过文件导入、导出的方式实现开发工具的自由切换,从而降低了使用门槛。产品功能 交互式编程环境 支持逐步执行SQL和Python代码,并根据运行结果调整后续代码。多种数据源类型 支持...
计费资源 2024年04月01日起阿里云E-MapReduce(简称EMR)on ACK正式商业化。阿里云EMR on ACK正式商业化后,将根据集群实际使用的POD资源规格和数量,计算每小时需支付的服务费,收费标准如下表所示。计费项 单价(元/小时)vCPU 0.03528 ...
通过阿里云账号登录 阿里云E-MapReduce控制台。在顶部菜单栏处,根据实际情况选择地域 和资源组。单击上方的 数据开发 页签。单击待编辑项目所在行的 作业编辑。新建Shell类型作业。在页面左侧,在需要操作的文件夹上单击右键,选择 新建...
访问Impala Web UI 您可以通过SSH隧道和控制台两种方式访问Impala Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI 和 访问链接与端口。说明 使用Knox访问UI的前提条件是,Master节点必须具备公网IP地址,并且只允许对Catalogd和...
DataFlow集群的Flink DataStream API完全兼容开源的Flink版本,关于Flink DataStream API的详细信息,请参见 Flink DataStream API Programming Guide。上下游存储(Connector)EMR-5.17.0&3.51.0及之后版本 开源Flink的上下游存储,详情请...
JindoCache(原JindoFSx)是阿里云EMR提供的用于加速云原生数据湖的一个服务。他提供了数据缓存和元数据缓存等加速功能,并根据不同的CacheSet提供不同的读写策略,以满足数据湖在不同使用场景下对访问加速的需求。背景信息 CacheSet是...
EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。产品文档 ...
本文为您介绍开源组件常用端口。服务 端口 描述 Hadoop 2.X 50070 HDFS Web UI的端口。配置参数为 dfs.namenode.http-address 或 dfs.http.address 。说明 dfs.http.address 已过期但仍能使用。50075 DataNode Web UI的端口。50010 ...
配置工作空间成员,以便RAM用户或者RAM角色能够快速使用该工作空间。...前提条件 已创建RAM用户或RAM角色,详情请参见 创建RAM用户 和 创建RAM角色。创建用户 进入安全中心页面。...在左侧导航栏,选择 EMR Workbench Workflow。...
通过阿里云账号登录 阿里云E-MapReduce控制台。在顶部菜单栏处,根据实际情况选择地域 和资源组。单击上方的 数据开发 页签。单击待编辑项目所在行的 作业编辑。新建Sqoop类型作业。在页面左侧,在需要操作的文件夹上单击右键,选择 新建...
当您在调度过程中需要使用第三方的JAR或者需要自定义脚本时,可以在文件管理页面进行相关操作。本文为您介绍如何创建文件和上传文件。...创建文件 进入资源中心页面。...在左侧导航栏,选择 EMR Workbench Workflow。在Workflow页面,单击目标...
通过审计日志功能,您能够追踪并查阅工作空间成员对项目、工作流、任务和文件等资源的操作记录。使用限制 仅工作空间的管理员可以查看审计日志。开启审计日志 审计日志默认关闭,如果您需要收集、查看指定工作空间的Workflow操作日志,则...
阿里云EMR集群提供多种作业提交方式,全面涵盖从开发调试(Master节点)到生产管控(Gateway节点)以及自动化调度(DataWorks)等各个场景,以满足不同角色的需求。本文将为您介绍三种方式的优缺点及其适用场景。提交方式说明 提交方式 优...
登录Ranger UI,详情请参见 通过控制台访问开源组件Web界面。选择 Settings Users/Groups/Roles。在 Users 页签中,您可以查看是否有新创建的Unix用户。例如,在步骤1中创建了test用户。场景二:集群已部署OpenLDAP 如果集群中已部署...
本文介绍EMR Serverless StarRocks产品中涉及的一些基本名词...EMR StarRocks Manager EMR StarRocks Manager是阿里云EMR团队针对Serverless StarRocks实例提供的数据管理控制台,提供对实例内数据的管理、诊断与分析、安全权限配置等能力。
本文为您介绍如何使用StarRocks的数据湖分析能力查询阿里云OSS。前提条件 已创建StarRocks集群,详情请参见 创建StarRocks集群。说明 此文档仅适用于EMR-5.12.0之前版本或EMR-3.46.0之前版本的StarRocks集群。已开通OSS服务,详情请参见 ...
阿里云自动化是一站式云资源与运维自动化管理服务,本文深度解析其核心概念、关键能力、应用场景与最佳实践,助您轻松构建稳定、高效、低成本的自动化运维体系。
通过Livy,您可以利用Airflow中的livy_operator以及spark_magic等开源项目,向Serverless Spark提交任务、查询任务状态并获取计算结果。Kyuubi提供了JDBC/ODBC接口,支持通过SQL查询或BI工具(如Tableau、Power BI)直接连接Serverless ...
除了通过EMR控制台提供的链接地址访问开源组件Web界面外,还可通过SSH隧道方式进行安全访问。通过SSH隧道和SOCKS代理,您可在不暴露集群内部网络结构的情况下访问开源组件Web界面。说明 开源组件Web界面访问方式选择,请参见 查看开源组件 ...
通过阅读本文,您可以快速了解EMR Serverless StarRocks的定价、计费项和计费方式等主要计费信息...退款说明 查看账单 如果您对阿里云EMR Serverless StarRocks服务的消费情况产生疑问,可以通过费用与成本查看费用账单以及消费明细。查看账单
通过阿里云账号登录 阿里云E-MapReduce控制台。在顶部菜单栏处,根据实际情况选择地域 和资源组。单击上方的 数据开发 页签。单击待编辑项目所在行的 作业编辑。新建Hive SQL类型作业。在页面左侧,在需要操作的文件夹上单击右键,选择 ...
阿里云E-MapReduce SDK包含阿里云Java SDK公共部分和E-MapReduce部分,公共部分依赖 aliyun-java-sdk-core,E-MapReduce部分依赖 aliyun-java-sdk-emr。我们推荐您采用Maven的方式来管理您的工程。Maven依赖 dependency groupId ...
Trino(即原PrestoSQL)是一个开源的分布式SQL查询引擎,适用于交互式分析查询。EMR-3.44.0和EMR-5.10.0版本开始改用社区正式名称Trino,之前各版本控制台显示为Presto,内核其实是Trino,使用时请注意区分。基本特性 Trino使用Java语言...
您需要在SSH连接中创建隧道以查看开源组件的Web页面,详情请参见 通过SSH隧道方式访问开源组件Web UI。默认用户名和密码均为admin,请您登录后及时修改密码。说明 首次登录后默认是英文界面。在Superset页面,单击右上角的 图标,选择 ...
通过阿里云账号登录 阿里云E-MapReduce控制台。在顶部菜单栏处,根据实际情况选择地域 和资源组。单击上方的 数据开发 页签。单击待编辑项目所在行的 作业编辑。新建Spark Shell类型作业。在页面左侧,在需要操作的文件夹上单击右键,选择 ...
说明 阿里云提供延期免停权益,即当按量付费的资源发生欠费后,提供一定额度或时长继续使用云服务的权益,延停期间正常计费。具体使用说明和规则,请参见 延期免停权益。欠费后第1天到第7天,实例处于锁定状态,无法被访问。实例锁定后第8...
为了避免这种割裂情况,阿里云EMR Serverless Spark提供了一个统一的环境,可同时支持ETL任务编写和低延迟的数据查询。该方案优势如下:一体化环境:EMR Serverless Spark不仅可以用于批作业的开发,还可满足数据的低延迟查询与分析。极速...
阿里云EMR部分旧版的API接口将于2024年6月15日下线。下线时间 2024年6月15日 下线内容 本次下线涉及的API版本如下:2016-01-10 2015-09-10 2015-08-10 影响说明 自2024年6月15日起,所有依赖上述旧版本API的调用将无法正常执行。为避免因...
集群中实例上的应用程序进程在调用其他阿里云服务时,将使用ECS应用角色进行权限验证。在创建集群时既可以使用默认ECS应用角色,也可以使用自定义的角色。注意事项 集群创建后,ECS应用角色不可更改。默认ECS应用角色 在创建集群时,如果...
前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...
背景信息 EMR Flink完全兼容开源Flink,相关内容请参见社区文档。例如:DataStream API Table API&SQ Python API 使用场景 Flink广泛应用于大数据实时化的场景,本文从技术领域和企业应用场景进行介绍。技术领域 从技术领域的角度,Flink...
前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...
前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...
前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...
前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...
前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...