高效更新 StarRocks支持明细模型、聚合模型、主键模型和更新模型,其中主键模型可以按照主键进行Upsert或Delete操作,通过存储和索引的优化可以在并发更新的同时实现高效的查询优化,更好的服务实时数仓的场景。智能物化视图 StarRocks支持...
EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 TrinoMaster 操作列的 enableLDAP。在弹出...
本文为您介绍E-MapReduce(简称EMR)中Kafka集群操作系统环境变量和配置项。操作系统环境变量 EMR Kafka集群的ECS实例操作系统用户为kafka,用户组为group,您可以登录ECS实例执行各类操作。EMR Kafka预置了以下Shell终端环境变量。变量名 ...
加密系统盘后,系统盘上的操作系统、程序文件及其他系统相关数据将会被加密。如果您的业务存在安全合规要求,则可以使用该功能。您无需自建和维护密钥管理基础设施,就能保护数据的隐私性和自主性,为业务数据提供安全边界。背景信息 系统...
目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...
稳定可靠的开源组件 100%采用社区开源组件,随开源版本升级迭代,详情请参见 发行版本。适配开源组件,避免开源组件之间的版本兼容性问题。基于开源组件,优化和增强阿里云部署环境,性能远高于开源版本。易用性 分钟级搭建大数据计算环境...
在SIMPLE认证方式下,客户端访问Alluxio服务时,会从操作系统获取当前的登录用户,一起发送请求到服务端,供服务端进行身份标识。如果客户端设置了 alluxio.security.login.username 参数,客户端将使用对应的配置作为请求服务端的用户。...
本文介绍Presto的基本特性、系统组成和优势等信息。注意事项 EMR-3.45.0和EMR-5.11.0版本开始支持Presto,其版本号通常为0.2XX。此前各版本中的组件版本号为3XX的Presto,其内核均为PrestoSQL或Trino,相关信息请参见 Trino。基本特性 ...
EMR Serverless StarRocks兼容开源StarRocks的SQL语法和函数,您可以参考以下文档进行开发设计。StarRocks版本 参考文档 3.3系列 SQL参考 函数参考 3.2系列 SQL参考 函数参考 2.5系列 SQL参考 函数参考
本文汇总了Zeppelin使用时的常见问题。EMR Studio上的Zeppelin与开源版本一致吗?如何设置Zeppelin Note的权限?Zeppelin执行时无法正常启动Interpreter EMR Studio上的Zeppelin与开源版本一致吗?EMR Studio上的Zeppelin是增强版的...
应用场景 E-MapReduce目前提供了三种大数据存储系统,E-MapReduce OssFileSystem、E-MapReduce HDFS和E-MapReduce JindoFS,其中OssFileSystem和JindoFS都是云上存储的解决方案,下表为这三种存储系统和开源OSS各自的特点。特点 开源OSS E-...
通过Kyuubi Gateway,以兼容开源Kyuubi的方式提交SQL任务。数据目录 支持使用RAM用户(子账号)身份访问DLF。支持访问DLF 2.0 Hive Catalog。资源观测 支持观测工作空间、队列的资源消耗情况。运行环境 Spark Submit工具支持通过配置参数-...
您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。前置概念 阅读本文前,您可能需要了解如下概念:什么...
我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可通过签名机制进行自签名对接。由于自签名细节非常复杂,需花费 5个工作日左右。因此建议加入...
HiveMetaStore问题 常见异常:org.apache.hadoop.hive.ql.metadata.HiveException:MetaException(message:Could not connect to meta store using any of the URIs provided 问题原因1:可能是HiveMetastore中断或者HiveMetastore压力过大...
申请免费试用 您可以通过 阿里云免费试用页面,申请免费试用EMR Serverless StarRocks,试用详细操作可参见 试用教程。常见问题 试用的实例释放后,能否继续申请免费试用?不可以。因为免费试用活动仅针对新用户。如果您释放了试用产品实例...
内置函数清单 Serverless Spark 兼容开源内置函数的使用,开源具体函数说明请参见 Spark SQL Functions。此外,Serverless Spark 还支持多个特有内置函数,以下是特有支持的内置函数及其相关说明。函数 说明 PARQUET_SCHEMA 获取Parquet...
而Delta简化了工作流程,整条数据处理过程是一条完整的、可靠的实时流,其数据的清洗、转换、特征化等操作都是流上的节点动作,无需对历史和实时数据分别处理。与开源Delta Lake对比 EMR-Delta Lake丰富了开源Delta Lake的特性,例如对SQL...
本文为您介绍如何通过EMR Workflow的可视化操作界面来管理工作流和任务。前提条件 已完成系统角色授权,详情请参见 EMR Workflow角色授权。已在EMR on ECS页面创建集群或集群模板,详情请参见 创建集群 或 创建集群模板。支持绑定的集群...
版本说明 MSE Nacos 版本 开源控制台默认状态 是否支持鉴权 描述 1.x及2.2.3.1之前的2.x版本 开启 不支持 默认开启开源控制台,且不支持鉴权,开源控制台的URL可被任何人访问,建议使用商业化控制台。若确实需要使用,建议 设置白名单 来...
对比项 子项目 开源Clickhouse实时数仓 开源Hive离线数仓 阿里云Iceberg数据湖 系统架构 架构 计算存储一体 计算存储分离 计算存储分离 多计算引擎支持 不支持 支持 支持 数据存储在对象存储 不支持 支持不完善 支持 数据存储在HDFS 不支持...
Apache Flume是一个分布式、可靠和高可用的系统,可以从大量不同的数据源有效地收集、聚合和移动日志数据,从而集中式的存储数据。使用场景 Flume使用最多的场景是日志收集,也可以通过定制Source来传输其他不同类型的数据。Flume最终会将...
本文以SHELL任务类型为例,带您快速体验EMR Workflow中创建、运行以及关联手动任务等操作。前提条件 已完成系统角色授权,详情请参见 EMR Workflow角色授权。已在EMR on ECS页面创建集群或集群模板,详情请参见 创建集群 或 创建集群模板。...
操作(Action)下表是 开源大数据平台 E-MapReduce 定义的操作,这些操作可以在 RAM 权限策略语句的 Action 元素中使用,用来授予执行该操作的权限。下面对表中的具体项提供说明:操作:是指具体的权限点。API:是指操作对应的 API 接口。...
操作(Action)下表是 开源大数据平台 E-MapReduce 定义的操作,这些操作可以在 RAM 权限策略语句的 Action 元素中使用,用来授予执行该操作的权限。下面对表中的具体项提供说明:操作:是指具体的权限点。API:是指操作对应的 API 接口。...
操作(Action)下表是 开源大数据平台 E-MapReduce 定义的操作,这些操作可以在 RAM 权限策略语句的 Action 元素中使用,用来授予执行该操作的权限。下面对表中的具体项提供说明:操作:是指具体的权限点。API:是指操作对应的 API 接口。...
Apache Ranger提供集中式的权限管理框架,可以对Hadoop生态中的HDFS、Hive和YARN等组件进行细粒度的权限访问控制,并且提供了Web UI方便管理员操作。Ranger组件介绍 Ranger主要由三个组件组成:Ranger Admin 您可以创建和更新安全访问策略...
常见问题 Q:系统返回“Malformed database URL,failed to parse the main URL sections”报错应该如何处理?A:该报错通常是由于 jdbc_uri 中传入的URI有误而引起的。请检查并确保传入的URI准确无误。参见本文 PROPERTIES 相关的参数...
EMR用户可以用于访问链接与端口,查看开源组件Web UI时的用户身份认证,也可以在开启组件LDAP认证之后进行身份认证。如果将Ranger的用户源设置为LDAP,则可以对用户管理中的用户进行权限控制。如果是高安全集群,EMR用户可以用于Kinit操作...
功能变更 JindoFS存储优化 JindoFS缓存优化 JindoTable计算优化 JindoManager系统管理 JindoTools工具集 JindoFS生态支持 JindoFS存储优化 支持文件的checksum功能,对齐开源HDFS checksum相关接口,支持MD5MD5CRC和COMPOSITE_CRC两种算法...
开源大数据平台E-MapReduce(Elastic MapReduce)是运行在阿里云平台上的一种大数据处理的系统解决方案。
通过审计日志功能,您能够追踪并查阅工作空间成员对项目、工作流、任务和文件等资源的操作记录。使用限制 仅工作空间的管理员可以查看审计日志。开启审计日志 审计日志默认关闭,如果您需要收集、查看指定工作空间的Workflow操作日志,则...
JindoSDK:为EMR各种开源计算引擎提供统一的SDK,支持Java、C、C++和Python语言,提供多种访问和API接口,包括HCFS文件系统接口、POSIX接口和Table表格接口。工具集:提供相关的工具集,例如Jindo tool和迁移工具Jindo DistCp。各种...
常见问题 Q:Knox组件异常停止,启动Knox的时候报错 Failed to start gateway:org.apache.hadoop.gateway.services.ServiceLifecycleException:Gateway SSL Certificate is Expired,具体信息如下图所示。A:您可以按照以下步骤处理。使用...
本章节提供基础工具的操作指南,帮助用户高效完成数据存储、管理和运维相关任务。在Notebook中使用Hadoop命令操作OSS/OSS-HDFS
优化OSS Rename操作性能,结合OSS服务端提升Rename操作的执行时间。优化OSS多版本下的List操作性能,避免Bucket多版本下大量临时文件影响目录的List性能。优化OSS多版本JindoMagicCommitter性能,新增JindoDirectCommitter。增强...
时区介绍 StarRocks时区默认值为 Asia/Shanghai,具体包含以下:system_time_zone:操作系统时区。部署FE节点的时区,仅支持通过控制台切换时区。time_zone:会话或全局时区。您可以使用SQL语句修改。切换系统时区 重要 切换系统时区将会...
在Workflow页面,单击目标工作空间操作列的 控制台。单击上方的 安全中心 页签。在左侧导航栏,单击 用户管理。在 用户管理 页面,单击 创建用户。在弹出的对话框中,选择 RAM账号类型、设置 用户名称、在 用户角色 下拉列表中为用户选择...
JindoFS缓存优化 优化在AI训练场景下小文件元数据的缓存,提升元数据预加载操作和List操作的性能。JindoTable计算优化 JindoTable集成了AliORC,提供Native ORC Reader。JindoTable支持Spark和Presto使用Native ORC Reader读取ORC文件,以...
E-MapReduce支持在控制台对各服务参数新增、修改、删除配置项等操作进行配置回滚。本文为您介绍如何通过E-MapReduce控制台回滚参数配置。前提条件 已对服务配置进行实际的操作变更。操作步骤 进入集群服务页面。登录 E-MapReduce控制台。在...