当前大部分应用系统都基于开源软件构建,并且大部分的开源软件在倚天ARM平台上已经提供较好的应用生态,您可以直接使用操作系统提供的开源生态软件来安装部署。本文介绍Nginx、MySQL、Redis、TensorFlow、PyTorch等开源软件如何在倚天...
说明 首次创建EMR Studio集群时会弹出授权该角色的窗口,请使用阿里云账号对系统角色AliyunECSInstanceForEMRStudioRole进行授权。使用限制 EMR Studio集群仅支持绑定到同一个VPC内的EMR集群,不支持跨VPC。注意事项 截止2022年10月14日,...
对Hive数仓表进行高效小文件合并 对Hive数仓表进行高效小文件合并 2021-07-27 业务运行过程中(例如动态分区插入数据、reduce 操作频繁)会产生很多小文件,小文件太多会占用大量内存、严重影响集群性能。JindoTable提供表或分区级别的热度...
加密系统盘后,系统盘上的操作系统、程序文件及其他系统相关数据将会被加密。如果您的业务存在安全合规要求,则可以使用该功能。您无需自建和维护密钥管理基础设施,就能保护数据的隐私性和自主性,为业务数据提供安全边界。背景信息 系统...
应用场景 E-MapReduce目前提供了三种大数据存储系统,E-MapReduce OssFileSystem、E-MapReduce HDFS和E-MapReduce JindoFS,其中OssFileSystem和JindoFS都是云上存储的解决方案,下表为这三种存储系统和开源OSS各自的特点。特点 开源OSS E-...
ECS扩展程序集成 系统运维管理 OOS(CloudOps Orchestration Service)扩展程序功能,便于您在一台或多台ECS实例上快速批量安装各类软件扩展程序,如 Java、Python、MySQL、Docker、SVN、Grafana和日志服务等。该功能可提升软件安装卸载...
适用客户 全网用户 新增功能/规格 EMR on ECS 在创建集群时,或在创建后集群的弹性伸缩页面,支持配置托管弹性伸缩模式,只需指定集群Task节点的最大最小数量,系统将根据业务负载动态调整集群。产品文档 创建托管弹性伸缩策略
配置清单数据的聚合及筛选 扩展程序 安装/卸载扩展程序 在系统运维管理OOS中,支持用户根据自己的需求和特定应用场景开发自定义扩展程序,或者将其发布为公共扩展程序供其他人使用。在创建扩展程序后,用户在OOS中新建扩展程序任务,可针对...
内容管理系统 WordPress:广泛使用的开源博客和内容管理系统,常用于快速搭建网站和博客。应用栈/组合环境 LAMP:Linux、Apache、MySQL、PHP的组合环境,主要用于部署动态网站。LNMP:Linux、Nginx、MySQL、PHP的组合环境,类似于LAMP,但...
Alluxio为数据驱动型应用和存储系统构建了桥梁,将数据从存储层移动到距离数据驱动型应用更近的位置,从而能够更容易被访问,同时使得应用程序能够通过一个公共接口连接到许多存储系统。背景信息 在大数据生态系统中,Alluxio位于数据驱动...
开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...
EMR提供的组件包括开源和自研两大类,涵盖数据开发、计算引擎、数据服务、资源管理、数据存储、数据集成等领域,您可以按需选择和配置。说明 在创建集群时,如果没有您想使用的组件,或者想使用的开源组件仅对存量用户开放,您可以自行安装...
EMR Notebook提供了全托管的兼容开源Jupyter的Notebook服务,同时内置了SQL Editor的功能。支持SparkSQL、Hive、StarRocks、PySpark等应用程序的开发和运行。本文以Hive查询为例,为您介绍如何使用EMR Notebook。前提条件 已完成系统角色...
对比项 子项目 开源Clickhouse实时数仓 开源Hive离线数仓 阿里云Iceberg数据湖 系统架构 架构 计算存储一体 计算存储分离 计算存储分离 多计算引擎支持 不支持 支持 支持 数据存储在对象存储 不支持 支持不完善 支持 数据存储在HDFS 不支持...
本文描述开源大数据平台 E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
本文描述开源大数据平台 E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
本文描述开源大数据平台E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权RAM身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
同时,它100%兼容开源Spark生态,能够无缝集成到客户现有的数据平台。通过使用EMR Serverless Spark,企业可以更加专注于数据处理分析及模型训练的优化,从而提升工作效率。前置概念 阅读本文前,您可能需要了解如下概念:什么是云原生?...
功能变更 JindoFS存储优化 JindoFS缓存优化 JindoTable计算优化 JindoManager系统管理 JindoTools工具集 JindoFS生态支持 JindoFS存储优化 支持文件的checksum功能,对齐开源HDFS checksum相关接口,支持MD5MD5CRC和COMPOSITE_CRC两种算法...
说明 当选择了Kafka服务,系统将默认安装Kafka Manager软件服务,并开启Kafka Manager的认证功能。注意事项 使用Kafka Manager进行partition reassign功能时,当前版本的Kafka Manager是没有提供限流功能的。如果需要限流,您可以通过 ...
本文描述开源大数据平台 E-MapReduce支持的所有系统权限策略及其对应的权限描述,供您授权RAM身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问...
系统会根据指定的模板ID自动加载对应的配置参数,并将其作为Spark应用程序的默认参数。示例如下所示。spark-submit \-class org.apache.spark.examples.SparkPi \-master yarn \-conf spark.emr.serverless.templateId=template_id \/path/...
EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。本文以...
JindoSDK提供了丰富的API和功能,简化了在应用程序中集成和使用这些数据服务的过程。JindoSDK 查询版本 如:jindosdk-6.5.6-linux ls-l/opt/apps/JINDOSDK 版本说明 不同版本的功能可能存在差异,请选择适合的版本进行使用。详情请参见 ...
背景信息 随着StarRocks开源社区的持续发展,StarRocks通过发布新版本为您提供更多优势特性,例如更快的性能、更好的安全性以及更多的功能等。同时,StarRocks的旧版本也将会随着技术演进逐步停止使用。如果您继续使用较低版本的StarRocks...
Apache Celeborn是阿里云开源的中间数据服务,旨在提升大数据计算引擎的性能、稳定性和灵活性。Celeborn设计独立于具体引擎,支持Spark、Flink、MapReduce(MR)和 Tez,并且是目前最流行的Remote Shuffle Service的实现。Celeborn架构 ...
Hive语法 EMR产品最大程度的保持了开源社区的语法以及体验,在Hive语法上保持与开源社区Hive语法100%的兼容性。关于Apache Hive的更多介绍,请参见 Apache Hive官网。相关文档 如何使用Hive客户端连接Hive,请参见 Hive连接方式。Hive服务...
应用场景 JindoFS外部客户端实现了Hadoop文件系统的接口,在用户程序跟E-MapReduce JindoFS Namespace服务网络相通的情况下,用户可以通过JindoFS外部客户端去访问JindoFS上存储的数据,但外部客户端不能利用E-MapReduce JindoFS的数据缓存...
开源大数据平台E-MapReduce(Elastic MapReduce)是运行在阿里云平台上的一种大数据处理的系统解决方案。
E-MapReduce Doctor(简称EMR Doctor)是E-MapReduce产品自研的面向开源大数据集群的智能运维诊断系统。通过EMR Doctor(即 监控诊断 页面的“健康诊断”和“集群日报”功能)可以全局了解集群的健康状况和动态走势,为运维决策和资源优化...
为了更好地融入开源生态,提供更加开放和多样化的计算服务,阿里云E-MapReduce(简称EMR)从EMR-5.17.0和EMR-3.51.0版本开始,将Flink引擎版本从Flink企业版Ververica Runtime(简称VVR)调整为Flink社区开源版本,同时引入RocksDB作为存储...
listCacheSet 功能说明:列出当前系统里所有的CacheSet信息。命令:jindocache-listCacheSet refreshCacheSet 功能说明:更新CacheSet策略,之前设定的但是在新的策略文件中不存在的CacheSet将被删除。命令:jindocache-refreshCacheSet ...
使用限制 仅当小版本的最后三位版本号大于或等于1.6.0时,系统才支持修改时区。例如,当小版本为3.3.2-1.81-1.6.5时,最后三位版本号为1.6.5,系统支持修改时区。注意事项 在导入数据之前,必须确保StarRocks的全局时区与部署FE节点的时区...
中间件 Grafana 9.2.10 开源组件 中间件 keepalived 2.2.8 开源组件 中间件 Nginx 1.23.3 开源组件 中间件 openjdk 1.8.0.422 开源组件 中间件 openjdk 11.0.23.0.9 开源组件 中间件 openjdk 17.0.11.0.9 开源组件 中间件 tengine 2.4.0 ...
应用程序可以通过统一命名空间和接口来访问多个独立的存储系统,从而实现只连接JindoFSx就可与不同的底层存储系统进行通信。前提条件 已在E-MapReduce上创建EMR-3.42.0及后续版本、EMR-5.6.0及后续版本的集群,具体操作请参见 创建集群。...
trace:程序执行路径跟踪信息。logger.size 日志文件的大小。当文件达到该参数设置的值时,ClickHouse会将其存档并重命名,并创建一个新的日志文件。默认值为 1000M。logger.count 存档的ClickHouse日志文件个数。当存档的日志文件个数达到...
配置应用连接开源版 SOFA 注册中心 在应用启动参数中配置以下系统变量:Dcom.alipay.confreg.url=127.0.0.1-Dcom.alipay.env=normal-Dspring.cloud.sofa.ldc.zone=DEFAULT_ZONE 配置完成后启动应用,即可连接上开源版 SOFA 注册中心。开源...
适用客户 全网用户 新增功能/规格 托管弹性伸缩功能开启后,系统将持续监控集群YARN的负载,您只需要填写集群最大最小Task节点数,集群将自动按负载调整Task节点的数量,实现资源利用最大化。产品文档 添加托管弹性伸缩规则
Apache Hudi是一种数据湖的存储格式,在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。Hudi表类型 Hudi支持如下两种表类型:Copy On Write 使用Parquet格式存储数据。Copy On Write表的更新操作需要通过重写...
HDFS(Hadoop Distributed File System)是一种Hadoop分布式文件系统,具备高度容错特性,支持高吞吐量数据访问,可以在处理海量数据(TB或PB级别以上)的同时最大可能的降低成本。HDFS适用于大规模数据的分布式读写,特别是读多写少的场景...