如果您的按量付费集群承载了关键业务、存储了重要数据或配置,建议为该集群开启释放保护,以防止集群被意外释放,从而导致不可挽回的后果。开启释放保护后,您将无法直接释放集群。如需释放集群,需先关闭释放保护。使用限制 该功能仅适用...
使用IMB软件和MPI通信库测试E-HPC通信性能 IMB(Intel MPI Benchmarks)用于评估HPC集群在不同消息粒度下节点间点对点、全局通信的效率。MPI(Message Passing Interface)是支持多编程语言的并行计算通信库,具有高性能、大规模性、可移植...
Session集群是一个适用于Flink任务快速启停...失败 系统进行Session集群初始化失败,或Session集群运行中无法检测到Session集群健康状态,以及停用集群时无法正常停止集群上运行的作业时,将被视为失败。具体原因,您可以单击 查看具体详情。
Session集群是一个适用于Flink任务快速启停...失败 系统进行Session集群初始化失败,或Session集群运行中无法检测到Session集群健康状态,以及停用集群时无法正常停止集群上运行的作业时,将被视为失败。具体原因,您可以单击 查看具体详情。
策略,删除 PolarDB 集群时,系统会主动发起一次备份,为您保存删除前的所有数据。删除集群后,一级备份将自动转为二级备份,您可以在 集群回收站 中查看所有保存的备份,更多内容请参见 恢复已释放的集群。相关API API 描述 ...
安全防护场景 在分布式计算环境中,为防止系统被恶意攻击、数据泄露等问题,通常需要在分布式资源上部署网络安全的Agent来为系统提供安全保障,您可以使用 ACK Edge集群 完成安全Agent的统一部署和运维。分布式压测、拨测场景 在大规模的...
策略,删除 PolarDB 集群时,系统会主动发起一次备份,为您保存删除前的所有数据。删除集群后,一级备份将自动转为二级备份,您可以在 集群回收站 中查看所有保存的备份,更多内容请参见 恢复已释放的集群。相关API API 描述 ...
E-HPC所有用户数据、调度器信息、作业数据等信息都会存储在共享的文件系统中,供集群所有节点访问,以提高集群的共享存储能力。创建E-HPC集群时,您必须为集群挂载一个文件系统。如果您有更多的存储需求,可以为集群挂载新的存储资源,来...
创建集群后,系统会自动为该应用分配集群的Token Server。可选:单击 Token Client设置 区域 操作 列的 编辑,设置 Token请求超时时间,然后单击 确定。在某些场景下,集群流控Client与Token Server之间的网络通信时延较高,需要调整超时...
智能计算灵骏集群采用专为大规模AI计算场景所设计的系统架构和多层性能优化技术,能充分利用整体的计算、通信和内存能力。在并行度极高的大规模计算场景,比如自然语言处理、自动驾驶模型训练、推荐引擎等,相比普通GPU托管服务可以减少...
具体操作,请参见:专属块存储集群中云盘作为系统盘 专属块存储集群中云盘作为数据盘 专属块存储集群中云盘作为系统盘 当专属块存储集群中云盘作为ECS实例的系统盘时,您需要在创建ECS实例时启用专属块存储集群。访问 ECS控制台-实例。在...
选定总配置量级档位并创建集群后,系统会自动为该应用分配集群的Token Server。可选:单击 Token Client设置 区域 操作 列的 编辑,设置 Token请求超时时间,然后单击 确定。在某些场景下,集群流控Client与Token Server之间的网络通信时延...
LHC 默认会创建以下集群内的系统命名空间。default:在不指定命名空间时,默认使用 default。kube-public:用来部署公共插件、容器模板等。kube-system:部署系统组件。sigma-operator-machine-conditions:节点运维所需的系统命名空间。...
选定总配置量级档位并创建集群后,系统会自动为该应用分配集群的Token Server。可选:单击 Token Client设置 区域 操作 列的 编辑,设置 Token请求超时时间,然后单击 确定。在某些场景下,集群流控Client与Token Server之间的网络通信时延...
E-HPC集群的所有用户数据、调度器信息及作业数据均存储在共享文件系统中,供集群内所有节点访问,提升了存储的共享能力。在创建E-HPC集群时,您需挂载一个文件系统。如需更大存储能力,可额外挂载新的存储资源,以缓解单一文件系统在性能和...
操作项 描述 说明 集群融合 系统将源集群和目标集群合并为一个大集群,合并后,集群内的总节点数=源集群节点数+目标集群节点数。集群融合后,目标集群的Kibana将被临时关闭。在数据迁移期间,您仍可使用源集群的Kibana,直至业务切换完成。...
新建集群 创建账号 设置白名单 说明 新建 云数据库ClickHouse 集群时,系统会自动为 云数据库ClickHouse 集群添加一个名为 ali_dms_group 的白名单分组,并将DMS服务器的IP地址加入该分组中,若自动添加失败需手动添加。DMS服务器不同地域...
自动集群作业 自动集群在提交作业时指定需要的实例数和实例规格,实际运行任务的时候系统自动创建集群,运行任务完成后自动释放。不在乎等待时间长,或者作业较少情况下,可以使用自动集群。组合集群作业 您有很多自动集群的作业时...
为保障 云数据库ClickHouse 数据库的安全稳定,系统默认禁止所有IP地址访问 云数据库ClickHouse 集群。在开始使用 云数据库ClickHouse 集群前,您需要将客户端的IP地址或IP地址段添加到 云数据库ClickHouse 的白名单中。本文介绍如何设置白...
说明 如果您选择了 释放集群时会自动备份,并长期保留该集群的所有备份集 或 释放集群时会自动备份,长期保留该备份集 策略,释放 PolarDB 集群时,系统将会主动进行一次全量备份,为您保存删除前的所有数据。释放集群后,选择 释放集群时...
snapshot 't1','t1-snapshot' 步骤三:导出Snapshot到目标集群 场景1:源集群与目标集群的存储系统互通 如果源集群和目标集群的存储系统互通,则可以在源集群执行以下命令,直接导出Snapshot到目标集群。hbase org.apache.hadoop.hbase....
cloud_ssd Size long 集群管理节点系统盘的大小,单位是 GiB。40 Level string 集群管理节点 ESSD 系统盘的性能等级。PL0 ClusterCustomConfiguration object 集群后处理脚本。Script string 后处理脚本的下载地址。http://*Args string ...
对于当前业务运行在IDC或第三方公共云的Kubernetes集群中的系统架构,如果希望通过云计算为云下业务提供同城灾备的高可用冗余能力,可利用阿里云 分布式云容器平台 ACK One 来提供统一的流量、应用和集群管理,实现业务流量的多集群路由和...
创建E-MapReduce集群时,系统会自动为ECS节点绑定两个系统标签。通过登录 云服务器ECS控制台,在实例列表中将鼠标移动到对应ECS节点的标签图标上,可以查看该ECS节点属于哪个集群以及在集群中的角色。例如,某个ECS节点上的系统标签如下:...
为保障 云数据库ClickHouse 数据库的安全稳定,系统默认禁止所有IP地址访问 云数据库ClickHouse 集群。在开始使用 云数据库ClickHouse 集群前,您需要将客户端的IP地址或IP地址段添加到 云数据库ClickHouse 的白名单中。本文介绍如何设置白...
组件类型 容器服务ACK灵骏托管版集群管理的集群组件类型包括系统组件和可选组件:系统组件:创建ACK灵骏托管版集群时,默认安装的组件。可选组件:创建ACK灵骏托管版集群时,可选择性安装的组件,用于扩展集群功能。核心组件 组件名称 组件...
本文描述音视频通信支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制(RAM)产品...
通过配置集群维护窗口,可将集群自动升级、CVE修复等计划内变更操作安排在业务低谷期执行,以保障核心业务在高峰时段的稳定性,并最大限度地降低变更对业务的潜在影响。适用范围:ACK托管集群 集群维护窗口介绍 集群维护窗口是一个为ACK...
概念 说明 集群 集群是带有灵骏优化套件的高性能的异构加速计算节点的集合,集群中的各节点间通过800 Gbps高速低延迟RDMA网络进行互联通信。用户可以使用原生的物理集群服务,也可以在原生服务基础上结合阿里云提供的其他云产品一起使用...
为了避免在多集群跨VPC互联场景中出现IP冲突导致的路由错误等问题,新创建的集群需遵循以下网络规划要求:不能和各个VPC的网段重叠 不能和其他集群的网段重叠 不能和其他集群Pod的网段重叠 不能和其他集群服务的网段重叠 云上集群与IDC通信 ...
当您在多集群环境下遇到服务通信障碍时,可以使用DNS代理并解析跨越多个集群的服务请求,实现多集群服务发现,确保服务的平滑路由和快速访问,增强服务的可伸缩性和灵活性,降低系统的复杂度。前提条件 已添加两个ACK集群(本例中为m1c1和m...
对于安全Kafka集群,您需要执行下列操作(前两步与非安全Kafka集群相同):确保集群间能够通信(两个集群在一个安全组下,或两个集群在不同安全组,但两个安全组之间配置了访问规则)。将Kafka集群的hosts写入到E-MapReduce Druid集群每...
重要 为了避免在多集群跨VPC互联场景中出现IP冲突导致的路由错误等问题,新创建的集群需遵循以下网络规划要求:不能和各个VPC的网段重叠 不能和其他集群的网段重叠 不能和其他集群Service的网段重叠 云上集群与IDC通信 与 多集群跨VPC互联 ...
策略,删除 PolarDB 集群时,系统会主动发起1次备份,为您保存删除前的所有数据。删除集群后,一级备份将自动转为二级备份,您可以在 集群回收站 中查看所有保存的备份,更多内容请参见 恢复已释放的集群。如果是跨地域备份,当选择 删除...
ACK集群支持集群升级检查、集群迁移检查、组件检查和节点池检查。您可以在集群升级、迁移等操作前执行集群检查,确认集群是否符合要求,并获取异常检查项对应的修复方案。集群检查项 集群升级检查 由于Kubernetes的复杂性,集群升级存在较...
混合云代理模式集群的管理节点为已有集群的管理节点,计算节点由已有集群计算节点和云上新增计算节点组成。已有集群可以是线下集群,也可以是云上集群。本文介绍混合云代理模式集群(SGE调度器)的部署方案。背景信息 在HPC生命科学领域,...
在ACK集群上部署3FS 阿里云基于开源3FS文件系统进行了轻量级技术适配,将其封装为标准化容器镜像并提供开箱即用的Helm Chart,实现Kubernetes环境下的自动化部署。相关定制化代码、部署清单及持续集成配置已全面开源并托管于GitHub仓库,...
ACK托管集群 涉及的计费项如下:集群管理费用 在集群维度,根据集群类型收取集群管理费用(仅 ACK托管集群Pro版 收取)。默认情况下,集群管理费用按照集群个数和使用时长,采用按量付费的方式,您也可以购买资源包来抵扣集群管理费用。...
如果自定义镜像内的/etc/fstab 文件中,存在文件系统(如nfs)的挂载信息,那么需要确保扩容或创建的集群能够访问该文件系统,例如集群与文件系统在同一VPC内。否则,您需要删除/etc/fstab 文件中挂载文件系统的相关内容,再进行扩容或创建...
NAT网关 NAT网关用于为集群提供公网通信能力。费用包括实例费用和LCU费用,其中CU费用会按照您使用的实际流量收费,具体计费规则请参见 公网NAT网关计费。说明 您可以使用 NAT CU估算器 来预估CU的消耗。弹性公网IP(EIP)EIP可以为绑定的...