通过kubectl命令创建 您也可通过编排模板来手动创建HPA,并将其绑定到要伸缩的Deployment对象上,通过 kubectl 命令实现容器自动伸缩配置。下面针对一个Nginx应用进行举例。创建并复制以下内容到 nginx.yaml 中。Deployment的编排模板如下...
伸缩规则 执行伸缩规则 ExecuteScalingRule 执行伸缩规则后,您可以实现手动或自动伸缩实例资源。定时任务 停用定时任务 无 如果您需要继续使用一个已停用的定时任务,可以重新启用定时任务,在指定的时间范围内继续使用。如果您暂时不需要...
auto_scaling object 自动伸缩节点池配置。enable boolean 是否启用自动伸缩。true:开启节点池自动伸缩功能。false:不开启自动伸缩,当取值为 false 时,auto_scaling 内的其他配置参数将不生效。默认值:false。true max_instances long...
auto_scaling object 自动伸缩节点池配置。enable boolean 是否启用自动伸缩。true:开启节点池自动伸缩功能。false:不开启自动伸缩,当取值为 false 时,auto_scaling 内的其他配置参数将不生效。默认值:false。true max_instances long...
auto_scaling object 自动伸缩节点池配置。enable boolean 是否启用自动伸缩。true:开启节点池自动伸缩功能。false:不开启自动伸缩,当取值为 false 时,auto_scaling 内的其他配置参数将不生效。默认值:false。true max_instances long...
它还提供了一些核心功能,例如负载均衡、自动伸缩、故障恢复等,以确保模型服务的高可用性和可靠性。模型可以根据实际的推理请求负载进行自动缩放和负载均衡,从而实现高效的模型推理。模型服务网格还提供了一些高级功能,例如流量分割、A/...
在进行诸如问题排查、程序调试或压力测试等操作时,您可以临时暂停某些伸缩组流程,以避免在此期间因自动伸缩而对这些操作造成干扰。在执行完这些操作之后,可以恢复被暂停的流程使伸缩组恢复正常的工作。本文介绍暂停或恢复伸缩组流程后的...
ACK集群也提供ACK autoscaler组件实现自动伸缩功能,根据集群中工作负载的实际需要自动调整节点数量。Ray autoscaler与ACK autoscaler弹性功能的结合能更充分地发挥云的弹性能力,提高计算资源供给效率和性价比。前提条件 已 基于ACK创建...
自动伸缩功能升级:感知作业CPU/MEM 资源需求,按负载自动创建和释放计算节点,提供成本和供应优先的伸缩策略。内建可观测性:内建可观测的性能和业务指标,包括集群运行监控、作业异常分析、一键告警通知和资源使用报告。监控集群运行状况...
容器水平伸缩(Horizontal Pod Autoscaler,简称 HPA)是 Kubernetes 中实现 Pod 水平自动伸缩的功能。对于 Kubernetes 中的 Pod 而言,HPA 可以实现很多自动化功能,比如当 Pod 中工作负载上升时,会基于设定的扩容规则,动态调整副本数,...
问题描述 在Kubernetes集群配置自动伸缩组件失败。cluster-autoscaler Pod一直处于失败重启的状态,无法正常运行。查看该Pod日志,确认包含如下类似错误信息。问题原因 配置RAM Role角色和权限出错,包含如下几种可能:对应的ECS的RAM Role...
ALIYUN:EHPC:AutoScaleConfig类型用于设置指定集群的自动伸缩配置信息。语法 {"Type":"ALIYUN:EHPC:AutoScaleConfig","Properties":{"ExtraNodesGrowRatio":Integer,"EnableAutoGrow":Boolean,"ClusterId":String,"ShrinkIdleTimes":...
同时还可以设置自动伸缩的机制,实现根据业务负载按需扩展。如何将单体架构演进为弹性高可用架构?如图所示,将左侧单体架构演进为弹性高可用架构需要经历两个阶段。阶段一:分离数据存储与业务逻辑 由于弹性高可用架构是以ECS实例为单元...
AutoScaling Map 否 否 自动伸缩配置。更多信息,请参见 AutoScaling语法 和 AutoScaling属性。Count Integer 否 是 节点池节点数量。无 KubernetesConfig Map 否 是 集群相关配置。更多信息,请参见 KubernetesConfig语法 和 ...
流程介绍 说明 创建伸缩组时,如果您选择 启动模板 或者 选择已有实例 作为组内实例配置信息来源,会自动创建并生效对应的伸缩配置,即您无需手动创建伸缩配置,就可以直接启用伸缩组。创建伸缩组 伸缩组是具有相同应用场景、相同实例类型...
通过kubectl命令创建HPA应用 您也可以通过编排模板来手动创建HPA,并将其绑定到要伸缩的Deployment对象上,通过kubectl命令实现容器自动伸缩配置。推荐您为一个工作负载仅创建一个HPA。下文以部署支持HPA的Nginx应用为例。创建并复制以下...
支持配置节点自动伸缩方案,当集群的容量规划无法满足应用Pod调度时,自动扩缩节点资源。手动扩缩容节点池 配置自动弹性伸缩 移除节点 如果不再需要某些节点,可将节点从集群或节点池中移除。请按标准化操作移除,避免出现预期外行为。移除...
开启自动伸缩的抢占式实例节点池 如果工作负载不仅可部署在抢占式实例节点池,还具有较明显的业务高低峰窗口期,建议您使用开启自动伸缩的抢占式实例节点池。开启自动伸缩后,集群节点自动伸缩组件会检查是否需要扩容抢占式实例节点池来...
不同的应用部署方式需要使用不同的伸缩方案,常见的伸缩方案主要有以下几种:云服务自动扩缩 在阿里云上进行自动伸缩依赖的云服务是 弹性伸缩 ESS(Auto Scaling),是指根据业务需求和策略自动调整计算能力(即实例数量)的服务。...
enable boolean 否 是否启用自动伸缩,取值:true:开启节点池自动伸缩功能。当集群的容量规划无法满足应用 Pod 调度时,ACK 会根据配置的最小和最大实例数自动扩缩节点资源。1.24 及以上版本的集群默认启用节点即时弹性;1.24 以下版本的...
enable boolean 否 是否启用自动伸缩,取值:true:开启节点池自动伸缩功能。当集群的容量规划无法满足应用 Pod 调度时,ACK 会根据配置的最小和最大实例数自动扩缩节点资源。1.24 及以上版本的集群默认启用节点即时弹性;1.24 以下版本的...
enable boolean 否 是否启用自动伸缩,取值:true:开启节点池自动伸缩功能。当集群的容量规划无法满足应用 Pod 调度时,ACK 会根据配置的最小和最大实例数自动扩缩节点资源。1.24 及以上版本的集群默认启用节点即时弹性;1.24 以下版本的...
同时还支持设置自动伸缩的机制,实现根据业务负载 按需扩展。搭建流程 规划集群网络。创建专有网络(VPC)和多个可用区的交换机,以搭建集群的基础网络环境。创建对象存储Bucket。该Bucket用于存储模型权重文件。配置实例RAM角色。后续ECI...
通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。准备工作 已 创建ACK托管集群Pro版。已在集群维度 步骤一:为集群开启功能。步骤一:创建GPU...
通过此功能,您可以实现更细粒度的控制和管理,例如在实例被自动伸缩活动影响前后执行验证、配置或数据备份任务,从而增强应用部署的灵活性和可靠性。接口说明 一个伸缩组最多可以创建6个生命周期挂钩。创建了生命周期挂钩的伸缩组,在发生...
通过此功能,您可以实现更细粒度的控制和管理,例如在实例被自动伸缩活动影响前后执行验证、配置或数据备份任务,从而增强应用部署的灵活性和可靠性。接口说明 一个伸缩组最多可以创建 10 个生命周期挂钩。创建了生命周期挂钩的伸缩组,在...
例如,弹性伸缩自动创建的ECS实例在ECS管理控制台也可以看到,如果您在ECS管理控制台将弹性伸缩自动创建的ECS实例删除,则该ECS实例在弹性伸缩管理控制台会被自动移出伸缩组。该类实例服务被中断后,弹性伸缩服务的处理方法如下表所示。...
切换到 自动伸缩 页签,在 定时扩缩容 区域,单击 开启定时扩缩容。在 定时自动扩缩容设置 对话框,配置以下参数,您也可以单击 添加 来配置多个定时自动扩缩容任务。参数配置完成后单击 确定。参数 描述 任务名称 定时自动扩缩容任务名称...
资源层弹性 节点自动伸缩 ACK的自动伸缩能力是通过节点自动伸缩组件实现的,可以按需弹出普通实例、GPU实例、竞价付费实例,支持多可用区、多实例规格、多种伸缩模式,满足不同的节点伸缩场景。全场景支持,适合在线业务、深度学习、大规模...
应用伸缩 ACS支持手动伸缩、HPA自动伸缩策略、CronHPA自动伸缩策略 和 AHPA弹性预测伸缩策略。存储管理 ACS基于Kubernetes容器存储接口(CSI),融合阿里云存储服务云盘EBS和文件存储NAS,提供 存储服务。网络管理 ACS集成Kubernetes网络、...
说明 RDS PostgreSQL Serverless实例 计算资源的单位是RCU(RDS Capacity Unit),1个RCU的性能约为1核(最大)2 GB,实例计算资源会在您指定的RCU范围内自动伸缩。RDS PostgreSQL Serverless 实例的最大连接数固定为2400,不支持调整,也...
本文介绍使用 节点即时弹性 功能时可能遇到的常见问题及解决方案。索引 分类 二级分类 跳转链接 节点...手动重启kube-system命名空间下的Deployment cluster-autoscaler(节点自动伸缩)或ack-goatscaler(节点即时弹性),以便权限立即生效。
本文介绍使用 节点即时弹性 功能时可能遇到的常见问题及解决方案。索引 分类 二级分类 跳转链接 节点...手动重启kube-system命名空间下的Deployment cluster-autoscaler(节点自动伸缩)或ack-goatscaler(节点即时弹性),以便权限立即生效。
QPS threshold float 触发自动伸缩阈值。指标名称配置为 QPS:当单实例的平均 QPS 大于该值时会触发扩容。指标名称配置为 CPU:当单实例的平均 CPU 使用率大于该值时会触发扩容。10 service string 指标所属服务,不配置默认为当前服务。...
说明 除控制台外,ACK还支持通过API和Terraform方式创建节点池,请参见 CreateClusterNodePool-创建节点池、通过Terraform创建具备自动伸缩功能的节点池。在 节点池 页面,单击 创建节点池,然后在 创建节点池 对话框,完成创建节点池的...
rise RatioThreshold float 否 会话占用率阈值,用作多会话云电脑池的自动伸缩触发条件。会话占用率的计算公式为:会话占用率=已绑定会话数/(云电脑资源总数×每台云电脑支持的最大会话数)×100%当会话占用率达到该阈值时,则会新建云电脑...
qps threshold float 是 触发自动伸缩阈值。指标名称配置为 qps:当单实例的平均 QPS 大于该值时会触发扩容。指标名称配置为 cpu:当单实例的平均 CPU 使用率大于该值时会触发扩容。100 service string 否 指标所属服务,不配置默认为当前...
Autoscaler 节点自动伸缩 安全 KMS provider plugin for Alibaba Cloud 基于阿里云KMS服务的密钥管理能力,实现Kubernetes Secret的落盘加密能力。Ack-KMS-Plugin 使用阿里云KMS进行Secret的落盘加密 Kube2ram 以DaemonSet的形式实现对ECS...
自动伸缩 采用动态资源调整策略,根据实时业务负载自动弹性伸缩,企业无需预先估算并配置业务的固定服务资源量。例如,客户在选择 4 至 8 个 OCU 的区间时,OceanBase 数据库能够依据实际业务负载的变化,策略性地调整 OCU 资源,最高可...
qps threshold float 是 触发自动伸缩阈值。指标名称配置为 qps:当单实例的平均 qps 大于该值时会触发扩容。指标名称配置为 cpu:当单实例的平均 cpu 使用率大于该值时会触发扩容。指标名称配置为 gpu[util]:当单实例的平均 gpu 使用率...