租gpu-租gpu文档介绍内容-移动阿里云

安装并使用DeepGPU-LLM

在GPU云服务器环境下安装DeepGPU-LLM 部分云市场镜像中已预装了DeepGPU-LLM工具，在创建GPU实例时，您可以一键获取预装DeepGPU-LLM的镜像来自动安装DeepGPU-LLM；也可以先购买GPU实例，然后手动安装DeepGPU-LLM。自动方式（选择云市场镜像...

实例规格分类与命名

作为阿里云弹性计算家族的一员，其结合了GPU计算力与CPU计算力，满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求，例如，在并行运算方面，使用GPU云服务器可显著提高计算效率。异构服务型：异构服务型实例video-trans适用于...

配置共享GPU调度节点选卡策略

配置项说明实例规格架构选择 GPU云服务器，选择多个GPU实例规格。由于只有在节点有多张GPU卡的情况下，节点选卡策略才能看出效果，建议选择带有多张GPU卡机型。期望节点数设置节点池初始节点数量。如无需创建节点，可以填写为0。节点...

管理共享GPU调度组件

已创建ACK托管集群，且指定实例规格的架构为 GPU云服务器。使用限制请勿将共享GPU调度的节点的CPU Policy设置为 static。若您需要自定义KubeConfig文件路径，由于 kubectl inspect cgpu 命令不支持-kubeconfig 参数，请使用 export ...

在GPU实例上基于ChatGLM-6B语言模型搭建AI对话机器人

本文介绍如何使用阿里云GPU云服务器，基于ChatGLM-6B语言模型快速搭建AI对话机器人。背景信息 ChatGLM是一个开源的预训练语言模型，由清华大学和智谱AI联合开发。它采用了GLM（General Language Model）架构，这是一种基于Transformer的...

超级计算集群概述

SCC与阿里云ECS、GPU云服务器等计算类产品一起，为阿里云弹性高性能计算平台E-HPC 提供了极高性能的并行计算资源，实现真正的云上超算。高性能计算优化型包含以下规格族：通用型超级计算集群实例规格族sccg7 计算型超级计算集群实例规格族...

通过ack-co-scheduler使用共享GPU调度

chmod+x/usr/local/bin/kubectl-inspect-cgpu 步骤三：创建GPU节点创建GPU云服务器，并安装驱动和nvidia-container-runtime。具体操作，请参见创建和管理节点池。说明如果您添加节点池时已经创建GPU节点并配置好环境，可以跳过此步骤。...

实例简介

通用X86裸金属规格本地盘 VPC网络预付费需要直接访问物理资源兼容第三方Hypervisor 高网络包收发场景异构计算异构计算主要包括GPU云服务器，通过专用硬件去服务特定业务场景，提供比普通云服务器高出一个甚至更多数量级的性价比和...

配置共享GPU调度仅共享不隔离策略

配置项说明实例规格架构选择 GPU云服务器，选择多个GPU实例规格。本文以使用GPU卡V100为例进行说明。期望节点数设置节点池初始节点数量。如无需创建节点，可以填写为0。节点标签单击，添加如下记录：键为 ack.node.gpu.schedule，值...

面向GPU基础设施运维的最佳实践

部署架构：该方案可灵活部署于阿里云GPU云服务器（ECS）或容器服务（ACK）之上，通过VPC、安全组等云原生基础设施保障环境的安全与隔离，让用户能快速搭建并使用这一强大的性能分析能力。四、结论在AI技术成为核心竞争力的背景下，GPU基础...

部署并运行GPU工作负载

架构：GPU云服务器。实例规格：根据业务需求选择合适的实例规格族，如ecs.gn7i-c8g1.2xlarge(NVIDIA A10)。为提高扩容成功率，建议选择多个实例规格。污点（Taints）为防止非GPU工作负载被调度到价格较高的GPU节点，建议通过污点实现逻辑...

使用EAIS实例部署ChatGLM2-6B

更多GPU实例信息，请参见什么是GPU云服务器。节省部署成本：在您使用ECS实例（非GPU实例）完成环境搭建之前，您无需创建EAIS实例，此时，仅有ECS实例（非GPU实例）在计费。如果您直接购买GPU实例然后在GPU实例上部署环境，将花费更多的...

使用EAIS提供的镜像快速部署Stable-Diffusion

更多GPU实例信息，请参见什么是GPU云服务器。节省部署成本：在您使用ECS实例（非GPU实例）完成环境搭建之前，您无需创建EAIS实例，此时，仅有ECS实例（非GPU实例）在计费。如果您直接购买GPU实例然后在GPU实例上部署环境，将花费更多的...

（推荐）使用EAIS提供的镜像快速部署ChatGLM-6B

更多GPU实例信息，请参见什么是GPU云服务器。节省部署成本：在您使用ECS实例（非GPU实例）完成环境搭建之前，您无需创建EAIS实例，此时，仅有ECS实例（非GPU实例）在计费。如果您直接购买GPU实例然后在GPU实例上部署环境，将花费更多的...

DeepGPU-LLM API接口说明及示例

DeepGPU-LLM作为阿里云开发的一套推理引擎，旨在优化大语言模型在GPU云服务器上的推理过程，为您提供免费的高性能、低延迟推理服务。DeepGPU-LLM提供了一系列的API接口（例如模型加载、模型推理等功能），在GPU云服务器上成功安装DeepGPU-...

基于计算巢一键部署Qwen3系列模型

本示例部署费用包含：所选GPU云服务器的实例规格块存储公网带宽您可以根据实际需求选择按量付费或者包年包月计费。详细计费规则及价格，请参见计费项、计费方式。RAM账号所需权限部署服务实例时需要对部分阿里云资源进行访问和创建...

基于库存感知的跨地域多集群弹性调度

关于GPU实例规格和计费的详情，请参见 GPU计算型实例规格族和 GPU云服务器计费。准备工作本步骤将准备qwen3-8b推理服务的模型文件并分别在子集群中创建对应的OSS存储卷。下载模型。说明请确认是否已安装git-lfs插件，如未安装可执行 yum...

基于库存感知的跨地域多集群弹性调度

关于GPU实例规格和计费的详情，请参见 GPU计算型实例规格族和 GPU云服务器计费。准备工作本步骤将准备qwen3-8b推理服务的模型文件并分别在子集群中创建对应的OSS存储卷。下载模型。说明请确认是否已安装git-lfs插件，如未安装可执行 yum...

客户案例

《云速搭部署 EIP 实现共享带宽/流量包管理》《云速搭 – NAT 网关部署及应用最佳实践》《云速搭部署 GPU 云服务器》云上会展有限公司立足于打造线上会展数字基础设施，充分发挥阿里巴巴集团在人工智能、数据技术、云计算等方面的积累，...

使用EAIS软件包手动部署ChatGLM-6B

更多GPU实例信息，请参见什么是GPU云服务器。节省部署成本：在您使用ECS实例（非GPU实例）完成环境搭建之前，您无需创建EAIS实例，此时，仅有ECS实例（非GPU实例）在计费。如果您直接购买GPU实例然后在GPU实例上部署环境，将花费更多的...

在GPU实例上基于Alpaca大模型搭建个人版“对话大模型...

本教程介绍如何在阿里云GPU云服务器上基于 Alpaca大模型快速搭建个人版“对话大模型”。背景信息 Alpaca大模型是一款基于LLaMA的大语言模型，它可以模拟自然语言进行对话交互，并协助用户完成写作、翻译、编写代码、生成脚本等一系列创作...

使用MPS实现GPU共享调度和显存隔离

添加GPU节点时，您需要将实例规格架构设置为 GPU云服务器。具体操作，请参见添加已有节点或创建和管理节点池。节点标签单击节点标签的，设置键为ack.node.gpu.schedule，值为mps。重要每个GPU节点只有打上标签 ack.node.gpu....

使用GPU拓扑感知调度（Pytorch版）

前提条件已创建ACK Pro集群，且集群的实例规格类型选择为 GPU云服务器。更多信息，请参见创建Kubernetes托管版集群。已安装 Arena。已安装GPU拓扑感知调度组件。系统组件版本满足以下要求。组件版本要求 Kubernetes 1.18.8及以上版本 ...

使用GPU拓扑感知调度（Tensorflow版）

前提条件创建ACK托管集群，集群的实例规格类型选择为 GPU云服务器。已安装 Arena。已安装GPU拓扑感知调度组件。系统组件版本满足以下要求。组件版本要求 Kubernetes 1.18.8及以上版本 Nvidia 418.87.01及以上版本训练框架NCCL版本 2.7+...

使用EAIS软件包手动部署Stable-Diffusion

更多GPU实例信息，请参见什么是GPU云服务器。节省部署成本：在您使用ECS实例（非GPU实例）完成环境搭建之前，您无需创建EAIS实例，此时，仅有ECS实例（非GPU实例）在计费。如果您直接购买GPU实例然后在GPU实例上部署环境，将花费更多的...

弹性临时盘

存储增强通用型实例规格族g8ise 通用型实例规格族g8a 通用型实例规格族g8i 通用型实例规格族g8y 计算型实例规格族c8a 计算型实例规格族c8i 计算型实例规格族c8y 内存型实例规格族r8a 内存型实例规格族r8i 内存型实例规格族r8y GPU云服务器...

GPU云服务器（gn/vgn/sgn系列）

作为阿里云弹性计算家族的一员，GPU云服务器结合了GPU计算力与CPU计算力，满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求。说明查看实例可购买地域：不同地域的实例规格可能有所不同，建议先了解各地域的可购买情况。查看...

基于ACK部署DeepSeek蒸馏模型推理服务

关于GPU实例规格和计费的详情，请参见 GPU计算型实例规格族和 GPU云服务器计费。模型部署步骤一：准备DeepSeek-R1-Distill-Qwen-7B模型文件执行以下命令从ModelScope下载DeepSeek-R1-Distill-Qwen-7B模型。说明请确认是否已安装git-lfs...

使用共享GPU调度能力

添加GPU节点时，您需要指定实例规格的架构为 GPU云服务器。具体操作，请参见添加已有节点或创建和管理节点池。边缘节点在边缘节点池中添加GPU节点的具体操作，请参见添加GPU节点。步骤四：在云端节点安装和使用GPU资源查询工具下载...

应用性能加速

GPU云服务器（gn/vgn/sgn系列）GPU计算型实例规格族gn8v GPU计算型实例规格族gn8is GPU计算型实例规格族gn7e GPU计算型实例规格族gn7i GPU计算型实例规格族gn7s 阿里云公共镜像Ubuntu 22.04 阿里云公共镜像Ubuntu 24.04 弹性裸金属服务器...

搭建具备大模型和向量检索功能的知识库应用程序

背景信息 DeepGPU-LLM是阿里云基于GPU云服务器研发的LLM推理引擎，专为大语言模型（LLM）推理任务设计，提供高性能推理服务。更多信息，请参见什么是推理引擎DeepGPU-LLM。AnalyticDB PostgreSQL版基于Greenplum开源项目开发，由阿里云...

神行工具包（DeepGPU）计费

使用神行工具包（DeepGPU）本身不需要额外支付费用，您只需要为执行计算任务过程中使用的阿里云资源（例如云服务器ECS或文件存储NAS）进行付费。神行工具包中的组件主要包括 AI训练加速器Deepytorch Training、AI推理加速器Deepytorch ...

GPU监控

请确保您已在云服务器ECS上安装云监控插件。具体操作，请参见安装云监控插件。监控项说明您可以从GPU、实例和应用分组维度查看GPU相关监控项。GPU的监控项如下表所示。监控项单位 MetricName Dimensions（Agent）GPU维度解码器使用率%...

附录：诊断支持场景及说明

诊断入口：ECS GPU设备健康检查 ECS云盘扩容未生效诊断产品：云服务器ECS 诊断对象：运行中的Linux ECS实例功能描述：当用户发现云服务器ECS 云盘申请了扩容但未生效时，可通过 ECS云盘扩容未生效诊断工具快速排查ECS 云盘是否正常。...

镜像商品的版本管理

可以不做设置，不设置代表该镜像运行可以支持1核及以上GPU的云服务器 内存配置不做设置 0.5 GiB – 1024 GiB 可以不做设置，不设置代表该镜像部署和运行可以支持0.5GiB及以上内存的云服务器 VPC专有网络是否支持多网卡支持支持和不支持...

GPU虚拟化型（vgn/sgn系列）

本文为您介绍云服务器ECS GPU虚拟化型实例规格族的特点，并列出了具体的实例规格。GPU虚拟化型实例规格族sgn8ia GPU虚拟化型实例规格族sgn7i-vws（共享CPU）GPU虚拟化型实例规格族vgn7i-vws GPU虚拟化型实例规格族vgn6i-vws GPU虚拟化型...

实例命名规则

命名规则阿里云云服务器ECS提供了多种实例规格族，一种实例规格族又包括多个实例规格。其中，实例规格族名称格式为 ecs.规格族，实例规格名称为 ecs.规格族.规格大小。实例具体命名含义如下所示：ecs：云服务器ECS的产品代号。规格族：由...

如何选用云服务器

在阿里云电子政务云上，云服务器有很多不同的规格型号，例如都是4核8G内存的云服务器，在不同应用场景下的性能跑分不同，价格也不同。本文为您介绍阿里云云服务的常见参数类别，帮助您根据不同的业务需求选择合适的云服务。云服务器参数...

常用操作导航

GPU实例作为云服务器ECS的一类实例规格，保持了与ECS实例相同的操作方式。在使用云服务器ECS时，您可能会遇到各种问题，例如远程连接、更换操作系统、扩容云盘、升高或降低实例配置、使用快照或镜像等。本文介绍了云服务器ECS的常用操作，...

启动实例

GPU实例作为云服务器ECS的一类实例规格，保持了与ECS实例相同的管理操作。本文介绍如何在ECS管理控制台上启动实例。前提条件实例满足以下条件之一：实例处于已停止状态。按量付费实例处于已过期状态，您已经结清欠费账单但自动重开机...