弹性盒模型-弹性盒模型文档介绍内容-移动阿里云

Horovod弹性训练

弹性模型训练通过对接Horovod的Elastic模式，可以让Horovod运行的分布式训练任务具备动态调整训练Workers数量的能力。您可以通过实时的弹性模型训练，并结合抢占实例，充分利用空闲的算力资源，以降低单位时间的训练成本。本文介绍如何部署...

AI任务概述

借助ACK云原生AI套件提供的Arena命令行工具、AI负载调度、弹性数据集加速、GPU异构资源管理等基础能力，您可以在Kubernetes集群中简便、高效地运行各种AI任务，比如模型训练、测试和分析模型性能、部署模型推理服务等。本文介绍使用云原生...

Multi-Cluster弹性模型

云原生数据仓库AnalyticDB MySQL版湖仓版（3.0）资源组支持Multi-Cluster弹性模型，您可在创建Interactive型资源组时，开启Multi-Cluster功能。Multi-Cluster弹性模型由一个或者多个Cluster组成，可根据业务负载自动对资源进行扩缩容，...

节点伸缩概述

基于事件驱动，使用响应式模型，弹性灵敏度为1~3s。资源交付确定性云上资源的库存变化较为频繁。由于实例规格组合问题、库存不足等原因，节点自动伸缩的弹性成功率在97%左右。支持库存自动选择策略，可根据您配置的筛选条件与顺序，从...

引擎简介

弹性异构计算 Lindorm AI引擎采用云原生架构，支持弹性部署云上多种规格的推理节点，且推理节点支持多种机型（CPU和GPU），进一步提升了模型推理的性能。此外，推理节点和多模引擎存储共享，在减少数据传输成本的同时实现了靠近数据的推理...

AI推理服务概述

借助ACK云原生AI套件提供的Arena命令行工具、AI负载调度、GPU管理、资源弹性伸缩等基础能力，您可以在Kubernetes集群中简便、高效地把训练好的模型部署为AI推理服务。阿里云容器服务ACK支持为推理服务提供弹性伸缩、GPU共享调度、性能监控...

使用EAIS训练PyTorch模型（EAIS内置AIACC-Training）

具备远端GPU算力的弹性调整，使得模型装载能力更强，可以为LLama7B-33B-65B等不同配置大语言模型提供不同的装载能力。原理说明 EAIS支持您根据自身业务场景选择不同的PyTorch框架版本，来使用EAIS实例进行PyTorch模型训练，目前支持如下两...

基于ECS的弹性推理

阿里云容器服务提供了弹性节点池，可以基于弹性节点池部署模型推理服务，满足弹性伸缩的需求。本文介绍如何基于ECS运行弹性推理工作负载。前提条件已完成模型训练。本文采用TensorFlow 1.15训练的Bert模型。已安装ack-alibaba-cloud-...

弹性Job服务功能介绍

推理场景弹性Job服务用于模型推理场景，能够感知每个请求的执行进度，做到更公平的任务调度。对于响应时间较长的推理服务，一般建议使用EAS异步推理服务的形式来部署，但异步服务存在以下两个问题：队列服务推送请求时不能保证优先推送给...

部署通义千问应用

本文以部署ModelScope社区的通义千问-7B-Chat模型为例，演示如何使用数据缓存。通过数据缓存提前拉取通义千问-7B-Chat模型数据，然后在创建通义千问的应用实例时直接挂载模型数据，可以免去在实例中拉取模型数据的等待时间，加速应用部署。...

搭建类似妙鸭相机的应用

本文以部署ModelScope社区的人物AIGC基础模型（ly261666/cv_portrait_model）搭建类似妙鸭相机的应用为例，演示如何使用数据缓存。通过数据缓存提前拉取模型数据，然后在创建应用实例时直接挂载模型数据，可以免去在实例中拉取模型数据的...

ACK部署使用elastic-workload

背景信息在Kubernetes中，弹性包括调度层弹性（Pod）和资源层弹性（Node）两个层次，通常会通过HPA、CronHPA、VPA等模型进行Pod的弹性伸缩，再通过cluster-autoscaler或者virtual-kubelet进行资源层的弹性伸缩。两层之间通过Pod进行解耦，...

沙盒网络

解决方案针对沙盒网络对于采集、统一管理、弹性能力的诉求，阿里云提供了日志服务作为解决方案。在数据集中采集方面，日志服务提供50+数据接入手段，其中Logtail采集方式可用于统一采集阿里云ECS、自建IDC、其他云厂商等服务器上的日志。...

服务部署：控制台

EAS 支持将从开源社区下载的模型或您自己训练获得的模型部署为推理服务或AI-Web应用。针对不同方式获取的训练模型，EAS 支持不同的部署方式。此外，EAS还提供了一系列针对特定场景的部署方式，您可以通过控制台快速将其部署为API服务。本文...

开发流程

注册及管理模型 ⑦ PAI平台的模型在线预测服务，支持异构硬件（CPU和GPU）模型加载，高吞吐低延迟，大规模复杂模型一键部署及实时弹性扩缩容。说明目前 EAS 产品不支持使用DSW镜像和CPFS类型的数据集。EAS概述 AI+大数据最佳实践区域 ...

通过Stable Diffusion扩展插件实现文字光影图

Stable Diffusion模型：hanafuusen2001/BeautyProMix ControlNet模型：ioclab/ioc-controlnet 登录弹性容器实例控制台。在顶部菜单栏左上角处选择地域。重要如果您的业务部署在中国内地地域，可能会因为网络原因导致无法缓存HuggingFace...

模型服务网格

通过使用模型服务网格，开发人员可以更轻松地部署、管理和扩展机器学习模型，同时提供高可用性、弹性和灵活性，以满足不同的业务需求。相关功能使用模型服务网格进行多模型推理服务使用模型服务网格自定义模型运行时为大语言模型LLM提供...

云原生AI套件概述

这些服务借助ACK为AI模型开发、训练和推理带来了更好的弹性和效率。另一方面，云原生AI套件支持在ACK集群中一键部署轻量化人工智能平台 PAI 平台，降低AI使用门槛。在Kubernetes应用中，您可以灵活地集成PAI平台深度优化的算法和引擎，...

产品简介

DashScope灵积模型服务建立在“模型即服务”（Model-as-a-Service，MaaS）的理念基础之上，围绕AI各领域模型，通过标准化的API提供包括模型推理、模型微调训练在内的多种模型服务。通过围绕模型为中心，DashScope灵积模型服务致力于为AI...

EAS模型服务概述

模型在线服务EAS（Elastic Algorithm Service）是PAI产品为实现一站式模型开发部署应用，针对在线推理场景提供的模型在线服务，支持将模型服务部署在公共资源组或专属资源组，实现基于异构硬件（CPU和GPU）的模型加载和数据请求的实时响应...

什么是弹性伸缩ESS

弹性伸缩（Elastic Scaling Service，简称ESS），也称为Auto Scaling，其能根据您设定的策略自动调整计算资源数量（即业务所需的实例数量），帮助您应对业务流量波动的同时，提高资源利用率，有效降低成本。本视频以ECS实例为例介绍弹性...

将EIP绑定至辅助弹性网卡

仅支持绑定辅助弹性网卡仅支持绑定辅助弹性网卡主弹性网卡允许绑定的 EIP 数量 1个不支持绑定主弹性网卡不支持绑定主弹性网卡辅助弹性网卡允许绑定的 EIP 数量取决于辅助弹性网卡的私网IP数量说明 EIP 和辅助弹性网卡的私网IP地址...

手动部署Stable Diffusion WebUI服务

附录部署和使用tips 部署地域：建议服务部署在新加坡新加坡地域开通弹性公网IP服务后，访问Civitai和Github的网速高效稳定，您可以直接通过WebUI下载插件、Civitai模型，且WebUI网页操作体验与国内region部署一致。国内地域因网络问题，...

模型调优

模型调优模型调优是通过Fine-tuning训练模式提高模型效果的功能模块，作为重要的大模型效果优化方式，用户可以通过构建符合业务场景任务的训练集，调整参数训练模型，训练模型学习业务数据和业务逻辑，最终提高在业务场景中的模型效果。...

基本概念

DashScope灵积模型服务通过标准化的API提供“模型即服务”（Model-as-a-Service，MaaS）。不同于以往以任务为中心的AI API，DashScope构建在面向未来的、以模型为中心的理念下，因此也引入了一些新的概念和术语。开发者可以通过本文了解...

模型评测

完成模型部署后，如需测试模型的效果，可在模型评测中进行评测，模型评测需要首先构建评测的数据集，构建方法类似于训练集的构建，数据格式同样是问答Pair对，对于Prompt而言往往是需要验证的问题，对于Completion而言往往是评测参考的答案...

实时推理场景

配置弹性伸缩并验证本文为您介绍两种配置GPU实例的弹性伸缩策略的方法，分别为：通过Serverless Devs工具配置GPU实例的弹性伸缩策略通过函数计算控制台配置GPU实例的弹性伸缩策略配置完弹性伸缩策略后，您可以通过压测的方式查看弹性...

实时推理场景

配置弹性伸缩并验证本文为您介绍两种配置GPU实例的弹性伸缩策略的方法，分别为：通过Serverless Devs工具配置GPU实例的弹性伸缩策略通过函数计算控制台配置GPU实例的弹性伸缩策略配置完弹性伸缩策略后，您可以通过压测的方式查看弹性...

模型训练最佳实践

创建新模型训练任务需要选择模型类型，平台支持两种模型类型，如果第一次训练模型，一般选择预置模型，如果希望基于已训练的模型进行再次训练，则可选择自定义模型，定义如下：预置模型预置模型为未经过任何训练的原始模型，您可以通过...

快速开始

以下是四个常见的大模型应用场景：直接调用模型模型训练创建智能体API 创建RAG应用直接调用模型模型体验中心您可以单击左侧边栏的模型中心-模型服务-模型体验中心，选择1-3个模型进行测试，体验模型的问答效果。模型广场您可以进入 ...

基本概念

模型服务我的模型管理所有已开通、已部署的模型，包括模型广场已开通模型及经过训练并完成部署的模型，支持针对模型进行调用、评估、训练。模型广场在这里您可以根据业务所需挑选通义系列大模型、官方行业或场景大模型、第三方大模型等...

模型部署

模型部署模型部署支持用户部署训练完成的模型或系统预置的模型，模型需要部署成功后方可正式提供模型服务，用于模型调用或评测，模型部署支持使用预付费资源和后付费资源两种方式，模型部署成功后将持续计费，支持随时扩缩容或上下线，...

模型体验中心

您可以在模型体验中心试用通义千问、Llama2等语言模型，初步了解模型功能，比较不同模型效果，从而评估是否将模型到自己的业务流程中。前提条件已开通灵积模型服务并创建API-KEY，具体操作，请参见开通服务并创建API-KEY。操作步骤说明 ...

模型体验介绍

模型体验支持选择多个模型同时体验，快速对比不同模型的效果，最多同时选择3个模型，支持差异化模型配置及重复模型选择。说明体验模型将会消耗Tokens，费用以实际发生为主（独立部署模型除外）。各大模型收费标准请查看模型广场介绍，...

三方开源大语言模型

支持prompt格式输入百川模型2-7B对话版 baichuan2-7b-chat-v1 百川模型2-7B对话版/百川模型2-13B对话版，支持message和prompt格式输入百川模型2-13B对话版 baichuan2-13b-chat-v1 MOSS开源对话语言模型 moss-moon-003-base MOSS-MOON-003...

概念解释

模型调优预置模型预置模型为未经过任何训练的原始模型，您可以通过选择基础模型进行训练从而得到自创模型，不同的基础模型的参数和能力不同，我们将持续推出不同能力方向的模型。自定义模型自订阅模型是基于您训练过的模型进行再次训练...

模型广场介绍

重要模型广场介绍列表通义系列模型介绍请访问通义千问通义开源系列模型介绍请访问通义千问开源系列通义万相模型介绍请访问通义万相三方开源大模型请访问三方开源大语言模型模型更名模型名称更名后的模型通义千问-Max qwen-max...

计量计费

计费单价模型服务模型名计费单价百川模型2-13B对话版 baichuan2-13b-chat-v1 0.008元/1,000 tokens 百川模型2-7B对话版 baichuan2-7b-chat-v1 0.006元/1,000 tokens 百川模型1 baichuan-7b-v1 限时免费中免费额度说明免费额度是基于...

使用弹性强度评估资源可用性

弹性强度的级别与可用资源池个数的关系如下：差：0~1 中：2~3 强：4~+∞说明弹性强度仅表示可用的资源池个数，但弹性强度高只是提高了扩容成功的概率，不代表扩容一定成功。本文介绍如何查看伸缩组的弹性强度，并增加弹性强度（即增加可用...

2024年产品更新公告

说明阿里云百炼大模型服务平台圈子&子社区上线啦！欢迎大家在社区中踊跃参与留言，期待与您在社区中，共同探讨大模型的世界。重要 qwen-max-1201 计划于2024年4月22日下线升级，如您继续使用，建议您提前切换至 qwen-max，感谢您的关注~...