模型制作技术-模型制作技术文档介绍内容-移动阿里云

部署DeepSeek-R1系列模型

本文以部署DeepSeek-R1-Distill-Qwen-7B模型为例，演示如何使用DataCache快速部署DeepSeek-R1系列模型。通过DataCache提前拉取DeepSeek相关模型数据，然后在部署DeepSeek模型推理服务时直接挂载模型数据，可以免去在Pod中拉取模型数据的...

部署QwQ-32B模型

本文以部署QwQ-32B模型为例，演示如何使用DataCache快速部署QwQ-32B模型。通过DataCache提前拉取QwQ-32B模型数据，然后在部署QwQ-32B模型推理服务时直接挂载模型数据，可以免去在Pod中拉取模型数据的等待时间，加速QwQ-32B部署。为什么使用...

阿里云AI搜索方案

阿里云Elasticsearch（简称ES）提供的AI搜索功能，使用RAG技术对检索增强生成的各个环节进行能力增强，致力于在广泛数据中精准解析数据，并结合用户需求，利用大模型生成高质量内容，为您提供满意的搜索结果。背景信息无论是企业内部知识...

根据领域对象批量生成相关模型

背景信息技术建模中结构对象、领域对象和数据对象中的很多字段可能都是相同的，如果所有的模型都从对象到字段逐个手动创建，会带来较大的维护成本。系统支持根据领域对象直接批量创建应用服务、结构对象和数据模型，同时会自动创建模型间...

什么是推理引擎DeepGPU-LLM

产品简介 DeepGPU-LLM作为阿里云开发的一套推理引擎，具有易用性和广泛适用性，旨在优化大语言模型在GPU云服务器上的推理过程，通过优化和并行计算等技术手段，为您提供免费的高性能、低延迟推理服务。DeepGPU-LLM的关联布局图如下所示：...

OCR文档自学习概述

模型业务化：通过预置的通用多模态AI能力，通过沉淀的数据资产，支持用户一键训练更满足业务场景需求的自主定制化模型，通过预训练模型、图文多模态算法和少样本信息抽取等核心技术能力，更高效、高精度地满足业务场景的需求。管理平台化：...

常见问题

该技术通过微调高阶模型获取强大知识，然后将其转移至低阶模型，实现模型压缩与性能优化，使得低阶模型在保持小巧、高效的同时，获得接近或超越高阶模型的性能。所谓大模型参数是怎么存储的？您可以从魔搭社区下载开源模型，其结构通常在...

数据缓存概述

从流程可以看出，如果不使用数据缓存，会带来容器镜像过大的问题，并且如果要更新模型，则需要重新制作镜像，重复镜像版本发布、镜像缓存制作，应用部署等工作。如果使用数据缓存，将数据和镜像解耦，在要更新模型时，只需重新制作数据缓存...

数据缓存概述

从流程可以看出，如果不使用数据缓存，会带来容器镜像过大的问题，并且如果要更新模型，则需要重新制作镜像，重复镜像版本发布、镜像缓存制作，应用部署等工作。如果使用数据缓存，将数据和镜像解耦，在要更新模型时，只需重新制作数据缓存...

地标建筑

查看模型基本信息：在对话框左上角处，您可以查看当前被预览的模型的模型等级、风格、制作商、文件大小和上传时间。配置模型参数：在对话框最右侧，您可以查看并配置模型参数样式。配置模型参数说明：贴图通道：单击模型的贴图通道内 ...

地标建筑

查看模型基本信息：在对话框左上角处，您可以查看当前被预览的模型的模型等级、风格、制作商、文件大小和上传时间。配置模型参数：在对话框最右侧，您可以查看并配置模型参数样式。配置模型参数说明：贴图通道：单击模型的贴图通道内 ...

DeepSeek

deepseek-r1-distill 系列模型是基于知识蒸馏技术，使用 deepseek-r1 生成的训练样本对 Qwen、Llama 等开源大模型进行微调训练后得到的模型。deepseek-v3（回复前不思考）deepseek-v3 模型，在 14.8T token 上进行了预训练，长文本、代码、...

召回定制同义词

整个定制过程，同义词模型训练会自动抽取已有数据进行适配（如果用户已有一些个性化的同义词数据也支持导入优化训练模型，详情可联系技术同学）。定制召回模型按照存储容量、计算资源、模型训练收费，具体价格请参考 OpenSearch-行业算法版...

知识库效果优化

1.RAG 流程简介 RAG（Retrieval Augmented Generation，检索增强生成）是一种结合了信息检索和文本生成的技术，能够在大模型生成答案时利用外部知识库中的相关信息。其效果由三个核心阶段决定：建立索引：知识的解析、切片与向量化。检索...

模型服务FunModel

其核心机制包括：GPU 切分技术：将单张物理 GPU 显卡虚拟化为多个独立的计算单元，支持多个不同大小的模型或实例共享同一张卡，同时保证资源隔离。资源池化管理：统一纳管数据中心内的 CPU、GPU 等异构算力，形成统一的资源池，根据实际...

什么是FunModel

其核心机制包括：GPU 切分技术：将单张物理 GPU 显卡虚拟化为多个独立的计算单元，支持多个不同大小的模型或实例共享同一张卡，同时保证资源隔离。资源池化管理：统一纳管数据中心内的 CPU、GPU 等异构算力，形成统一的资源池，根据实际...

AIGC设计（ArtLab）

背景信息在大模型（尤其是AIGC模型）的快速发展背景下，行业开发者亟需工具以降低技术门槛，解决领域内的内容生成需求。但当前大模型的应用对AI技术和编程能力要求较高，导致学习与部署成本显著增加。因此，ArtLab 应运而生，它屏蔽了底层...

推理加速（Blade）概述

PAI-Blade结合了多种优化技术，对训练完成的模型进行优化，从而达到最优的推理性能。同时，PAI-Blade提供的C++ SDK可以部署优化后的模型推理，帮助您快速的将模型应用于生产。本文介绍PAI-Blade的工作原理和使用流程。背景信息 PAI-Blade是...

AI加速

Rapidformer（Transformer训练加速）一款PyTorch版的针对Transformer系列模型的训练优化工具，通过加速开关组合优化技术，优化PyTorch版Transformer模型的训练过程，提高训练速度和效率。更多信息，请参见训练加速（Rapidformer）概述。...

我是系统集成商

为了快速定义资产模型，单击新建模板，可以把常用的属性预先定义成模板：在新建属性模板页面输入名称、唯一编码和描述，然后选择模板是业务属性还是技术属性：技术属性模板可以添加多个技术属性，单击添加技术属性：在技术属性中选择数据...

通义千问-图像编辑

快速入口：使用指南|技术博客|在线体验模型概览多图图像修改展示器.qwen-image-editor { font-family:'Segoe UI',Tahoma,Geneva,Verdana,sans-serif;background:#ffffff;color:#333;padding:20px;border-radius:0;box-sizing:border-box;...

业务空间成员管理

支持调用的模型列表支持训练的模型列表支持部署的模型列表子业务空间：初始状态下子业务空间无任何模型调用、调优或部署权限。请参考下方步骤授权该空间使用特定模型（例如 qwen-plus），RAM用户才能在该空间内对该模型进行调用、调...

运维管理

然而大模型训练依赖海量算力资源（通常需要万卡级 GPU 集群）并伴随高昂成本，导致行业参与者高度集中于通用基座模型、智能驾驶专用模型等少数高价值和技术纵深的赛道，形成了较高的技术与资金壁垒。第二层：开发框架与工具链 AI 应用开发...

快速入门

本文档旨在引导您完成在 FunModel 平台部署模型及调用 API 的完整过程。您将了解如何选择和配置计算实例、管理服务凭证、发起推理请求以及进行基础的故障排查，从而帮助您将 FunModel 平台的 AI 模型能力集成到您的应用中。准备工作在开始...

快速入门

本文档旨在引导您完成在 FunModel 平台部署模型及调用 API 的完整过程。您将了解如何选择和配置计算实例、管理服务凭证、发起推理请求以及进行基础的故障排查，从而帮助您将 FunModel 平台的 AI 模型能力集成到您的应用中。准备工作在开始...

快速开始：DistilQwen2蒸馏小模型的训练、评测、压缩...

作为一站式的机器学习和深度学习平台，阿里云的人工智能平台PAI对DistilQwen2模型系列提供了全面的技术支持，无论是开发者还是企业客户，都可以通过PAI-Model Gallery轻松实现DistilQwen2系列模型的训练、评测、压缩和快速部署。...

阿里云大模型工程师ACA认证发布

阿里云大模型工程师ACA认证旨在培养非技术背景人员、无算法背景的工程技术人员和任何对大模型感兴趣的初学者，使之掌握大模型使用方法，利用大模型提升学习和工作效率，助力大模型在各个业务场景的落地。欢迎参加大模型ACA的学习和考试。...

GLM

本文介绍了在阿里云百炼平台通过API调用 GLM 系列模型的方法。每个模型各有 100 万免费 Token。模型列表 GLM 系列模型是智谱AI专为智能体设计的混合推理模型，提供思考与非思考两种模式。模型名称上下文长度最大输入最大思维链长度最大...

文本生成图像

她身后的玻璃板上手写体写着“一、Qwen-Image的技术路线：探索视觉生成基础模型的极限，开创理解与生成一体化的未来。二、Qwen-Image的模型特色：1、复杂文字渲染。支持中英渲染、自动布局；2、精准图像编辑。支持文字编辑、物体增减、风格...

模型下载指南

1.模型广场：一站式精选模型下载为了简化模型获取流程，缓解跨境网络下载模型难的痛点，我们提供了模型广场，模型广场汇集了常见的ComfyUI模型，帮助您轻松找到并下载模型。下载步骤：登录控制台：首先登录控制台，进入目标图像生成项目...

联邦模型管理

各节点的技术运维人员可以根据联邦模型在节点中的存储地址，在节点本地获取联邦模型，并将其部署在节点中。前提条件在任务执行完成后，保存了由脚本产生的联邦模型。查看模型列表登录联邦建模控制台，并在右上角的下拉框中选择需要进入的...

模型下载指南

1.模型广场：一站式精选模型下载为了简化模型获取流程，缓解跨境网络下载模型难的痛点，我们提供了模型广场，模型广场汇集了常见的ComfyUI模型，帮助您轻松找到并下载模型。下载步骤：登录控制台：首先登录Function AI控制台，在左侧...

构建运营模型

运营模型是指组织和业务团队使用云计算平台支持业务的过程中，根据业务需求、企业架构、组织文化、现有的技术水平和工具等构建的模型。每个企业的运营模型都是独特的，本文将介绍四种常见的运营模型以供参考。构建运营模型的目的是为了实现...

快速开始：大模型继续预训练解决方案

在人工智能和自然语言处理领域，大语言模型（LLM）已经成为推动技术进步的核心力量。但在实际应用中，针对特定任务或领域的继续预训练往往是提升模型性能的关键。本方案以通义千问2（Qwen2）模型为例，为您介绍如何对模型进行继续预训练。...

什么是AI 网关

被动健康检查：网关依据用户配置的探测规则，结合服务节点在实际请求处理中的表现评估其健康状态模型、Agent 的负载均衡和灰度发布模型的负载均衡和灰度发布 Model API 预置 3 种模型负载均衡能力，分别是：单模型服务：可指定唯一的大...

文生图StableDiffusion

Stable Diffusion 3.5在之前的1.5版本的基础上做了进一步改进，采用了多模态扩散变压器（MMDiT）架构，结合了三种固定预训练文本编码器，并使用Query-Key归一化（QK Normalization）技术以提升训练稳定性。此模型在图像质量、复杂提示理解...

模型调优简介

模型调优介绍模型调优作为重要的模型效果优化方式，可以：提升模型在特定行业/业务表现降低模型输出延迟抑制模型幻觉对齐人类的价值观或偏好使用调优后的轻量级模型替代规模更大的模型模型在调优过程中，会学习训练数据中的知识、...

训练集与评测集

当然在很多复杂的业务场景，可以综合采用模型调优和知识库检索结合的技术方案。以客服场景为例，可以借助模型调优解决客服回答的语气、表达习惯、自我认知等问题，场景涉及的专业知识可以结合知识库，动态引入到模型上下文中。阿里云百炼...

在控制台进行模型调优

步骤二：参数配置训练参数介绍：并不是所有模型都支持所有参数的调节，请以控制台显示为准参数名称推荐设置超参作用批次大小(batch_size)使用默认值批次大小，代表模型训练过程中，模型更新模型参数的数据步长，可理解为模型每看多少...

模型与权限

准备工作在配置数据模型和服务模型前，请先通过物联网边缘计算的咨询系统，填写您关于开发数据模型和服务模型的需求，获取功能开发文档和技术支持。前提条件已创建容器应用，详细操作，请参见创建容器应用。若您需要将容器应用中某个...