模型制作技术-模型制作技术文档介绍内容-移动阿里云

模型列表

多模态模型视觉理解模型通义千问VL、视觉推理模型 QVQ、音频理解模型通义千问Audio、全模态模型通义千问Omni、实时多模态模型通义千问Omni-Realtime 领域模型代码模型、数学模型、翻译模型、法律模型、数据挖掘模型、深入研究模型、...

大模型技术服务内容说明

大模型工程技术服务：提供大模型整体模型工程应用、效果优化、模型训练及微调、模型实施部署的整体技术服务，覆盖从场景设计、数据和素材整理准备、产品部署培训、算法算力平台使用、测试和应用推广全过程。大模型算力优化服务：算力迁移和...

精模建筑

制作商选择模型制作商的类型，可选原厂、其他和预言。在完善模型信息对话框中，您还可以查看当前上传的模型的视角，并拖动鼠标自定义调整模型视角至合适的角度，并且系统会自动保存该视角作为封面截图。填写完模型信息和调整视角后，您...

精模建筑

制作商选择模型制作商的类型，可选原厂、其他和预言。在完善模型信息对话框中，您还可以查看当前上传的模型的视角，并拖动鼠标自定义调整模型视角至合适的角度，并且系统会自动保存该视角作为封面截图。填写完模型信息和调整视角后，您...

业务流程

③ 智能语音分析：接入通义听悟-智能纪要Agent，对离线或实时录音进行高精度转写，并结合大模型技术实现内容理解与智能分析。④ 多维结果呈现：在您的智能纪要业务系统中直观展示章节速览、全文摘要、发言要点总结等多维度分析结果，助力...

官方应用-通义听悟Agent

通义听悟 Agent 深度融合智能语音AI与通义大模型技术，面向企业办公（如：会议、面试、培训）、在线教育、销售服务洞察、汽车行业产-供-销（如：购车客户画像、工业语音质量等）分析等垂直行业场景，提供针对性音视频智能分析解决方案。...

通义法睿

通义法睿产品介绍通义法睿是以通义千问为基座经法律行业数据和知识专门训练的法律行业大模型产品，综合运用了模型精调、强化学习、RAG检索增强、法律Agent及司法专属小模型技术，具有回答法律问题、推理法律适用、推荐裁判类案、辅助案情...

产品简介

产品概述播客音频生成是以通义千问大模型为基座的音频内容创作应用，通过大模型技术将文档内容转换成一段AI解读的播客节目，由两位AI主持人以对话的形式生动地对谈。功能介绍功能点说明文档类型支持用户上传各种文档资料（word、pdf、...

应用合规备案

阿里云百炼大模型服务平台面向云上企业提供相关大模型技术支持，涉及不同应用方的使用场景差异，可能涉及合规要求的算法备案，备案中涉及算法相关研发信息及内容，因此我们汇总整理了支持云上企业查询大模型算法备案的指南。重要上架及...

产品简介

通义听悟 Agent 深度融合智能语音AI与通义大模型技术，面向企业办公（如：会议、面试、培训）、在线教育、销售服务洞察、汽车行业产-供-销（如：购车客户画像、工业语音质量等）分析等垂直行业场景，提供针对性音视频智能分析解决方案。...

示例：模型设计

背景信息技术建模包括限界上下文划分、领域模型、数据模型、服务模型等内容，主要目的是能够基于DDD的建模方法论将业务模型转化成技术模型，从而能高效指导中台应用的开发。更多信息，请参见技术建模。限界上下文示例项目中预置了两个...

快速开始

人物形象免训练trainfree方式上，基于内置强大的人物写真照预训练大模型技术，实现人物写真扩散模型的图像极速生成能力，一键免训练极速生成人物写真照，并叠加一系列后处理能力，实现兼具相似度、真实感、美观度的写真生成能力，人物写真...

LLM on DLC-Megatron on DLC最佳实践

常见的大模型训练技术包括：数据并行技术、模型并行技术（包括张量并行技术和流水并行技术）、优化器状态并行技术、序列并行技术、激活重算技术等：数据并行技术（Data Parallel）：在多个GPU组上有相同的模型参数副本，但读取不同的样本。...

自定义模型最佳实践

即便不清楚大模型的技术细节，您也能按照本篇的操作指引创建一个有效的自定义模型，从而轻松地为业务场景添加大模型服务能力。自定义模型概述自定义大模型是指基于通用大语言模型，通过微调和训练，能更好地适应特定领域或任务的大语言...

自定义模型部署

通过 FunModel 的自定义模型部署功能，可以将自有的或开源社区的预训练模型部署为在线API服务。本文将指导您如何选择合适的部署方案，并使用 vLLM、SGLang 或自定义镜像完成模型部署、调用及运维。准备工作在开始之前，请确保您已拥有一个...

自定义模型部署

通过 FunModel 的自定义模型部署功能，可以将自有的或开源社区的预训练模型部署为在线API服务。本文将指导您如何选择合适的部署方案，并使用 vLLM、SGLang 或自定义镜像完成模型部署、调用及运维。准备工作在开始之前，请确保您已拥有一个...

保障离线在线一致性的CTR预估方案

在制作Pipeline模型对话框，确认模型打包信息，并单击下一步，启动Pipeline模型打包任务。打包任务大概需要3~5分钟即可完成。部署模型服务。方式一：在制作Pipeline模型对话框，当运行状态为成功时，单击部署至EAS，会跳转到EAS...

Pipeline部署在线服务

Designer支持将一个包含数据预处理、特征工程、模型预测的离线数据处理pipeline，打包成一个Pipeline模型，并一键部署为EAS在线服务。使用限制仅支持Alink框架的算法组件（即左上角有紫色小点标识的组件）。所有需要部署的模型涉及的训练...

通义法睿

通义法睿是以通义千问为基座经法律行业数据和知识专门训练的法律行业大模型产品，综合运用了模型精调、强化学习、RAG检索增强、法律Agent及司法专属小模型等技术，具有回答法律问题、推理法律适用、推荐裁判类案、辅助案情分析、生成法律...

模型压缩

模型压缩是指通过各种技术和方法减少机器学习模型的大小和计算复杂度，同时尽量保持其预测性能的过程。随着深度学习模型变得越来越复杂和庞大，模型压缩变得尤为重要，尤其是在资源受限的环境中，可有效减少存储和计算资源的使用。简介 ...

StableDiffusion3.5 API详情

stable-diffusion-3.5-large-turbo stable-diffusion-3.5-large-turbo是在stable-diffusion-3.5-large的基础上采用对抗性扩散蒸馏（ADD）技术的模型，具备更快的速度。前提条件已开通服务并获得API-KEY：获取API Key。我们推荐您将API-KEY...

术语

检索增强生成（RAG）检索增强生成（Retrieval-Augmented Generation，RAG）是一种结合检索和生成技术的模型。它通过引用外部知识库的信息来生成答案或内容，具有较强的可解释性和定制能力，适用于问答系统、文档生成、智能助手等多个自然...

从0到1部署大模型，计算巢模型市场让小白秒变专家

文生图模型能力：文本生成图像、艺术风格转换、产品设计、概念可视化模型：通义万象：中文场景优化，文化元素支持，商业合规 Stable Diffusion系列：多样艺术风格，可定制训练文生视频模型能力：文本转视频、短视频生成、动画制作、...

部署DeepSeek-R1系列模型

本文以部署DeepSeek-R1-Distill-Qwen-7B模型为例，演示如何使用数据缓存快速部署DeepSeek-R1系列模型。通过数据缓存提前拉取DeepSeek相关模型数据，然后在部署DeepSeek模型推理服务时直接挂载模型数据，可以免去在实例中拉取模型数据的等待...

通义晓蜜CCAI-对话分析AIO模型调用降价通知

尊敬的阿里云用户：通义晓蜜团队运用前沿技术深度优化模型算法，显著提升模型理解与分析能力，能精准识别关键信息生成摘要，快速准确检测潜在问题，且支持处理复杂数据，多维度挖掘深层价值，助力决策。通义晓蜜团队在提升模型效果的同时，...

三维模型常见问题

渲染场景分类包括以下几种：模型渲染种类说明离线渲染将模型用于影视和动画渲染等视频制作。通常渲染质量非常高，缺陷是渲染时间非常长，渲染单帧需要几分钟甚至几个小时。通用使用maya和blender等三维建模软件进行渲染，主要产出是...

魔搭大模型一键部署到阿里云ENS

说明模型部署需要一定耗时，包括模型下载、制作、资源生产和部署，请您耐心等待。效果验证在部署任务列表中，点击具体任务操作列下的详情按钮，即可查看任务详情。详情页展示服务实例的创建时间、更新时间、实例类型、模型文件、推理...

人物写真生成API详情

关于该接口功能的示例图如下：输入图像自定义模板生成结果应用场景职场证件照制作：一键训练证件照人物形象风格，专为用户打造符合各类企业招聘、求职简历等场景的高质量、规范化的职场证件照，轻松完成高质量的职场证件照制作，节省...

AnimateAnyone 动作模板生成

模型概览模型名模型简介 animate-anyone-template-gen2 animate-anyone-template-gen2是一个人物动作模板生成模型，可基于人物运动视频提取人物动作并制作模板。模型输入要求正确示例：符合动作模板制作要求的视频示例说明上传的视频...

大语言模型微调指引

本文为您介绍微调LLM时的策略选择（SFT/DPO）、微调技术（全参/LoRA/QLoRA）以及超参说明，旨在帮助实现模型性能的最佳优化。微调方法简介 SFT/DPO 在Model Gallery模块中，您可以对模型进行监督微调（SFT）和直接偏好优化（DPO）训练。大...

联网搜索

由于训练数据的时效性限制，大模型无法准确回答如股票价格、明日天气等实时问题，启用联网搜索功能后，模型将基于实时检索数据回复。使用方式调用模型时，传递 enable_search:true 参数可启用联网搜索功能。启用后，模型将判断用户问题...

什么是Deepytorch Inference（推理加速）

针对PyTorch框架下的深度学习模型，在无需指定精度和输入尺寸的情况下，通过即时编译技术对该模型进行推理优化，从而实现高效、快速的推理加速效果。Deepytorch Inference的架构图如下所示：架构层说明框架层 Pytorch Framework：即...

模型上架与更新

中国大陆（北京）模型类型时间模型规格功能说明图像编辑 2025-12-23 qwen-image-edit-plus-2025-12-15 通义千问图像编辑发布的最新快照模型，相较于上一版本提升了角色一致性、工业设计能力和几何推理能力，并优化了编辑后的图片与原图...

图像局部重绘

影视与游戏制作：在后期制作中，图像局部重绘技术能帮助快速修改场景细节，如调整角色服饰、道具样式，或是优化视觉特效，减少图像海报等物料制作时间和成本。个性化礼物定制：图像局部重绘使得个性化定制变得简单快捷，比如在纪念品、T恤...

人物实例分割

基本介绍人物实例分割运用了检测和分割技术，不仅能够在图像中识别出不同的对象，而且还能准确地画出每一个对象边界的像素级掩码（mask）。推荐配合使用图像擦除补全接口来进行AI人体消除，选择完整人体mask区域来消除一个或多个人物。...

功能特性

训练加速（Rapidformer）概述模型优化Blade Blade有机融合多种优化技术，对模型进行分析，智能优化达到最优的推理性能。推理加速（Blade）概述 PAI-SDK 分布式模型训练 PAI Python SDK提供了更易用的API（即HighLevel API），支持用户提交...

搭建Alpaca-LoRa

背景信息 Alpaca-LoRa是一种使用Lora技术在LLaMA模型进行微调的轻量级语言模型。它可以模拟自然语言进行对话交互，根据用户输入的指令来生成不同的文本，协助用户完成写作、翻译、编写代码等任务。重要阿里云不对第三方模型的合法性、安全...

文本生成模型概述

文本生成模型能够基于输入的提示词（Prompt）创作出逻辑清晰、连贯的文本。文本生成模型所需的输入可以是简单的关键词、一句话概述或是更复杂的指令和上下文信息。模型通过分析海量数据学习语言模式，广泛应用于：内容创作：生成新闻报道、...

图像擦除补全

擦除补全技术结合AIGC inpainting等先进技术，可以在多种场景下应用，从而满足用户对隐私保护、内容创作和图像编辑等方面需求。推荐配合使用人物实例分割接口来进行人体消除，选择完整人体mask区域来消除一个或多个人物，能准确地画出每...

计费说明

套元 100小时 600 3D数字人 3D模型服务 3D数字人形象制作（人物｜卡通｜异形）【提供MYA/UE模型和动作表情模型】数字人形象定制，产出一套数字人形象资产，包括一套定制的形象和服装套元 1个 100,000.00 3D数字人形象制作（人物｜卡通｜...