制作模型用什么材料-制作模型用什么材料文档介绍内容-移动阿里云

流式输出

流式输出通过持续返回模型生成的文本片段，解决了这两个核心问题。工作原理流式输出基于 Server-Sent Events(SSE)协议。发起流式请求后，服务端与客户端建立持久化 HTTP 连接。模型每生成一个文本块（称为 chunk），立即通过连接推送。...

人物实例分割

image-instance-segmentation 模型当前仅提供免费体验，免费额度用完后不可调用且不支持付费。基本介绍人物实例分割运用了检测和分割技术，不仅能够在图像中识别出不同的对象，而且还能准确地画出每一个对象边界的像素级掩码（mask）。...

通义-文生图-Z-Image

通义-文生图-Z-Image 是一款轻量级文生图模型，可快速生成图像，支持中英文字渲染，并灵活适配多种分辨率与宽高比例。快速入口：技术博客前提条件您需要获取与配置 API Key，并配置API Key到环境变量。效果展示输入提示词输出图像 ...

团队协作权限配置

子业务空间（非默认业务空间）成员能否调用、训练和部署某个模型（例如通义千问-Plus）取决于该业务空间是否拥有此模型的调用、训练和部署权限，详见模型授权（若该业务空间先前已授权过，无需重复授权）。第三步：获取API权限 RAM用户...

Qwen-MT 翻译模型

本文介绍通过 OpenAI 兼容接口或 DashScope API 调用 Qwen-MT 模型的输入与输出参数。相关文档：翻译能力（Qwen-MT）OpenAI 兼容北京地域 SDK 调用配置的 base_url 为：https://dashscope.aliyuncs.com/compatible-mode/v1 HTTP 调用配置...

图像背景生成

通义万相-图像背景生成模型专为商品换背景而设计。您可以选择文本引导（通过输入中英文描述生成背景）、图像引导（使用现有图片作为背景参考），或同时结合这两种方式。此外，模型还支持使用边缘引导元素（即图像的增强边缘特征），可以...

功能特性

管理成员快速开始QuickStart 预置模型库ModelHub PAI快速开始预置了多种来源于ModelScope、Huggingface等知名模型社区的预训练模型。模型部署及训练预置模型训练您可以基于预训练模型快速上手并使用PAI的训练功能。模型部署及训练预置...

EMO 图像检测

EMO-detect模型，用于确认输入的人物肖像图片是否符合EMO视频生成模型的输入规范。本文档介绍了该模型提供的图像检测能力的API调用方法。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。模型概览模型名模型...

视频生成模型微调API参考

本文档提供通义万相图生视频模型微调的完整 API 参考。适用范围适用地域：本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。开通账号权限：若使用阿里云子账号（RAM用户），需要为子账号授予模型调用、训练和部署...

Java SDK

模型与价格模型名称单价免费额度（注）cosyvoice-v3-plus 2元/万字符 2025年11月15日0点前开通阿里云百炼：2000字符 2025年11月15日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内 cosyvoice-v3-flash 1元/万字符 ...

声音复刻

声音复刻依托大模型进行特征提取，无需训练即可复刻声音。仅需提供 10~20 秒的音频，即可生成高度相似且听感自然的定制音色。声音复刻与语音合成是前后关联的两个步骤。本文档聚焦于介绍声音复刻的参数和接口细节，语音合成请参见实时语音...

翻译能力（Qwen-MT）

Qwen-MT模型是基于Qwen3模型优化的机器翻译大语言模型，支持92个语种（包括中、英、日、韩、法、西、德、泰、印尼、越、阿等）互译，且提供了术语干预、领域提示、记忆库等能力，提升模型在复杂应用场景下的翻译效果。工作方式传入待翻译...

RunVideoAnalysis-视频理解-在线任务

modelId string 否视频总结（文本加工）依赖的大模型唯一标识，支持的模型，如果文本加工阶段想跑多任务，可以走 textProcessTasks 字段，如果传入了 textProcessTasks，则当前字段和当前字段对应的 prompt 模版 id，prompt 模版将不再...

上下文缓存

调用大模型时，不同推理请求可能出现输入内容的重叠（例如多轮对话或对同一本书的多次提问）。上下文缓存（Context Cache）技术可以缓存这些请求的公共前缀，减少推理时的重复计算。这能提升响应速度，并在不影响回复效果的前提下降低您的...

通义万相-文生视频

通义万相文生视频模型基于文本提示词，生成一段流畅的视频。支持的能力包括：基础能力：支持选择视频时长（5/10/15秒）、指定视频分辨率（480P/720P/1080P）、智能改写prompt、添加水印。音频能力：支持自动配音，或传入自定义音频文件，...

全模态

Qwen-Omni 模型能够接收文本与单一其他模态（图片、音频、视频）的组合输入，并生成文本或语音形式的回复，提供多种拟人音色，支持多语言和方言的语音输出，可应用于文本创作、视觉识别、语音助手等场景。快速开始前提条件已配置 API ...

什么是AgentRun

什么是AgentRun？AgentRun立即体验 AgentRun是以高代码为核心，开放生态、灵活组装的一站式Agentic AI基础设施平台，为企业级Agentic 应用提供开发、部署与运维全生命周期管理。用一句话概括：AgentRun=面向智能体（Agent）应用的云原生...

最佳实践

1.什么是核心组件在使用 Assistant API 构建对话式应用时，一般需要管理以下几种核心对象：Assistant：大模型对话应用的“主体”，包括所使用的语言模型（model）、系统指令（instructions）、工具（tools）、名称（name）等。Thread：...

快速开始：Llama-3系列模型部署及微调

模型微调训练 PAI-Model Gallery为Meta-Llama-3-8B-Instruct模型配置了SFT和DPO两种微调算法，您可以通过开箱即用的方式对该模型进行微调。SFT监督微调 SFT训练算法支持使用JSON格式输入，每条数据由问题、答案组成，分别用"instruction"、...

SubmitVideoAnalysisTask-视频理解-提交异步任务

输入数据#资料一：视频分镜信息（视频各镜头的视觉描述信息）{videoAnalysisText}#资料二：视频ASR转录信息（未标注出说话者，可能有错误和遗漏，如果没有输入ASR，则忽略此信息）{videoAsrText}#输出格式直接输出视频剧情，不要输出其他...

Python SDK

模型与价格模型名称单价免费额度（注）cosyvoice-v3-plus 2元/万字符 2025年11月15日0点前开通阿里云百炼：2000字符 2025年11月15日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内 cosyvoice-v3-flash 1元/万字符 ...

设备使用物模型通信

开发语言 Link SDK使用示例 C Link SDK Extended 物模型开发 C（v4.x）物模型使用 C（v3.x）物模型编程 Android 物模型开发 Java 物模型开发 Python 物模型通信 Node.js 物模型开发 iOS 不支持物模型通信流程重要下述设备与物联网平台...

OpenAI兼容-Batch

pip3 install-U openai 适用范围北京地域支持的模型：文本生成模型：通义千问 Max、Plus、Flash、Turbo、Long 的稳定版本及其部分 latest 版本，以及 QwQ 系列（qwq-plus、qwq-32b-preview）和部分第三方模型（deepseek-r1、deepseek-v3...

Qwen-Deep-Research 深入研究模型

在第二步（深入研究）的API调用中，此参数用以传入模型在第一步（反问确认）中返回的澄清式问题，作为对话历史的一部分，从而引导模型进行更具针对性的分析。content string（可选）消息内容。role string（必选）固定为 assistant。output...

10分钟构建主动提问的智能导购

在 Prompt 框中进行修改，修改后的Prompt为：#知识库请记住以下材料，他们可能对回答问题有帮助。{documents} 请你选出最相似的三个产品。获取阿里云百炼应用ID 单击右上角的发布，即可通过API调用商品信息存储bot。在应用管理中可以...

知识库计费说明

本文含知识库的计费规则及示例，为规格选型...Q：知识库的数据量很大，旗舰版的平台存储空间也不够用，该怎么办？A：当平台存储无法满足需求时，您可通过自购 ADB-PG 进行拓展，具体配置方法请参见创建和使用知识库文档中的创建知识库章节。

LivePortrait 视频生成

LivePortrait模型，可基于通过LivePortrait-detect模型检测的人物肖像图片和人声音频文件，快速、轻量化地生成人像动态视频。本文档介绍了该模型提供的视频生成能力的API调用方法。重要本文档仅适用于“中国大陆（北京）”地域，且必须...

图像局部重绘

文档简介根据用户输入的原始图片、局部涂抹图和任意的文本描述，使用通义万相模型（wanx-x-painting），即可快速完成图像的二次创作。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。wanx-x-painting 模型...

CreateIndex-创建知识库

企业帮助文档库包括了公司制度、产品清单等重要资料。metaExtractColumns array object 否元数据提取配置。元数据是与非结构化数据内容相关的一系列附加属性，这些属性以 key-value 键值对的形式集成到文本切片中。更多信息，请参见知识...

GUI-Plus 界面交互专用模型

本文介绍通过 OpenAI 兼容接口或 DashScope API 调用GUI-Plus模型的输入与输出参数。相关文档：界面交互专用模型（GUI-Plus）OpenAI 兼容 SDK 调用配置的 base_url 为：https://dashscope.aliyuncs.com/compatible-mode/v1 HTTP 调用配置...

长上下文（Qwen-Long）

处理超长文本文档时，标准大型语言模型会因上下文窗口限制而失败。Qwen-Long 模型提供 1000 万 Token 的上下文长度，通过文件上传和引用机制处理大规模数据。说明本文档仅适用于中国大陆版（北京地域），需使用中国（北京）地域的 API Key...

用量监控与性能分析

阿里云百炼应用内部的多节点架构为后续开发带来诸多挑战，例如：追踪应用内部调用链路查看模型响应延时查看模型思考过程通过应用观测功能，您可端到端查看业务空间内阿里云百炼应用的处理流程（如向量生成、向量检索和大模型调用）...

数据挖掘（Qwen-Doc）

数据挖掘模型专门针对信息抽取、内容审核、分类打标和摘要生成任务进行设计。相比通用对话模型，该模型能够快速且精确地输出规范的结构化数据（如JSON格式），解决通用对话模型返回不规范回复结构或提取信息不够准确的问题。说明本文档仅...

查看和配置识别模板

通过创建子模型添加自定义识别模型在识别模型页签，找到目标内置识别模型或自定义识别模型，单击操作列的创建子模型。在创建子模型面板，配置模型参数，单击确定。参数中所属父模型和识别特征不可修改，可以添加一个补充特征，...

部署DeepSeek-R1系列模型

本文以部署DeepSeek-R1-Distill-Qwen-7B模型为例，演示如何使用数据缓存快速部署DeepSeek-R1系列模型。通过数据缓存提前拉取DeepSeek相关模型数据，然后在部署DeepSeek模型推理服务时直接挂载模型数据，可以免去在实例中拉取模型数据的等待...

字段信息抽取最佳实践

方案概览使用通义晓蜜CCAI-AIO对话分析进行字段信息抽取，只需几步：开通阿里云百炼服务：首先我们需要开通阿里云百炼服务，开通调用服务后才能测试模型体验、调用模型或应用体验服务。开通并创建通义晓蜜CCAI-AIO对话分析应用：通过阿里...

Kimi

本文档介绍如何在阿里云百炼平台通过OpenAI兼容接口或DashScope SDK调用Kimi系列模型。重要本文档仅适用于“中国大陆（北京）”地域。如需使用模型，需使用“中国大陆（北京）”地域的 API Key。模型介绍 Kimi 系列模型是由月之暗面公司...

高代码应用

控制台一直显示部署中（超过 5 分钟）或部署失败可能是什么原因？Python 后端程序的 GET/health 接口无法调用，导致百炼认为程序启动失败。Python 后端程序的入口文件必须为 main.py。可以前往高代码应用详情页的日志标签页，查看具体的...

部署DeepSeek-R1系列模型

本文以部署DeepSeek-R1-Distill-Qwen-7B模型为例，演示如何使用DataCache快速部署DeepSeek-R1系列模型。通过DataCache提前拉取DeepSeek相关模型数据，然后在部署DeepSeek模型推理服务时直接挂载模型数据，可以免去在Pod中拉取模型数据的...

客服服务质检最佳实践

方案概览使用通义晓蜜CCAI-AIO对话分析进行服务质检，只需几步：开通阿里云百炼服务：首先我们需要开通阿里云百炼服务，开通调用服务后才能测试模型体验、调用模型或应用体验服务。开通并创建通义晓蜜CCAI-AIO对话分析应用：通过阿里云百...