b端用户模型-b端用户模型文档介绍内容-移动阿里云

创建与删除模型

使用示例示例1：创建远程模型，使用已部署在PAI EAS的Qwen2.5-Omni-3B模型服务，指定模型可接受的INPUT输入参数为BINARY类型图片文件，用于执行图生文任务，完整示例请参考使用MaxCompute远程模型自动生成电商选品描述。CREATE MODEL PAI...

ChatLLM-WebUI版本发布详情

72b、qwen-1.8b、qwen7b-int4、qwen14b-int4、qwen7b-int8、qwen14b-int8、qwen-72b-int4、qwen-72b-int8、qwen-1.8b-int4和qwen-1.8b-int8模型。vLLM后端支持Qwen和ChatGLM1/2/3模型。Huggingface推理后端支持flash attention。ChatGLM...

工具精选

评测使用的模型：大语言模型：qwen3-235b-a22b-instruct-2507 Rerank模型：gte-rerank-v2 查询改写模型：qwen3-30b-a3b-instruct-2507 评测效果蓝色柱状图为直接使用模型Function Calling。橙色柱状图为使用工具精选（查询改写+Rerank+...

服务端事件

用户指南：模型介绍、功能特性和示例代码请参见实时语音识别-通义千问 error 当服务端检测到错误（包括客户端错误和服务端错误）时，向客户端发送的事件。参数类型说明 type string 事件类型。固定为 error。event_id string 事件ID。...

Function Calling

发起第一次模型调用应用程序首先向大模型发起一个包含用户问题与模型可调用工具清单的请求。接收模型的工具调用指令（工具名称与入参）若模型判断需要调用外部工具，会返回一个JSON格式的指令，用于告知应用程序需要执行的函数与入参。若...

OpenAPI MCP Server使用指南

建议使用阿里云百炼qwen3-235b-a22b模型。其中API密钥为百炼控制台创建的API Key，API地址为 https://dashscope.aliyuncs.com/compatible-mode/v1/ 。模型添加完成之后编辑模型，为模型配置联网、推理、工具等能力。配置MCP服务器。在 ...

实时多模态

Qwen-Omni-Realtime 是通义千问推出的一款实时音视频聊天模型。它能够同时理解流式的音频与图像输入（例如从视频流中实时抽取的连续图像帧），并实时输出高质量的文本与音频。在线体验请参见如何在线体验 Qwen-Omni-Realtime 模型？如何...

Python SDK

用户指南：模型介绍、功能特性和示例代码请参见实时语音识别-通义千问请求参数以下参数通过 OmniRealtimeConversation 的构造方法设置。参数类型是否必须说明 model str 是指定要使用的模型名称。callback OmniRealtimeCallback ...

Chatbox

Chatbox 是一款 AI 客户端应用和智能助手，您无需配置计算环境即可通过 Chatbox 与大模型进行对话。前提条件您需要获取API Key，并确保已开通阿里云百炼的模型服务；在模型列表选择您需要使用的文本生成模型。如果您是 RAM 用户，请...

新手入门

2.3 用户属性管理若企业有多个数据来源，同一个用户在“性别”特征上，表现为来源A是女性，来源B是男性。通过预置“性别”属性，将多个来源下的数据按照设置的冲突处理策略进行合并，便于后链路的营销应用。更多信息参见用户属性管理，...

Qwen-OCR 文字提取模型

本文介绍通过 OpenAI 兼容接口或 DashScope API 调用通义千问OCR 模型的输入与输出参数。相关文档：文字提取（Qwen-OCR）OpenAI 兼容北京地域 SDK 调用配置的 base_url 为：https://dashscope.aliyuncs.com/compatible-mode/v1 HTTP 调用...

模型监控

a22b-thinking-2507 qwen3-30b-a3b-thinking-2507、qwen3-30b-a3b-instruct-2507 监控模型运行开通模型调用服务后，阿里云百炼会自动在模型监控看板中添加以下 4 类监控指标：安全：识别对话中的违规内容，例如内容安全错误次数。...

在ACK异构机密计算集群中安全部署vLLM推理服务

大语言模型（LLM）推理涉及敏感数据和核心模型资产，在非可信环境中运行时会面临数据和模型泄露风险。ACK提供的机密AI解决方案（ACK Confidential AI，简称ACK-CAI），通过整合Intel TDX和GPU TEE等硬件机密计算技术，为模型推理提供端到端...

基于异构机密计算实例构建安全大语言模型推理环境

cd RAI_SAM_SDK_2.1.0-20240731/tools#加密模型./do_content_packager.sh 模型目录明文密钥密钥ID 其中：模型目录：待加密模型所在的目录，可以使用相对路径或绝对路径，例如~/.cache/modelscope/hub/models/Qwen/Qwen2.5-3B-Instruct/。...

限流

为了保证用户调用模型的公平性，阿里云百炼设置了基础限流。限流基于模型维度且与用户的阿里云主账号相关联，按照该账号下所有API-KEY调用该模型的总和计算限流。若超出限制，API请求将会失败，需等到解除限流条件时再次调用。限流规则主...

对搜索结果进行精排

在搜索业务中，仅靠关键词匹配（如使用Elasticsearch）召回的结果，往往无法最优地满足用户的真实意图，导致用户点击率和满意度不高。本文将向您展示如何利用 PolarDB for AI 的内置机器学习能力，通过分析用户历史行为数据（如点击、停留...

服务端事件

本文介绍 Qwen-TTS-Realtime API 的服务端事件。相关文档：实时语音合成-通义千问。服务端事件 error 不论是遇到客户端错误还是服务端错误，服务端都会响应该事件。参数类型说明 type string 事件类型，该事件下固定为 error。error ...

客户端事件

用户指南：模型介绍、功能特性和示例代码请参见实时语音识别-通义千问 session.update 用于更新会话配置，建议在 WebSocket 连接建立后首先发送该事件。建议在WebSocket连接建立成功后，立即发送此事件作为交互的第一步。如果未发送，系统...

联网搜索

启用后，模型将判断用户问题是否需要联网查询：若需要，则结合搜索结果回答；若不需要，则直接使用模型自身知识回答。以 OpenAI 与 DashScope 的 Python SDK 核心调用代码为例，介绍如何启用联网搜索功能。OpenAI 兼容#导入依赖与创建客户...

UpdateMemory-更新长期记忆体

我的大模型应用$APP_ID关于B用户的长期记忆体返回参数名称类型描述示例值 object Schema of Response requestId string 请求 ID。6a71f2d9-f1c9-913b-818b-11402910xxxx 示例正常返回示例 JSON 格式 {"requestId":"6a71f2d9-f1c9-913...

a3b qwen3-14b qwen3-8b qwen3-4b qwen3-1.7b qwen3-0.6b qwen2.5-14b-instruct-1m qwen2.5-7b-instruct-1m qwen2.5-72b-instruct qwen2.5-32b-instruct qwen2.5-14b-instruct qwen2.5-7b-instruct qwen2.5-3b-instruct qwen2.5-1.5b-...

一键微调DeepSeek-R1蒸馏模型

支持的模型列表 PAI-Model Gallery支持六种蒸馏模型的LoRA监督微调训练，下表中给出了在默认参数和数据集的情况下，所推荐的最低配置：蒸馏模型基模型支持的训练方式最低配置 DeepSeek-R1-Distill-Qwen-1.5B Qwen2.5-Math-1.5B LoRA ...

DeepSeek

7B deepseek-r1-distill-qwen-14b 基于 Qwen2.5-14B deepseek-r1-distill-qwen-32b 基于 Qwen2.5-32B deepseek-r1-distill-llama-8b 基于 Llama-3.1-8B deepseek-r1-distill-llama-70b 基于 Llama-3.3-70B 最大思维链长度是模型在思考模式...

文本生成模型概述

用户消息（User Message）：用户向模型提出的问题或输入的指令。助手消息（Assistant Message）：模型的回复内容。调用模型时，需构造一个由上述消息对象构成的数组 messages。一个典型的请求通常由一条定义行为准则的 system 消息和一条...

服务端事件

本文介绍 qwen3-livetranslate-flash-realtime API 的服务端事件。相关文档：实时音视频翻译-通义千问。error 服务端返回的错误信息。event_id string 本次事件唯一标识符。{"event_id":"event_RoUu4T8yExPMI37GKwaOC","type":"error",...

Python SDK

用户指南：关于模型介绍和选型建议请参见实时语音合成-通义千问。前期准备 DashScope Python SDK 版本需要不低于1.25.2。快速开始 server commit模式 import os import base64 import threading import time import dashscope from ...

应用配置

语音合成：支持使用阿里云百炼的语音合成CosyVoice-v2大模型、Sambert语音合成模型、语音生成CosyVoice-v3大模型、语音生成CosyVoice-v3-plus大模型、通义千问-TTS模型、通义千问3-TTS模型、CosyVoice-v3-Flash大模型等。除系统音色外，还...

人物写真生成API详情

2）人物形象免训练trainfree模式【推荐】：同时上传一组包含用户正脸单人照（至少一张）和客户自定义风格模板，通过人物生成写真模型直接一键免训练极速生成人物写真照，仅支持客户自定义风格模板上传方式免训练trainfree生成写真。...

常见问题

图像API接口的通用问题汇总，包含接口调试、模型计费与限流、接口高频报错等。本文涉及的图像模型有：文生图V1和V2、涂鸦作画、图像局部重绘、Cosplay动漫人物生成、人像风格重绘、虚拟模特、鞋靴模特、图像画面扩展、人物实例分割、图像...

首次调用通义千问API

阿里云百炼支持通过API调用大模型，涵盖OpenAI兼容接口、DashScope SDK等接入方式。说明如果您已经熟悉大模型调用，也可以直接查看API参考文档通义千问。如果您不熟悉编程，可以参见 Chatbox，通过图形化界面与通义千问模型对话。本文以...

现代IM系统中的消息系统—架构

图中的例子中，消息发送方是A，消息接收方是B，同时B存在多个接收端，分别是B1、B2和B3。A向B发送消息，消息需要同步到B的多个端，待同步的消息通过一个Timeline来进行交换。A向B发送的所有消息，都会保存在这个Timeline中，B的每个接收端...

Java SDK

用户指南：关于模型介绍和选型建议请参见实时语音合成-通义千问。前期准备 DashScope Java SDK 版本需要不低于2.21.16。快速开始 server commit模式/Dashscope SDK 版本不低于2.21.16 import ...

物模型通信

设备上行数据，通过 thing_raw_post_data 向服务端发送自定义格式数据：def protocolToRawData(self,params):#command set payload_bytes=b'\x00'#id payload_bytes+b'\x00' payload_bytes+b'\x00' payload_bytes+b'\x00' payload_bytes+b'...

结构化输出

1756455080,"system_fingerprint":null,"model":"qwen-plus","id":"chatcmpl-624b665b-fb93-99e7-9ebd-bb6d86d314d2"} DashScope Python import os import dashscope#若使用新加坡地域的模型，请释放下列注释#dashscope.base_...

LLM大语言模型部署

步骤一：部署LLM服务以部署公共模型中的 Qwen3-8B 为例。说明公共模型是指已预置部署模板的模型，可一键部署，无需准备模型文件。如选择自定义模型，需通过对象存储OSS等方式挂载模型文件。登录 PAI控制台，在页面上方选择目标地域，并在...

错误信息

使用对话客户端（如Chatbox）或阿里云百炼控制台进行连续对话时，每次请求都会附带历史记录，容易超出模型限制。超出限制后，请开启新对话。Range of max_tokens should be[1,xxx]原因：max_tokens 参数设置未在[1,模型最大输出 Token 数]...

通义千问

模型介绍、选型建议和使用方法请参考文本生成模型概述。可通过 OpenAI 兼容或 DashScope 协议调用通义千问 API。OpenAI 兼容北京地域 SDK 调用配置的 base_url：https://dashscope.aliyuncs.com/compatible-mode/v1 HTTP 请求地址：POST ...

手动部署Stable Diffusion WebUI服务

提供FileBrowser插件，允许用户在桌面端上传和下载云端模型、图片；提供自研的ModelZoo插件，支持开源模型下载加速。部署形态 PAI SD WebUI支持以单机版、集群版或API版的形态进行部署，三者基于完全相同的部署流程。单机版：面向个人用户...

移动端Android Lite SDK

通过SDK对接通义大模型以及后端多种Agent，能够支持用户接入语音对话、天气、音乐、新闻等多种能力，并支持视频和图像的大模型对话能力。多模态实时交互服务架构前提条件开通阿里云百炼实时多模交互应用，获取 Workspace ID、APP ID 和 ...

Android SDK

用户指南：关于模型介绍和选型建议请参见语音合成-CosyVoice。模型与价格在资源与预算允许的情况下，优先选择 cosyvoice-v3-plus 获取最佳合成效果，对成本敏感时可选 cosyvoice-v3 平衡质量与价格，其余版本仅建议在兼容或低要求场景...