模型制作需要的工具-模型制作需要的工具文档介绍内容-移动阿里云

翻译能力（Qwen-MT）

Qwen-MT模型是基于Qwen3模型优化的机器翻译大语言模型，支持92个语种（包括中、英、日、韩、法、西、德、泰、印尼、越、阿等）互译，且提供了术语干预、领域提示、记忆库等能力，提升模型在复杂应用场景下的翻译效果。工作方式传入待翻译...

LivePortrait 图像检测

LivePortrait-detect模型，用于确认输入的人物肖像图片是否符合LivePortrait模型的输入规范。本文档介绍了该模型提供的图像检测能力的API调用方法。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。模型概览 ...

模型管理

Lindorm AI引擎提供了一系列RESTful风格的API，您可以调用这些API部署模型、管理已有模型、查看模型列表和指定模型的详细信息等。本文介绍如何通过RESTful API管理模型。部署模型您可以通过以下API接口部署预训练AI模型，对数据库内的数据...

管理模型资源

本文介绍在选择模型资源后，对应窗口的功能。前提条件已登录DataV-TwinFabric控制台。已进入精修模式下的场景编辑器页面。上传模型在资源管理窗口右上角，单击导入上传模型。在本地选择需要上传的模型后，单击打开。在资源管理窗口...

智能应用

模型调用配置在启用智能应用之前，您需要进行模型调用配置，包括选择模型服务提供商、配置调用模型所需的API Key等信息，并启用需要使用的模型。各智能应用可调用的模型均来源于此处配置。在Dataphin首页的顶部菜单栏，选择超级X 智能...

Qwen-MT 翻译模型

本文介绍通过 OpenAI 兼容接口或 DashScope API 调用 Qwen-MT 模型的输入与输出参数。相关文档：翻译能力（Qwen-MT）OpenAI 兼容北京地域 SDK 调用配置的 base_url 为：https://dashscope.aliyuncs.com/compatible-mode/v1 HTTP 调用配置...

文本与多模态向量化

向量化模型可将文本、图像、视频等数据转换为数值向量，用于语义搜索、推荐、聚类、分类、异常检测等下游任务。准备工作您需要已获取与配置 API Key 并配置API Key到环境变量。如果通过OpenAI SDK或DashScope SDK进行调用，还需要安装...

智能应用

模型调用配置在启用智能应用之前，您需要进行模型调用配置，包括选择模型服务提供商、配置调用模型所需的API Key等信息，并启用需要使用的模型。各智能应用可调用的模型均来源于此处配置。在Dataphin首页的顶部菜单栏，选择超级X 智能...

智能对话

模型名称：从AI搜索开放平台提供的大模型中选择需要使用的模型。当前支持以下四种模型，模型详情请参见通义千问大语言模型介绍。支持模型 OpenSearch-通义千问-Turbo（ops-qwen-turbo）以qwen-turbo大规模语言模型为模型底座，进行有监督...

AnimateAnyone 图像检测

API-Key，例如：Bearer d1*2a Bearer d1*2a model String Body 是指明需要调用的模型 animate-anyone-detect-gen2 input.image_url String Body 是需要检查的图像 URL URL 需为公网可访问的地址，并支持 HTTP 或 HTTPS 协议。您也可在此 ...

模型评测（ModelEval）

模型评测（ModelEval）是PAI平台提供的模型评估工具，用于全面、高效地评估大语言模型在特定或通用场景下的表现。您可以使用权威公开数据集或自定义业务数据集，量化分析模型的各项能力，为模型选型、微调优化和版本迭代提供数据支持。快速...

扫描上报和合并代码模型

但您需注意需要上报的模型是否依赖于别的模型，别的模型是否也需要上报。本文介绍如何在Tool Window中扫描上报和合并代码模型。背景信息 BizWorks Toolkit插件可以直接查看扫描后的结果和查看Diff，故不需要在扫描代码模型后到平台上确认...

流式输出

流式输出通过持续返回模型生成的文本片段，解决了这两个核心问题。工作原理流式输出基于 Server-Sent Events(SSE)协议。发起流式请求后，服务端与客户端建立持久化 HTTP 连接。模型每生成一个文本块（称为 chunk），立即通过连接推送。...

模型同步

同步模型信息如果您需要维护的模型数量不多，推荐直接在智作工坊控制台模型管理中上传维护模型。如果您已经在自有系统中维护过模型信息，可以参考本文档，以接口形式大规模同步模型信息。模型核心领域模型模型同步链路模型同步包括 ...

文字变形API详情

输入内容&效果示意输入文字(input.text)：桂林山水描述提示词(input.prompt)：山峦叠嶂、漓江蜿蜒、岩石奇秀返回结果：模型概览模型名模型简介 wordart-semantic WordArt锦书-文字变形可以对输入的文字边缘轮廓进行创意变形，根据提示...

通义万相-通用视频编辑

模型概览模型名称模型简介输出视频格式 wanx2.1-vace-plus 万相2.1专业版支持多模态输入，支持多图参考和视频编辑时长：最长5秒帧率：30 fps 格式：mp4（H.264 编码）模型效果模型功能输入参考图输入提示词输出视频多图参考 ...

召回定制分析器

定制召回模型按照存储容量、计算资源、模型训练收费，具体价格请参考计费概述快速搭建定制召回模型从创建到使用需要经过以下三个步骤：创建并训练模型；创建自定义分析器；配置自定义分析器；创建并训练模型在搜索算法中心召回配置 ...

EMO 图像检测

EMO-detect模型，用于确认输入的人物肖像图片是否符合EMO视频生成模型的输入规范。本文档介绍了该模型提供的图像检测能力的API调用方法。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。模型概览模型名模型...

视频口型替换-声动人像VideoRetalk

声动人像VideoRetalk是一个人物视频生成模型，可基于人物视频和人声音频，生成人物讲话口型与输入音频相匹配的新视频。重要本文档仅适用于“中国大陆（北京）”地域，需使用“中国大陆（北京）”地域的 API Key。模型概览模型效果示例 ...

StableDiffusion3.5 API详情

StableDiffusion文生图模型说明支持的领域/任务：aigc 调用模型后，因任务排队等原因，可能需要等几分钟才生成结果，此时任务状态为PENDING 相比于Stable Diffusion 1.5 和 Stable Diffusion XL 模型，最新开源的Stable Diffusion 3.5...

人物图像检测API详情

该模型非任务流程强制环节，可以根据业务需要自行选择是否接入。选择图像建议人脸数量：1个人脸，不支持多人脸、不支持无人脸图像；人脸质量：建议为正面人脸，面部大于128*128像素，无墨镜、手部等遮挡，不要有浓妆和过度美颜；图像质量...

文生图FLUX

立即申请（flux-merged）|立即申请（flux-dev）|立即申请（flux-schnell）模型概览模型名模型简介 flux-schnell 目前开源最先进的少步模型，不仅超越了同类竞争者，甚至还优于Midjourney v6.0和DALL·E 3(HD)等非精馏模型。该模型经过...

StableDiffusion1.5 API详情

模型概览模型名模型简介 stable-diffusion-xl stable-diffusion-xl相比于v1.5做了重大的改进，并且与当前开源的文生图SOTA模型midjourney效果相当。具体改进之处包括：更大的unet backbone，是之前的3倍；增加了refinement模块用于改善...

LivePortrait 视频生成

LivePortrait模型，可基于通过LivePortrait-detect模型检测的人物肖像图片和人声音频文件，快速、轻量化地生成人像动态视频。本文档介绍了该模型提供的视频生成能力的API调用方法。重要本文档仅适用于“中国大陆（北京）”地域，且必须...

wan2.2-s2v 视频生成

数字人wan2.2-s2v模型能基于单张图片和音频，生成动作自然的说话、唱歌或表演视频。音频驱动:通过输入的人声音频，驱动静态图片中的人物实现口型、表情和动作与音频同步。场景丰富:支持"说话"、"唱歌"、“表演”三种对口型场景人物形象...

AI试衣-Plus版

快速入口：在线体验｜AI试衣模型总览｜计费与限流｜免费额度｜新手API调用入门指南相关API：AI试衣-基础版｜AI试衣-图片精修｜AI试衣-图片分割模型能力多种服饰试穿单件上装试穿：模型随机生成下装，或保留模特原有下装。单件下装试穿...

批量推理

对于无需实时响应的推理场景，批量推理（Batch API）能异步处理大批量的数据请求，成本仅为实时推理的 50%，且接口兼容 OpenAI，适合执行模型评测、数据标注等批量作业。工作流程批量推理采用异步模式：提交任务：上传包含多个请求的文件...

AI试衣-基础版

AI试衣-基础版模型支持使用服饰平拍图片以及人物正面全身照，生成逼真的试衣效果图。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。快速入口：在线体验｜AI试衣模型总览｜计费与限流｜免费额度｜新手API调用...

AI试衣-图片精修

AI 试衣-图片精修是一个后处理模型，可增强 AI 试衣生成图片的真实感与清晰度。重要本文档仅适用于“中国大陆（北京）”地域，需使用“中国大陆（北京）”地域的 API Key。快速入口：在线体验｜AI试衣模型总览｜计费与限流｜免费额度｜API...

在控制台进行模型调优

如果您是因为模型训练效果不好需要再次训练某个模型，请选择自定义模型您需要二次训练的模型。支持的预置模型：模型名称模型代码 CPT全参训练（cpt）SFT全参训练（sft）SFT高效训练（efficient_sft）DPO全参训练（dpo_full）DPO高效训练...

三维模型常见问题

本文介绍在使用DataV城市三维场景构建器组件过程中，遇到三维模型相关的常见问题。为什么网上的三维模型那么便宜，买来的三维模型能不能用？网上很多售价非常低廉的三维城市模型，通常不是用来渲染三维实时引擎，而是用来离线渲染视频的。...

工具箱

分类器管理分类器：是一个支持多模板、多模型分类路由的工具。用户通过设定分类器中的关键词或训练样本建立分类标准，完成对于已发布的自定义模板、信息抽取模型的自动匹配。用户可在分类器发布后，仅通过分类器接口实现多种类型业务数据...

数据缓存概述

从流程可以看出，如果不使用数据缓存，会带来容器镜像过大的问题，并且如果要更新模型，则需要重新制作镜像，重复镜像版本发布、镜像缓存制作，应用部署等工作。如果使用数据缓存，将数据和镜像解耦，在要更新模型时，只需重新制作数据缓存...

数据缓存概述

从流程可以看出，如果不使用数据缓存，会带来容器镜像过大的问题，并且如果要更新模型，则需要重新制作镜像，重复镜像版本发布、镜像缓存制作，应用部署等工作。如果使用数据缓存，将数据和镜像解耦，在要更新模型时，只需重新制作数据缓存...

文本生成模型概述

文本生成模型能够基于输入的提示词（Prompt）创作出逻辑清晰、连贯的文本。文本生成模型所需的输入可以是简单的关键词、一句话概述或是更复杂的指令和上下文信息。模型通过分析海量数据学习语言模式，广泛应用于：内容创作：生成新闻报道、...

Python SDK

不同模型版本需要使用对应版本的音色：cosyvoice-v3-flash/cosyvoice-v3-plus：使用longanyang等音色。cosyvoice-v2：使用longxiaochun_v2等音色。cosyvoice-v1：使用longwan等音色。完整音色列表请参见音色列表。voice str 是语音合成所...

AI加速

Rapidformer（Transformer训练加速）一款PyTorch版的针对Transformer系列模型的训练优化工具，通过加速开关组合优化技术，优化PyTorch版Transformer模型的训练过程，提高训练速度和效率。更多信息，请参见训练加速（Rapidformer）概述。...

发布为组件

Amap Maps 和 QuickChart）接入到智能体应用中，作为大模型可调用的工具。请前往 MCP 简介了解更多信息。本例使用的 MCP 服务限时免费。测试效果：在对话框中输入“请你查询杭州的气温变化趋势”，智能体将输出一份气温折线图。工作流应用...

模型评测

支持的模型模型评测支持下列预置模型（包括基于它们调优后的模型）：通义千问-QwQ/Max/Plus/Turbo/Coder/Math 通义千问开源版（Qwen3、Qwen2.5、Qwen2、Qwen1.5）通义法睿第三方文本生成模型（abab6.5g、abab6.5t等）上述列表并不完整...

定制热词

热词数量限制每个账号可创建10个热词列表，如需扩容请进行申请每个热词列表可添加的热词个数因模型而异：Fun-ASR系列模型：fun-asr、fun-asr-2025-11-07模型：最多10000个其他模型：最多1000个 Paraformer系列模型：最多500个前提条件 ...