模型制作需要的工具

_相关内容

翻译能力(Qwen-MT)

Qwen-MT模型是基于Qwen3模型优化的机器翻译大语言模型,支持92个语种(包括中、英、日、韩、法、西、德、泰、印尼、越、阿等)互译,且提供了术语干预、领域提示、记忆库等能力,提升模型在复杂应用场景下的翻译效果。工作方式 传入待翻译...

LivePortrait 图像检测

LivePortrait-detect模型,用于确认输入的人物肖像图片是否符合LivePortrait模型的输入规范。本文档介绍了该模型提供的图像检测能力的API调用方法。重要 本文档仅适用于“中国大陆(北京)”地域,且必须使用该地域的 API Key。模型概览 ...

模型管理

Lindorm AI引擎提供了一系列RESTful风格的API,您可以调用这些API部署模型、管理已有模型、查看模型列表和指定模型的详细信息等。本文介绍如何通过RESTful API管理模型。部署模型 您可以通过以下API接口部署预训练AI模型,对数据库内的数据...

管理模型资源

本文介绍在选择模型资源后,对应窗口的功能。前提条件 已登录DataV-TwinFabric控制台。已进入精修模式下的场景编辑器页面。上传模型 在 资源管理 窗口右上角,单击 导入 上传模型。在本地选择需要上传的模型后,单击 打开。在资源管理窗口...

智能应用

模型调用配置 在启用智能应用之前,您需要进行模型调用配置,包括选择模型服务提供商、配置调用模型所需的API Key等信息,并启用需要使用的模型。各智能应用可调用的模型均来源于此处配置。在Dataphin首页的顶部菜单栏,选择 超级X 智能...

Qwen-MT 翻译模型

本文介绍通过 OpenAI 兼容接口 或 DashScope API 调用 Qwen-MT 模型的输入与输出参数。相关文档:翻译能力(Qwen-MT)OpenAI 兼容 北京地域 SDK 调用配置的 base_url 为:https://dashscope.aliyuncs.com/compatible-mode/v1 HTTP 调用配置...

文本与多模态向量化

向量化模型可将文本、图像、视频等数据转换为数值向量,用于语义搜索、推荐、聚类、分类、异常检测等下游任务。准备工作 您需要已 获取与配置 API Key 并 配置API Key到环境变量。如果通过OpenAI SDK或DashScope SDK进行调用,还需要 安装...

智能应用

模型调用配置 在启用智能应用之前,您需要进行模型调用配置,包括选择模型服务提供商、配置调用模型所需的API Key等信息,并启用需要使用的模型。各智能应用可调用的模型均来源于此处配置。在Dataphin首页的顶部菜单栏,选择 超级X 智能...

智能对话

模型名称:从AI搜索开放平台提供的大模型中选择需要使用的模型。当前支持以下四种模型模型详情请参见 通义千问大语言模型介绍。支持模型 OpenSearch-通义千问-Turbo(ops-qwen-turbo)以qwen-turbo大规模语言模型模型底座,进行有监督...

AnimateAnyone 图像检测

API-Key,例如:Bearer d1*2a Bearer d1*2a model String Body 是 指明需要调用的模型 animate-anyone-detect-gen2 input.image_url String Body 是 需要检查的图像 URL URL 需为公网可访问的地址,并支持 HTTP 或 HTTPS 协议。您也可在此 ...

模型评测(ModelEval)

模型评测(ModelEval)是PAI平台提供的模型评估工具,用于全面、高效地评估大语言模型在特定或通用场景下的表现。您可以使用权威公开数据集或自定义业务数据集,量化分析模型的各项能力,为模型选型、微调优化和版本迭代提供数据支持。快速...

扫描上报和合并代码模型

但您需注意需要上报的模型是否依赖于别的模型,别的模型是否也需要上报。本文介绍如何在Tool Window中扫描上报和合并代码模型。背景信息 BizWorks Toolkit插件可以直接查看扫描后的结果和查看Diff,故不需要在扫描代码模型后到平台上确认...

流式输出

流式输出通过持续返回模型生成的文本片段,解决了这两个核心问题。工作原理 流式输出基于 Server-Sent Events(SSE)协议。发起流式请求后,服务端与客户端建立持久化 HTTP 连接。模型每生成一个文本块(称为 chunk),立即通过连接推送。...

模型同步

同步模型信息 如果您需要维护的模型数量不多,推荐直接在 智作工坊控制台 模型管理 中上传维护模型。如果您已经在自有系统中维护过模型信息,可以参考本文档,以接口形式大规模同步模型信息。模型核心领域模型 模型同步链路 模型同步包括 ...

文字变形API详情

输入内容&效果示意 输入文字(input.text):桂林山水 描述提示词(input.prompt):山峦叠嶂、漓江蜿蜒、岩石奇秀 返回结果:模型概览 模型模型简介 wordart-semantic WordArt锦书-文字变形可以对输入的文字边缘轮廓进行创意变形,根据提示...

通义万相-通用视频编辑

模型概览 模型名称 模型简介 输出视频格式 wanx2.1-vace-plus 万相2.1专业版 支持多模态输入,支持多图参考和视频编辑 时长:最长5秒 帧率:30 fps 格式:mp4(H.264 编码)模型效果 模型功能 输入参考图 输入提示词 输出视频 多图参考 ...

召回定制分析器

定制召回模型按照存储容量、计算资源、模型训练收费,具体价格请参考 计费概述 快速搭建 定制召回模型从创建到使用需要经过以下三个步骤:创建并训练模型;创建自定义分析器;配置自定义分析器;创建并训练模型 在搜索算法中心 召回配置 ...

EMO 图像检测

EMO-detect模型,用于确认输入的人物肖像图片是否符合EMO视频生成模型的输入规范。本文档介绍了该模型提供的图像检测能力的API调用方法。重要 本文档仅适用于“中国大陆(北京)”地域,且必须使用该地域的 API Key。模型概览 模型模型...

视频口型替换-声动人像VideoRetalk

声动人像VideoRetalk是一个人物视频生成模型,可基于人物视频和人声音频,生成人物讲话口型与输入音频相匹配的新视频。重要 本文档仅适用于“中国大陆(北京)”地域,需使用“中国大陆(北京)”地域的 API Key。模型概览 模型效果示例 ...

StableDiffusion3.5 API详情

StableDiffusion文生图模型 说明 支持的领域/任务:aigc 调用模型后,因任务排队等原因,可能需要等几分钟才生成结果,此时任务状态为PENDING 相比于Stable Diffusion 1.5 和 Stable Diffusion XL 模型,最新开源的Stable Diffusion 3.5...

人物图像检测API详情

模型非任务流程强制环节,可以根据业务需要自行选择是否接入。选择图像建议 人脸数量:1个人脸,不支持多人脸、不支持无人脸图像;人脸质量:建议为正面人脸,面部大于128*128像素,无墨镜、手部等遮挡,不要有浓妆和过度美颜;图像质量...

文生图FLUX

立即申请(flux-merged)|立即申请(flux-dev)|立即申请(flux-schnell)模型概览 模型模型简介 flux-schnell 目前开源最先进的少步模型,不仅超越了同类竞争者,甚至还优于Midjourney v6.0和DALL·E 3(HD)等非精馏模型。该模型经过...

StableDiffusion1.5 API详情

模型概览 模型模型简介 stable-diffusion-xl stable-diffusion-xl相比于v1.5做了重大的改进,并且与当前开源的文生图SOTA模型midjourney效果相当。具体改进之处包括:更大的unet backbone,是之前的3倍;增加了refinement模块用于改善...

LivePortrait 视频生成

LivePortrait模型,可基于通过LivePortrait-detect模型检测的人物肖像图片和人声音频文件,快速、轻量化地生成人像动态视频。本文档介绍了该模型提供的视频生成能力的API调用方法。重要 本文档仅适用于“中国大陆(北京)”地域,且必须...

wan2.2-s2v 视频生成

数字人wan2.2-s2v模型能基于 单张图片和音频,生成动作自然的说话、唱歌或表演视频。音频驱动:通过输入的人声音频,驱动静态图片中的人物实现口型、表情和动作与音频同步。场景丰富:支持"说话"、"唱歌"、“表演”三种对口型场景 人物形象...

AI试衣-Plus版

快速入口:在线体验|AI试衣模型总览|计费与限流|免费额度|新手API调用入门指南 相关API:AI试衣-基础版|AI试衣-图片精修|AI试衣-图片分割 模型能力 多种服饰试穿 单件上装试穿:模型随机生成下装,或保留模特原有下装。单件下装试穿...

批量推理

对于无需实时响应的推理场景,批量推理(Batch API)能异步处理大批量的数据请求,成本仅为实时推理的 50%,且接口兼容 OpenAI,适合执行模型评测、数据标注等批量作业。工作流程 批量推理采用异步模式:提交任务:上传包含多个请求的文件...

AI试衣-基础版

AI试衣-基础版模型支持使用服饰平拍图片以及人物正面全身照,生成逼真的试衣效果图。重要 本文档仅适用于“中国大陆(北京)”地域,且必须使用该地域的 API Key。快速入口:在线体验|AI试衣模型总览|计费与限流|免费额度|新手API调用...

AI试衣-图片精修

AI 试衣-图片精修是一个后处理模型,可增强 AI 试衣生成图片的真实感与清晰度。重要 本文档仅适用于“中国大陆(北京)”地域,需使用“中国大陆(北京)”地域的 API Key。快速入口:在线体验|AI试衣模型总览|计费与限流|免费额度|API...

在控制台进行模型调优

如果您是因为模型训练效果不好需要再次训练某个模型,请选择 自定义模型需要二次训练的模型。支持的预置模型模型名称 模型代码 CPT全参训练(cpt)SFT全参训练(sft)SFT高效训练(efficient_sft)DPO全参训练(dpo_full)DPO高效训练...

三维模型常见问题

本文介绍在使用DataV城市三维场景构建器组件过程中,遇到三维模型相关的常见问题。为什么网上的三维模型那么便宜,买来的三维模型能不能用?网上很多售价非常低廉的三维城市模型,通常不是用来渲染三维实时引擎,而是用来离线渲染视频的。...

工具

分类器管理 分类器:是一个支持多模板、多模型分类路由的工具。用户通过设定分类器中的关键词或训练样本建立分类标准,完成对于已发布的自定义模板、信息抽取模型的自动匹配。用户可在分类器发布后,仅通过分类器接口实现多种类型业务数据...

数据缓存概述

从流程可以看出,如果不使用数据缓存,会带来容器镜像过大的问题,并且如果要更新模型,则需要重新制作镜像,重复镜像版本发布、镜像缓存制作,应用部署等工作。如果使用数据缓存,将数据和镜像解耦,在要更新模型时,只需重新制作数据缓存...

数据缓存概述

从流程可以看出,如果不使用数据缓存,会带来容器镜像过大的问题,并且如果要更新模型,则需要重新制作镜像,重复镜像版本发布、镜像缓存制作,应用部署等工作。如果使用数据缓存,将数据和镜像解耦,在要更新模型时,只需重新制作数据缓存...

文本生成模型概述

文本生成模型能够基于输入的提示词(Prompt)创作出逻辑清晰、连贯的文本。文本生成模型所需的输入可以是简单的关键词、一句话概述或是更复杂的指令和上下文信息。模型通过分析海量数据学习语言模式,广泛应用于:内容创作:生成新闻报道、...

Python SDK

不同模型版本需要使用对应版本的音色:cosyvoice-v3-flash/cosyvoice-v3-plus:使用longanyang等音色。cosyvoice-v2:使用longxiaochun_v2等音色。cosyvoice-v1:使用longwan等音色。完整音色列表请参见 音色列表。voice str 是 语音合成所...

AI加速

Rapidformer(Transformer训练加速)一款PyTorch版的针对Transformer系列模型的训练优化工具,通过加速开关组合优化技术,优化PyTorch版Transformer模型的训练过程,提高训练速度和效率。更多信息,请参见 训练加速(Rapidformer)概述。...

发布为组件

Amap Maps 和 QuickChart)接入到智能体应用中,作为大模型可调用的工具。请前往 MCP 简介 了解更多信息。本例使用的 MCP 服务限时免费。测试效果:在对话框中输入“请你查询杭州的气温变化趋势”,智能体将输出一份气温折线图。工作流应用...

模型评测

支持的模型 模型评测支持下列 预置模型(包括基于它们 调优后的模型):通义千问-QwQ/Max/Plus/Turbo/Coder/Math 通义千问开源版(Qwen3、Qwen2.5、Qwen2、Qwen1.5)通义法睿 第三方文本生成模型(abab6.5g、abab6.5t等)上述列表并不完整...

定制热词

热词数量限制 每个账号可创建10个热词列表,如需扩容请进行申请 每个热词列表可添加的热词个数因模型而异:Fun-ASR系列模型:fun-asr、fun-asr-2025-11-07模型:最多10000个 其他模型:最多1000个 Paraformer系列模型:最多500个 前提条件 ...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用