手工制作建筑模型图-手工制作建筑模型图文档介绍内容-移动阿里云

Dify

Dify 是一个开源的大模型应用开发平台，您可以基于阿里云百炼提供的模型 API 来构建大模型应用。前提条件您需要获取API Key，并确保已开通阿里云百炼的模型服务。1.配置模型 1.1.安装模型供应商前往 Dify 市场，在模型下找到通义千问...

数学能力（Qwen-Math）

阿里云百炼提供的 Qwen-Math 系列模型具备强大的数学推理和计算能力，模型提供详细的解题步骤，便于理解和验证。说明推荐使用最新的 Qwen3 通用模型替代 Qwen-Math 模型，后者仍基于 Qwen2.5 模型。本文档仅适用于中国大陆版（北京地域）...

模型列表

内置模型模型ID 模型名称模型类别模型描述 clip 通用图片转向量模型-512维图片向量化通用的图片转向量模型，可支持图搜图、文本搜图场景，输出向量维度512维。clip_ecom 电商增强图片转向量模型-512维图片向量化基于电商场景图片...

地标建筑

环境贴图：您可以输入图片的URL地址或单击图片区域内的更改上传图片，也可以单击图片区域删除当前图片后再次单击上传本地图片作为模型的背景贴图。强度您可以拖动滑块调整模型的2环贴图境强度，数值越大，亮度越大。开关打开开关，显示...

地标建筑

环境贴图：您可以输入图片的URL地址或单击图片区域内的更改上传图片，也可以单击图片区域删除当前图片后再次单击上传本地图片作为模型的背景贴图。强度您可以拖动滑块调整模型的2环贴图境强度，数值越大，亮度越大。开关打开开关，显示...

通义晓蜜CCAI-对话分析AIO计费项变更通知

调整内容新增计费类型：本次调整后，语音识别能力通过API接入方式实现离线语音转译服务将进行收费：离线语音识别：0.33元/小时新增图片识别能力，通过通义晓蜜-VLMax模型实现图片文字识别、总结、推理，该服务的API接入将进行收费。...

通义万相-图生视频-视频特效

表格图片设置为块元素（独占一行），居中展示，鼠标放在图片上可以点击查看原图*/.unionContainer.markdown-body.image.break{ margin:0px;display:inline-block;vertical-align:middle }/*让表格显示成类似钉钉文档的分栏卡片*/table.help...

视频生成

阿里云百炼提供多样化的视频模型选择，涵盖文生视频、图生视频（通用/舞蹈/唱演/播报等）、视频编辑（通用/视频风格重绘/视频口型替换）等应用场景。模型总览类别说明文生视频文生视频：一句话生成视频，视频风格丰富，画质细腻。图生...

知识库配额与限制

图片问答类知识库：目前只支持multimodal-embedding-v1模型。向量维度 text-embedding-v4：512维 text-embedding-v3：512维 text-embedding-v2：1536维 multimodal-embedding-v1：1024维以上向量维度不支持更改。检索类别描述上限检索...

计量计费

FLUX文生图模型 计费单元模型服务计费单元 FLUX文生图模型 张计费单价模型名称计费单价 flux-schnell 目前仅供免费体验，免费额度用完后不可调用，推荐访问文本生成图像获取替代方案。flux-dev flux-merged 免费额度模型名称免费...

图像内容风控解决方案

基于PAI提供的预训练模型，针对自己的图像风控场景，在可视化建模平台Designer上进行模型微调，从而基于Resnet50构建图像分类模型或目标检测模型。将模型部署至EAS，形成完整的端到端流程，从而自动识别生产过程中的风险内容。方案架构 ...

AI试衣OutfitAnyone

快速入口：在线体验｜计费与限流｜免费额度相关API：AI试衣-基础版｜AI试衣-Plus版｜AI试衣-图片精修｜AI试衣-图片分割模型概览模型分类模型服务模型名称核心功能适用场景试衣模型 AI试衣-基础版 aitryon 快速生成试衣效果图。...

AnimateAnyone 图像检测

模型概览模型名模型简介 animate-anyone-detect-gen2 animate-anyone-detect-gen2是一个图像检测模型，专门用于检测输入的图片是否满足animate-anyone-gen2模型所需的人物图像规范。效果示例人物图像检测通过示例人物全身照人物半身照...

模型上架与更新

时间模型规格功能说明图像编辑 2025-12-23 qwen-image-edit-plus-2025-12-15 通义千问图像编辑发布的最新快照模型，相较于上一版本提升了角色一致性、工业设计能力和几何推理能力，并优化了编辑后的图片与原图在空间布局、纹理和风格上...

节省计划与资源包

大语言模型推理资源包订购地址大语言模型推理资源包qwen-plus 大语言模型推理资源包qwen-max 大语言模型推理资源包qwen-turbo 适用模型 qwen-plus及qwen-plus-latest 的实时推理服务（非思考模式）qwen-max及qwen-max-latest 的实时推理...

计量计费

StableDiffusion文生图模型 计费单元模型服务计费单元 StableDiffusion文生图模型 张计费单价模型名称计费单价 stable-diffusion-xl 目前仅供免费体验。免费额度用完后不可调用，推荐参考文本生成图像获取替代方案 stable-diffusion...

SAM自动图片分割和预标注

本文为您介绍如何使用Model Gallery部署Grounded-SAM模型，并利用它进行图片分割和标注。背景信息 Grounded SAM模型是一个最强的零样本视觉应用，它可以通过文本输入，检测、分割和生成任何图像。它是由IDEA领衔的中国专业团队打造的，基于...

EMO 图像检测

EMO-detect模型，用于确认输入的人物肖像图片是否符合EMO视频生成模型的输入规范。本文档介绍了该模型提供的图像检测能力的API调用方法。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。模型概览模型名模型...

三维模型常见问题

主流三维模型的类型包括以下几种：手工模型 模型种类说明通用三维模型（游戏、影视用途）常规三维建模软件有3dmax、maya和c4d等可以用于产出模型。通常包括丰富细节的几何体和精美的贴图。此类模型是最常见的三维模型，通常不要求与真实...

AIGC设计（ArtLab）

模型 PAI ArtLab模型广场内置400+个已授权开源的优质微调模型，支持用户一键添加到我的模型，按需选择模型生成图片，同时也支持本地上传模型。模型广场与我的模型模块包含的所有模型均可以被热门工具调用，一键生图。工作流工作流广场...

图片分类

在Model Gallery中，您可以选择直接部署开源的预训练图片分类模型，或针对定制化场景，使用自己的数据集对预训练模型进行微调训练，并使用微调训练模型将图片分类成定制化的类别。本文为您介绍如何使用Model Gallery执行图片分类任务。前提...

PAI ArtLab 模型使用说明

效果图（左侧为原图，右侧为模型处理后图片）：模型广场说明模型来源模型广场展示的模型、图片素材等均由第三方提供，您需阅读模型详情并同意遵守第三方提出的各项要求，才可正式开启使用。PAI ArtLab不对其导致您的不良结果或潜在风险...

服务概览

图片内容解析图片内容理解服务：基于多模态大模型对图片内容进行解析理解以及文字识别，解析后的文本可用于图片检索、问答场景。图片文本识别服务：OCR图片文本识别，识别后的文本可用于图片检索问答场景。文档切片提供通用文本切片服务...

PAI ArtLab Stable Diffusion WebUI

操作步骤本文以使用 Stable Diffusion（共享版）的文生图功能生成图片，并基于该图片继续生成新的图片为例进行说明。步骤一：文生图登录 PAI ArtLab，鼠标悬停右上角，选择华东2（上海）区域。在工具箱页面，单击 Stable Diffusion...

上传文件获取临时URL

使用限制文件与模型绑定：文件上传时必须指定模型名称，且该模型须与后续调用的模型一致，不同模型无法共享文件。此外，不同模型对文件大小有不同限制，超出限制将导致上传失败。文件与主账号绑定：文件上传与模型调用所使用的 API Key ...

图像生成训练

通过对原始图片素材进行训练，支持DCGAN、WGAN-GP、LSGAN、GGAN、PGGAN和StyleGAN图像生成模型网络，可生成高质量和多样化的图像生成模型。支持的计算资源 DLC 输入/输出输入桩通过读OSS数据组件，读取训练数据所在的OSS路径。配置此...

多模态向量

AVI,MOV（仅支持URL）其他多模态模型中/英文 JPG,PNG,BMP(支持URL或Base64)MP4,MPEG,MOV,MPG,WEBM,AVI,FLV,MKV（仅支持URL）接口支持单段文本、单张图片或单个视频文件的上传，也允许不同类型组合（如文本+图片），部分模型支持同类型内容...

AI搜索开放平台介绍

图片解析服务针对架构图、分析图表等图片数据，提供图片内容理解服务，可基于多模态大模型对图片内容进行解析理解以及文字识别，也可基于OCR能力对图片文字进行识别，将文字信息提取出来，用于图片检索及问答等场景。文档切片服务提供...

DeepSeek

本文档介绍如何在阿里云百炼平台通过OpenAI兼容接口或DashScope SDK调用DeepSeek系列模型。重要本文档仅适用于中国大陆版（北京地域）。模型列表 deepseek-v3.2、deepseek-v3.2-exp与deepseek-v3.1（可通过参数控制回复前是否思考）以上为...

文本与多模态向量化

接口支持单段文本、单张图片或单个视频文件的上传，也允许不同类型组合（如文本+图片），部分模型支持同类型内容的多个输入（如多张图片），请参考具体模型的限制说明。北京模型名称向量维度文本长度限制图片限制视频片限制单价（每...

通义千问-图像翻译

通义千问-图像翻译模型（Qwen-MT-Image）可精准翻译图像中的文字，并保留原始排版。该模型还支持领域提示、敏感词过滤、术语干预等自定义功能。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。模型概览效果...

OCR文档自学习概述

功能简介 OCR文档自学习，是面向“无算法基础”的企业与个人开发者用户，通过全流程可视化操作，支持用户完成模板配置、数据处理&标注、模型构建&训练、部署发布等操作的一站式工具平台。本平台采用少样本训练、智能预标注，视觉-语义联合...

图像编辑-通义千问

通义千问-图像编辑模型（Qwen-Image-Edit-Plus）支持多图输入和多图输出，可精确修改图内文字、增删或移动物体、改变主体动作、迁移图片风格及增强画面细节。快速开始本示例将演示如何使用 qwen-image-edit-plus 模型，根据3张输入图像和...

虚拟模特

模型版本模型名称模型简介虚拟模特（V1版本）wanx-virtualmodel 支持真人实拍图上传生成的图片短边：512像素或1024像素虚拟模特V2（V2版本）virtualmodel-v2 支持真人、人台实拍图上传生成的图片短边为：1024像素或2048像素支持改变...

自定义模型

.result.embeddings[*].embedding"} } 参数说明参数名称描述 modelName 模型名称 modelType 模型类型，支持配置以下4种 text_embedding：文本稠密模型 text_sparse_embedding：文本稀疏向量模型 image_embedding：图片向量模型 ...

数据湖构建（DLF）

自定义模型：用户可根据自身需求自定义模型，在向量检索版页面模型列表自定义模型中进行新增模型操作，详情请参见自定义模型。图片数据类型数据类型：图片。数据来源：OSS对象存储、Base64编码和DLF-Object Table。OSS对象存储：...

通义千问

模型介绍、选型建议和使用方法请参考文本生成模型概述。可通过 OpenAI 兼容或 DashScope 协议调用通义千问 API。OpenAI 兼容北京地域 SDK 调用配置的 base_url：https://dashscope.aliyuncs.com/compatible-mode/v1 HTTP 请求地址：POST ...

PAI ArtLab Kohya

训练过程中会生成代码，其中，loss值是用于衡量模型预测与实际结果差异的关键指标，一般不同类型的模型loss值不同，参考值如下：模型类型 loss值人物模型 0.06-0.09 实物模型 0.07-0.09 风格模型 0.08-0.13 功能模型 0.003-0.05 步骤四：...

通义千问-图像编辑

通义千问-图像编辑模型（qwen-image-edit-plus）支持多图输入和多图输出，可精确修改图内文字、增删或移动物体、改变主体动作、迁移图片风格及增强画面细节。快速入口：使用指南|技术博客|在线体验模型概览多图图像修改展示器.qwen-image...

快速开始

人物形象训练lora方式说明：人物形象训练lora方式流程图：关于该接口功能的示例图如下：输入图像生成结果（商务写真）预设风格模板客户自定义模板：输入图像自定义模板生成结果人物形象免训练trainfree方式说明：人物形象免训练...