手工古建筑模型制作图及尺寸-手工古建筑模型制作图及尺寸文档介绍内容-移动阿里云

图像画面扩展

图像画面扩展（也称“扩图”）支持多种扩展方式，包括按宽高比扩图、按比例扩图、在上下左右四个方向添加像素扩图。这三种方式还可以结合旋转角度进行扩图。相关指南：图像画面扩展重要本文档仅适用于“中国大陆（北京）”地域，且必须...

涂鸦作画

根据手绘图加上任意文字描述，使用通义万相-涂鸦作画模型，即可轻松完成涂鸦作画。重要本文档仅适用于“中国大陆（北京）”地域，需使用“中国大陆（北京）”地域的 API Key。基本介绍通义万相-涂鸦作画通过手绘任意内容加文字描述，即可...

AI试衣-基础版

AI试衣-基础版模型支持使用服饰平拍图片以及人物正面全身照，生成逼真的试衣效果图。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。快速入口：在线体验｜AI试衣模型总览｜计费与限流｜免费额度｜新手API调用...

AI试衣-Plus版

1：默认值，与原图尺寸保持一致。1024：表示 576x1024 分辨率。1280：表示 720x1280 分辨率。说明若后续还需调用 AI试衣-图片精修API，此值必须设为-1。1 parameters.restore_face Bool Body 否是否还原模特图中的人脸。true：默认值，...

文本生成模型概述

文本生成模型能够基于输入的提示词（Prompt）创作出逻辑清晰、连贯的文本。文本生成模型所需的输入可以是简单的关键词、一句话概述或是更复杂的指令和上下文信息。模型通过分析海量数据学习语言模式，广泛应用于：内容创作：生成新闻报道、...

空间档案

精模建筑精模建筑模块用于查看通用精细建筑模型的信息和上传自定义模型内容，详情请参见精模建筑。筛选查看实体类型在空间档案页面中，您可以单击右上角的所有实体类型下拉列表，筛选所需的实体类型后，页面中会展示该类型所有相关...

界面交互

支持的模型模型名称上下文长度最大输入最大输出输入成本输出成本免费额度（注）（Token数）（每千Token）gui-plus 256,000 254,976 单图最大16384 32,768 0.0015元 0.0045元各100万Token 有效期：百炼开通后90天内快速开始本节将...

影视传媒视频理解

影视传媒视频理解轻应用支持借助视频处理、视频理解、大语言模型的串联能力，实现对视频里指定要点的理解和提取，并按要求生成指定类型的文案、提取标签、洞察分析等。重要影视传媒视频理解应用按实际调用模型对应的输入、输出Token以后...

通义万相-通用视频编辑

模型概览模型名称模型简介输出视频格式 wanx2.1-vace-plus 万相2.1专业版支持多模态输入，支持多图参考和视频编辑时长：最长5秒帧率：30 fps 格式：mp4（H.264 编码）模型效果模型功能输入参考图输入提示词输出视频多图参考 ...

Emoji 视频生成

表情包emoji-v1模型可基于人物肖像图片和预设模板ID，生成人脸表情包视频。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。模型概览模型名称模型简介 emoji-v1 输入通过检测的人物肖像图片、对应的人脸区域...

评测集

知识问答：适用于自动评测，通过提供问题、标准答案和关键词，利用大模型对应用输出结果的准确性进行自动打分和评估。评测集类型对话分析支持的文件格式：.xls、.xlsx。字段说明：字段说明 Prompt 用户的输入，通常是一个问题或一个...

GetProperties-获取配置信息

Name string 图片尺寸比例 1:1 Value string 图片尺寸像素 1024*1024 WanxiangImageStyleConfig array object 万相图片风格配置 WanxiangImageStyleConfig object Name string 风格名称默认 Pic string 风格图片地址 ...

通义万相-图像生成与编辑2.6

模型概览模型名称模型简介输出图像规格 wan2.6-image 万相2.6 image 支持图像编辑和图文混排输出图片格式：PNG。图像分辨率和尺寸请参见 size参数。说明调用前，请查阅各地域支持的模型列表与价格。前提条件您需要已获取与配置 API...

图像画面扩展

当需调整图片尺寸以适配特定布局，或在不裁剪主体的前提下拓宽视野时，可使用图像画面扩展模型。该模型支持多种扩图方式：指定宽高比扩图指定横向或纵向扩展比例自定义上下左右各方向扩展像素数同时支持先旋转再扩图重要本文档仅适用...

创建和使用知识库

配置通义千问使用知识库教程预置模型（阿里云百炼支持的标准模型）自定义模型（在阿里云百炼调优后的模型）通义千问-QwQ/Long/Max/Plus/Turbo/Coder/Deep-Research 通义千问VL-Max/Plus/Flash/OCR 通义千问-开源版（Qwen3、Qwen2.5、Qwen2...

多媒体分析

多媒体分析为您提供多媒体领域内的算法识别服务，包括基础模型服务和高级模型服务，为您提供开箱即用的算法服务能力。本文为您介绍多媒体分析相关计费说明和使用指导。背景信息多媒体分析支持的算法服务如下：基础模型服务：提供图像领域...

StableDiffusion1.5 API详情

您可以通过配置文本指令 prompt、负样指令 negative_prompt、尺寸 size 以及希望生成的图片数量 n，来确定希望生成图片的样式和数量；模型返回的是根据用户文本指令并避免负样指令的图片。模型概览模型名模型简介 stable-diffusion-xl ...

使用领域模型设计器

使用领域模型设计器，您可以直观地看到领域对象之间的关系，也可以通过图形化界面创建、编辑、删除领域对象以及将领域模型导出为图片。新增领域模型登录BizWorks，在选择平台下拉列表中选中建模平台。单击页面右上角图标或其文本框...

常见问题

本文涉及的图像模型有：文生图V1和V2、涂鸦作画、图像局部重绘、Cosplay动漫人物生成、人像风格重绘、虚拟模特、鞋靴模特、图像画面扩展、人物实例分割、图像擦除补全、创意海报生成、图像背景生成、图配文。本地调试接口图像API均支持...

保障离线在线一致性的CTR预估方案

本案例使用经典的CTR点击率预估数据集Avazu进行一体化模型训练，并将离线调试完成的归一化预测-独热编码预测-向量聚合-FM预测流程完整部署到EAS。您在线上环境进行模型预测时，也可以使用离线训练时的数据预处理和特征工程逻辑，以保障线...

建筑

建筑是三维城市构建器的基底图层，可配置选择L1和L2两种数据精度，本文以L2精度为例介绍建筑的样式和数据配置，包括建筑的阴影、发光强度和建筑类型等样式配置。建筑是程序化生成的几何增强的建筑体。本文介绍建筑配置项的含义。在场景编辑...

建筑

建筑是三维城市构建器的基底图层，可配置选择L1和L2两种数据精度，本文分别从L1和L2两种精度介绍建筑的样式和数据配置，包括建筑的阴影、发光强度和建筑类型等样式配置。建筑是程序化生成的几何增强的建筑体。本文介绍建筑配置项的含义。在...

建筑

建筑是三维城市构建器的基底图层，可配置选择L1和L2两种数据精度，本文分别从L1和L2两种精度介绍建筑的样式和数据配置，包括建筑的阴影、发光强度和建筑类型等样式配置。建筑是程序化生成的几何增强的建筑体。本文介绍建筑配置项的含义。在...

Chatbox

Chatbox 是一款 AI 客户端应用和智能助手，您无需配置计算环境即可通过 Chatbox 与大模型进行对话。前提条件您需要获取API Key，并确保已开通阿里云百炼的模型服务；在模型列表选择您需要使用的文本生成模型。如果您是 RAM 用户，请...

使用数据模型设计器

使用数据模型设计器，您可以直观地看到数据模型的主键、字段和模型之间的引用关系，也可以在图形化界面创建、编辑及删除数据模型。操作步骤登录BizWorks，在选择平台下拉列表中选中建模平台。单击页面右上角图标或其文本框区域，在...

Pipeline部署在线服务

Designer支持将一个包含数据预处理、特征工程、模型预测的离线数据处理pipeline，打包成一个Pipeline模型，并一键部署为EAS在线服务。使用限制仅支持Alink框架的算法组件（即左上角有紫色小点标识的组件）。所有需要部署的模型涉及的训练...

通义万相-文生图V2

通义万相-文生图模型基于文本生成图像，支持多种艺术风格与写实摄影效果，满足多样化创意需求。快速入口：在线体验（北京｜新加坡）｜通义万相官网｜文生图使用指南说明通义万相官网的功能与API支持的能力可能存在差异。本文档以API的...

PAI ArtLab LoRA模型训练实践

给图片添加标注您可以手动为每张图片添加对应的文字描述，但当图片数量非常大时，手动打标非常耗时耗力，此时您可以选择借助神经网络，完成对所有图片批量生成文本描述的工作，或者在Kohya中选择使用BLIP的图像打标模型，搭配手动微调，...

图像背景生成

通义万相-图像背景生成模型专为商品换背景而设计。您可以选择文本引导（通过输入中英文描述生成背景）、图像引导（使用现有图片作为背景参考），或同时结合这两种方式。此外，模型还支持使用边缘引导元素（即图像的增强边缘特征），可以...

模型介绍

仅在sv=4的时候支持random值角色引用(cref)不支持指定单张图片权重，仅支持图片URL 草稿模式(draft)不支持与tile/oref同时使用输出引用(oref)不支持指定多张图片，必须为图片URL V7模型不支持多提示词图片提示词最多使用20张垫图 ...

通义千问-图像翻译

通义千问-图像翻译模型（Qwen-MT-Image）可精准翻译图像中的文字，并保留原始排版。该模型还支持领域提示、敏感词过滤、术语干预等自定义功能。重要本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。模型概览效果...

模型管理

字段描述模型版本填写版本号，同模型下的版本号必须唯一基础模型选择基础模型版本是否设置为默认模型若是设置为默认模型，则会自动出现在最终用户的收藏内可使用角色指有权限使用该模型的角色版本介绍在其中可以添加针对于该...

文生图FLUX

图片生成以下示例展示了调用FLUX文生图模型对一个用户指令进行响应的代码。以下示例展示了调用 flux-schnell 模型API进行文生图的示例代码。如果要调用 flux-dev 模型，只需要修改 model 为"flux-dev"即可。说明需要使用您的api-key替换...

视频生成模型微调API参考

本文档提供通义万相图生视频模型微调的完整 API 参考。适用范围适用地域：本文档仅适用于“中国大陆（北京）”地域，且必须使用该地域的 API Key。开通账号权限：若使用阿里云子账号（RAM用户），需要为子账号授予模型调用、训练和部署...

AnimateAnyone 视频生成

AnimateAnyone模型，可基于AnimateAnyone-template模型生成的动作模板，以及通过AnimateAnyone-detect模型检测的人物图像生成人物动作视频。本文档介绍了该模型提供的视频生成能力的API调用方法。重要本文档仅适用于“中国大陆（北京）”...

图像编辑-通义千问

通义千问-图像编辑模型（Qwen-Image-Edit-Plus）支持多图输入和多图输出，可精确修改图内文字、增删或移动物体、改变主体动作、迁移图片风格及增强画面细节。快速开始本示例将演示如何使用 qwen-image-edit-plus 模型，根据3张输入图像和...

通义千问-文生图

通义千问-文生图模型（Qwen-Image）是一款通用图像生成模型，支持多种艺术风格，尤其擅长复杂文本渲染。模型支持多行布局、段落级文本生成以及细粒度细节刻画，可实现复杂的图文混合布局设计。快速入口：使用指南｜在线体验｜技术博客 ...

人像风格重绘

风格参考图图片分辨率：分辨率不小于 256*256，不超过 5760*3240,长宽比不超过 2:1。图片格式：JPEG，PNG，JPG，BMP，WEBP。图片大小：不超过10M。图像URL：支持公网可访问的 HTTP/HTTPS 地址，URL 中不能包含中文字符；支持传入Base64...

文生图StableDiffusion

文生图StableDiffusion模型目前针对开源社区的stable-diffusion-v1.5版本、stable-diffusion-xl版本、stable-diffusion-3.5-large系列进行了服务化支持。并且额外为了stable-diffusion-3.5-large系列模型做了中文prompt适配。Stable ...

管理界面功能说明

说明封面缩略图建议选择小尺寸的图片。完成外部资源参数配置后，单击对话框右下角的确定上传文件；单击取消即可取消上传。注意通过设计资产上传模型，目前只支持上传一个完整的嵌入式gltf模型文件或者glb模型文件，暂不支持分离的...