在线配音合成-在线配音合成文档介绍内容-移动阿里云

计费概述

✅ ✅ ✅ 模板成片（基础、高级、官方模板）-✅ ✅ ✅ 视频模板智能字幕生成-✅ ✅ ✅ 智能生成字幕智能配音合成-✅ ✅ ✅ 智能配音合成 绿幕抠图-✅ ✅ ✅ 绿幕抠图实景抠图-✅ ✅ ✅ 实景抠图智能生产（10+能力）-❌ ✅ ✅ 智能生产 ...

产品功能发布记录

2024年8月发布时间模块功能名称功能描述 8月7日数字人新增功能及往期功能优化 2D离线合成新增文档导入功能，支持上传ppt、pdf格式文件。文字图层增加花字样式，且文字图层的位置支持在画布中的拖动移动。增加铺满屏幕的预置水印，...

API概览

GetMediaProducingJob 查询剪辑合成作业获取剪辑合成作业的详细信息，包括剪辑合成任务的任务状态、时间线、模板及数据等。SubmitLiveEditingJob 提交直播剪辑任务直播剪辑指将一个或多个直播流区间合成为成品。提交直播剪辑任务后，任务...

音频处理

{"AudioTracks":[{"AudioTrackClips":[{"MediaId":"b3f37e05512043f49f697f7425b9*"}]}]} 视频静音＋完整音频混音视频静音＋完整音频混音指将原视频静音后重新配音，合成新的视频，是一个典型的配音场景。示例如下：所有与音频处理相关的...

开通授权

本文介绍如何开通离线语音合成标准版/精品版，购买、配置并激活对应的SDK授权。背景信息离线语音合成提供了商业版SDK，包含标准版/精品版两种声音品质，您可以根据使用场景及设备性能状况选择合适的版本。精品版音质更好；但如果设备性能...

SDK和API概览

移动端鸿蒙Next SDK 一句话识别、实时语音识别、录音文件识别极速版、语音合成、长文本语音合成离线移动端iOS SDK 离线语音合成离线移动端Android SDK 离线语音合成服务端 Java SDK 一句话识别、实时语音识别、录音文件识别、录音文件...

常见问题

数字人离线视频合成，详见文档：数字人离线合成openAPI；数字人实时互动，详见文档：数字人实时互动openAPI。合成一个视频大概需要多久时间？视频合成速率目前大概在1:2，即1分钟视频预计2分钟左右可以合成完毕。数字人支持什么语种？2D...

产品优势

效果逼真在本地端实现了基于Knowledge-Aware Neural TTS(KAN-TTS)语音合成技术，基于深度神经网络和机器学习，将文本转换成真实饱满、抑扬顿挫、富有表现力的语音，使得离线语音合成效果趋近于在线合成效果。同样的语音合成声音定制的...

什么是智能语音交互

离线语音合成在弱网或无网状态下，通过设备本地的语音合成模型，将文本转换成自然流畅的语音。目前有多种音色可供选择，并提供调节语速、语调、音量等功能。适用于车载导航、智能硬件、文学有声阅读和无障碍播报等场景。以SDK的方式集成，...

错误码查询

请确认相关配置购买的实例是离线视频合成服务，调用了在线流媒体服务接口如果想要使用离线视频合成服务请参考：数字人视频合成开发指南；或者重新下单实时流媒体实例 10010040 请求缺少uniqueCode 需要回调的接口需要传入对应的...

Android SDK

本文介绍了如何使用阿里云离线语音合成服务提供的Android NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 ...

智能语音交互SDK合规配置指引（鸿蒙）

SDK功能及相关个人信息功能采集个人信息字段个人信息采集目的功能配置方案及示例语音离线唤醒和离线语音合成设备型号用于离线功能的统计和计费无 SDK合规初始化配置方案/*向服务端发起交互请求*@param vad_mode:多种模式，对于识别...

计费方式

标准版离线语音合成SDK 1~10000个 5元可使用标准版离线语音合成语音包 10001~50000个 4元 50001~100000个 3元 100001~200000个 2.5元 200001-500000个 2元精品版离线语音合成SDK 1~10000个 10元可使用精品版离线语音合成语音包 10001~...

动态与公告

2023年3月25日尊敬的用户您好，2D数字人视频创作、2D数字人离线视频合成等产品北京时间3月25～27日在做系统维护，此段时间内公测用户暂时无法使用，申请公测的用户审批将暂缓到28日，特此通知，感谢各位对虚拟数字人的支持与厚爱。...

iOS SDK

本文介绍了如何使用阿里云离线语音合成服务提供的iOS NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 AccessKey ...

Android SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是解压ZIP包，在 app/libs 目录下获取AAR格式的SDK包，将AAR...

接口说明

离线语音合成是指在弱网或无网状态下，通过设备本地的语音合成模型，将文本转换成自然流畅的语音。产品体验更多合成效果可至离线语音合成产品详情页进行体验。功能介绍离线语音合成主要包括以下功能，暂不支持多实例调用。提供语速调节...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

功能发布记录

新增离线语音合成产品详情开通授权模型更新增加艾飞、艾伦2个直播-视频配音声音增加知飞、知伦2个超高清场景声音增加ava美式英语声音新增无引擎更新支持英文SSML标签中的say-as标签新增 SSML标记语言介绍 SDK更新 SDK从原本采样...

常见普通模板Config示例

[{"Sys_Type":"ArrayItems","Sys_ArrayObject":"$VideoArray","Sys_Template":{"MediaId":"$MediaId","Effects":[{"Type":"Volume","Gain":"0"}]} }]}]} 视频静音＋完整音频混音视频静音＋完整音频混音指将原视频静音后重新配音，合成新的...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

离线语音合成使用问题

本文为您介绍离线语音合成的常见问题和解答。合成初始化失败通常有哪些原因？常见鉴权失败情况有哪些？初始化成功但是播报失败该如何处理？回调数据长度和时间对应关系是怎样的？配额消耗的规则是什么？一个Deviceid一天可以注册几次？如果...

iOS SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是解压ZIP包，将ZIP包中的nuisdk.framework添加到您的工程中...

地域和域名

语种识别支持暂不支持暂不支持语音合成短文本语音合成支持支持支持长文本语音合成支持暂不支持暂不支持离线语音合成支持支持支持 SDK及 API使用 Java SDK 支持仅修改域名仅修改域名 C++ SDK 支持仅修改域名仅修改域名 ...

Android SDK

https://help.aliyun.com/zh/ram/developer-reference/sts-sdk-overview //STS Python SDK调用示例：https://help.aliyun.com/zh/ram/developer-reference/use-the-sts-openapi-example // //账号需求说明:/若使用离线功能(离线语音合成、...

Android SDK

https://help.aliyun.com/zh/ram/developer-reference/sts-sdk-overview //STS Python SDK调用示例：https://help.aliyun.com/zh/ram/developer-reference/use-the-sts-openapi-example // //账号需求说明:/若使用离线功能(离线语音合成、...

iOS SDK

https://help.aliyun.com/zh/ram/developer-reference/sts-sdk-overview //STS Python SDK调用示例：https://help.aliyun.com/zh/ram/developer-reference/use-the-sts-openapi-example // //账号需求说明:/若使用离线功能(离线语音合成、...

接口说明

语音合成提供将输入文本合成为语音二进制数据的功能。功能介绍 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求，NUI SDK既能够提供全链路的语音能力，同时可做原子能力SDK进行使用，并保持接口的统一。语音合成功能支持...

SDK FAQ

duration":2959}} 语音合成关注首包延迟，即从发送合成请求开始，到收到第一个语音包为止，消耗的时间。日志中搜索关键字 send，找到这条日志和紧随其后的一条收到语音包的日志。记录的时间差即为SDK端记录的首包延时。如下日志延时为...

错误码查询

语音合成/长文本语音合成错误码状态码状态消息原因解决方案 40000001 Gateway:ACCESS_DENIED:No privilege to this voice!设置了错误的发音人名称。请参考官网文档，设置正确的发音人。40000004 Gateway:IDLE_TIMEOUT:Websocket ...

DeleteTemplate-删除模板

接口说明模板工厂是对剪辑合成时间线的一个封装，用户可以把常用的时间线定义成模板，当有同样的需求出现时，只需要传入关键参数及素材即可生产视频。使用普通模板，请参考：普通模板快速入门使用高级模板，请参考：高级模板创建及使用 ...

GetTemplate-获取模板信息

接口说明模板工厂是对剪辑合成时间线的一个封装，用户可以把常用的时间线定义成模板，当有同样的需求出现时，只需要传入关键参数及素材即可生产视频。使用普通模板，请参考：普通模板快速入门使用高级模板，请参考：高级模板创建及使用 ...

通过API进行视频剪辑

通过时间线剪辑并合成视频调用 ProduceEditingProjectVideo-视频合成接口，直接指定时间线，即Timeline数据。在绝大多数场景下，使用这种方式即可。通过云剪辑工程剪辑并合成视频通过云剪辑工程ID进行媒体合成的方式，适用于对云剪辑...

时间戳功能介绍

时间戳功能又叫字级别音素边界接口，该时间信息可用于驱动虚拟人口型、做视频配音字幕等。功能概述实时长文本语音实时合成服务的时间戳是将大段的文本切分为多个句子，以每句话为单位，与音频一起流式的输出该句子的时间戳和该句话中每个...

话术配音

为话术内容配音是话术配置的最后一步，目前有在线录音、单个录音文件上传、从录音文件列表中选择录音文件以及语音合成4种配音方式。文本为您介绍不同的话术配音方式。上传录音登录智能联络中心控制台。在左侧导航栏，选择小模型通信 ...

媒体生产（云剪辑）

高级剪辑功能名称描述多轨音视频叠加或混音音、视频轨道多于1个时的叠加情况，如多轨音频混音、多轨视频叠加合成、音频轨和视频轨叠加合成等，如配音、画中画等情况。特效提供了丰富多样的特效效果，详情请参见特效效果示例。转场 ...

视频剪辑

通过时间线-发起剪辑合成调用ProduceEditingProjectVideo接口，生成通过时间线-发起剪辑合成的示例。绝大多数场景下，使用这种方式即可合成视频。阿里云OpenAPI门户地址：ProduceEditingProjectVideo。调用示例如下：说明通过时间线实现...

2D数字人视频合成接入指南

使用流程：视频合成服务是离线进行视频合成，所以流程是先提交视频合成任务，得到任务TaskUuid，然后拿着TaskUuid调用查询视频合成服务信息查询API，查询任务状态（这里需要轮询或者接收数字人回调事件通知，轮询周期最小间隔1s，建议3s）...

3D数字人视频合成接入指南

使用流程：视频合成服务是离线进行视频合成，所以流程是先提交视频合成任务，得到任务TaskUuid，然后拿着TaskUuid调用查询视频合成服务信息查询API，查询任务状态（这里需要轮询或者接收数字人回调事件通知，轮询周期最小间隔1s，建议3s）...