在线tts语音合成-在线tts语音合成文档介绍内容-移动阿里云

文字转语音（阿里云智能语音交互）

音色：可在阿里云智能语音交互文档中查看可选音色，若音色不存在将无法播放阿里云智能语音交互-流式语音合成-接口说明。音量：1~100，用于控制语音的音量。语速：500~500，用于控制语音的语速。语调：500~500，用于控制语音的语调。回调...

Python SDK

sample_rate=24000,volume=50,speech_rate=0,pitch_rate=0,ex:dict=None,)waitForComplete：以阻塞的方式等待语音合成结束，并与服务端断开websocket连接"""等待语音合成结束"""def waitForComplete(self)回调函数说明 Python回调函数在...

3D数字人视频合成用户指南

3.1.1 语音合成的编辑功能文本输入框集成了语音合成的编辑器功能，可在该编辑器中对语音合成进行人工的调整，例如标注多音字、标注文本读法、标注数值读法等，详见下表。同时文本输入框集成了情绪化音色的编辑能力，可在编辑器中选中某段...

Java SDK

示例：SpeechSynthesizerListener listener=new SpeechSynthesizerListener(){/接收语音合成的语音二进制数据@Override public void onMessage(ByteBuffer message){/在这里实现细节 }/语音合成结束@Override public void onComplete...

启动通话及个性参数配置

工作流覆盖参数 enableIntelligentSegment Bool 智能断句开关 asrConfig ARTCAICallAgentAsrConfig 语音识别配置 ttsConfig ARTCAICallAgentTtsConfig 语音合成配置 llmConfig ARTCAICallAgentLlmConfig 大语言模型配置 avatarConfig ...

启动通话及个性参数配置

工作流覆盖参数 enableIntelligentSegment Bool 智能断句开关 asrConfig ARTCAICallAgentAsrConfig 语音识别配置 ttsConfig ARTCAICallAgentTtsConfig 语音合成配置 llmConfig ARTCAICallAgentLlmConfig 大语言模型配置 avatarConfig ...

iOS SDK

TTS_EVENT_CANCEL 取消语音合成。TTS_EVENT_PAUSE 语音合成暂停。TTS_EVENT_RESUME 语音合成恢复。TTS_EVENT_ERROR 语音合成发生错误。调用步骤初始化SDK和播放组件。根据业务需要设置参数。调用nui_tts_play进行播放。在合成数据回调中，...

回调 API

参数说明参数类型说明 event ISDRTtsEvent 状态，详见代码中的枚举 taskid NSString 任务 ID code int 代码 TTS 合成数据-(void)onNuiTtsUserdataCallback:(NSString*)info infoLen:(int)info_len buffer:(char*)buffer len:(int)len ...

SubmitAvatarVideoTask-提交合成视频任务

接口说明该接口是针对有定制化视频合成样式的需求使用，正常的视频合成任务请直接使用：提交 3D 文本合成视频任务、提交 3D 语音合成视频任务、提交 2D 文本合成视频任务、提交 2D 语音合成视频任务即可。调试您可以在OpenAPI Explorer中...

WebSocket协议说明

本文介绍如何使用智能语音交互流式文本WebSocket协议使用语音合成。如果您不希望引入阿里云智能语音交互产品SDK，或者目前提供的SDK不能满足您的要求，可以基于本文描述自行开发代码访问阿里语音服务。前提条件在使用WebSocket协议对接...

Java SDK

本文介绍如何使用智能语音交互流式文本语音合成的Java SDK，包括SDK的安装方法及SDK代码示例等。前提条件在使用SDK之前，请先阅读接口说明。下载安装从Maven服务器下载最新版本的SDK nls-sdk-java-demo+flowingtts+3.zip。dependency ...

Java SDK

流式合成TTS。首包延迟计算。说明：该示例和nls-example-tts下的SpeechSynthesizerLongTextDemo不完全相同，长文本语音合成是单独的产品功能，是将一长串文本直接发送给服务端去合成，*而SpeechSynthesizerLongTextDemo演示的是将一长串...

接口说明

长文本语音合成功能提供了将超长文本（如千字或者万字）合成为语音二进制数据的功能。并且支持通过SSML添加背景音、停顿并修正读音。计费和并发限制 CosyVoice长文本语音合成仅提供商用版，不支持试用，详情请参见试用版和商用版。要使用...

实时语音合成交互流程

用户指南：关于模型介绍和选型建议请参见实时语音合成-通义千问 qwen-tts 的交互流程采用 WebSocket 持久连接+事件驱动响应机制，支持客户端实时输入文本并持续接收语音流。交互模型支持两种使用模式：ServerCommit 模式：服务端智能判断...

含UI集成方案

语音合成（文字转语音）：预置阿里云通义的产品能力。采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、...

智能任务

智能配音不区分 0.0035元/次计费规则：语音合成的计费调用次数按照每次请求传入的字符数（UTF-8编码，一个汉字、英文字母、全半角标点符号均算一个有效字符）作为统计依据；100个字符内（含100个）记为1次计费调用；每超过100个字符增加1...

含UI集成方案

语音合成（文字转语音）：预置阿里云通义的产品能力。采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、...

含UI集成方案

语音合成（文字转语音）：预置阿里云通义的产品能力。采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、...

模型功能动态

用量与性能观测 6月3日 语音合成 语音合成cosyvoice-v2支持SSML SSML（Speech Synthesis Markup Language，语音合成标记语言）不仅能指定语音合成读什么内容，还能精细控制其朗读方式，包括断句分词、发音、语速、停顿、语调、音量等语音...

2D数字人视频合成用户指南

文本输入框集成了语音合成的编辑器功能，可在该编辑器中对语音合成进行人工的调整，例如标注多音字、标注文本读法、标注数值读法等，详见下表。功能子功能备注操作方法多音/弹出浮层高亮多音字，逐一标注文本人名姓氏自动匹配、连续...

Java SDK

}/流式文本语音合成结束@Override public void onSynthesisComplete(StreamInputTtsResponse response){/调用onSynthesisComplete时，表示所有TTS数据已经接收完成，所有文本都已经合成音频并返回。System.out.println("name:"+response....

Java SDK

}/流式文本语音合成结束@Override public void onSynthesisComplete(StreamInputTtsResponse response){/调用onSynthesisComplete时，表示所有TTS数据已经接收完成，所有文本都已经合成音频并返回。System.out.println("name:"+response....

数据概览

数据统计图数据统计图包括：大模型调用量、文本质检字符数（包括实文本质检以及语音质检）、语音质检时长（包括实时语音质检和离线语音质检）。同时支持7/15/30天内时间维度筛选。计费统计计费统计显示近7天的大模型调用总量、实时文本...

界面化的TTS下载工具

如果您已配置语音合成服务，单击右侧测试文本框的 语音合成，直接输入文字，试听并下载。如果您还没有配置语音合成服务，单击 语音合成 模块内的去配置。选择语音合成模型。设置基础参数。在测试文本框内输入不超过300字符的文字。...

快速开始

}/流式文本语音合成结束@Override public void onSynthesisComplete(StreamInputTtsResponse response){/调用onSynthesisComplete时，表示所有TTS数据已经接收完成，所有文本都已经合成音频并返回。System.out.println("name:"+response....

AI实时互动场景

易接入、易调试：您可以将AI组件（如语音转文字、大模型、语音合成、自研向量数据库等）以插件的形式整合到工作流中，从而迅速开展业务，并在此过程中便捷地对整体技术方案进行调试。高度拟人化：阿里云通过持续迭代和优化智能降噪、智能...

AI实时互动场景

易接入、易调试：您可以将AI组件（如语音转文字、大模型、语音合成、自研向量数据库等）以插件的形式整合到工作流中，从而迅速开展业务，并在此过程中便捷地对整体技术方案进行调试。高度拟人化：阿里云通过持续迭代和优化智能降噪、智能...

配置语音和图片识别

在对话框中填写项目名称，项目类型选择为语音识别+语音合成+语音分析或仅语音识别，单击确定。在跳转的项目详情页面，单击复制保存 appkey，同时可修改语音识别模型的配置信息以满足不同需求。具体操作，请参见管理项目。步骤二：...

AI实时互动概览

易接入、易调试：您可以将AI组件（如语音转文字、大模型、语音合成、自研向量数据库等）以插件的形式整合到工作流中，从而迅速开展业务，并在此过程中便捷地对整体技术方案进行调试。高度拟人化：阿里云通过持续迭代和优化智能降噪、智能...

回复节点

目前支持编辑纯文本（包括中文、英文、标点符号等等），也支持编辑JSON...SSML合成表示SSML是控制语音合成节奏和发音的语法，详见 SSML标记语言介绍。API接入情况如果用户的机器人使用 API 接入，那么在这里只需要关注回传哪些参数变量即可。

产品计费

以上费用包括智能外呼控制台、语音识别、语音合成及基础自然语言处理（NLP）对话能力（仅当使用外呼画布时）。另外，支持对接智能对话机器人（云小蜜），以使用更多高级NLP能力，详情请垂询钉钉群：29130028336。提供预付费并发计算器，在...

通义晓蜜CCAI-对话分析AIO计费项变更通知

调整内容新增计费类型：本次调整后，语音识别能力通过API接入方式实现离线语音转译服务将进行收费：离线语音识别：0.33元/小时新增图片识别能力，通过通义晓蜜-VLMax模型实现图片文字识别、总结、推理，该服务的API接入将进行收费。...

2025年07月12日V6.1.9产品更新

优化离线语音质检分析描述：离线语音质检分析以及对应的相关AP支持返回通话者角色信息。ASR模型支持方言等能力描述：需要对带有方言内容对语音进行质检，可以在新建质检任务时，在选择完质检方案后，然后在语言模型中选择其对应的方言...

智能语音交互试用服务及服务改进计划协议

2.5 您承诺因使用本服务中的语音合成服务，所取得的任何产出或成果（包括但不限于：音频文件等），仅限于您个人使用，不得用于任何商业目的，且不得自行或透过他人以任何方式或载体向第三方披露、提供、转发或传播。三、服务内容阿里云将...

3D播报数字人接入指南

3D播报数字人（对应开放平台的“咨询播报”场景）是虚拟数字人开放平台提供能够支持用户通过发送文本让3D数字人进行播报的实时文本驱动数字人产品能力，目前平台支持播报阿里云的智能语音合成的SSML标记语言，可以支持多音字、读手机号、读...

语音播报

客户端在接收到传入的文本内容后，即刻启动语音合成技术，将文本转化为语音并进行播报，使得信息以语音形式清晰传达给用户。应用场景在智能家居设备应用场景中，如智能家具设备，用户通过手机应用或语音助手对智能家居设备发出指令后，如...

数字人平台发音人列表

本文档为您介绍虚拟数字人开放平台支持的智能语音合成的声音列表。详细的声音列表也可以从虚拟数字人开放平台控制台的资产中心查看，并支持在线调节与试听。多情感（荐）名称 Voice值描述支持的情感（emotion category）试听知哲 ...

应用场景

智能语音交互智能语音交互是基于语音识别、语音合成、自然语言理解等技术，为企业在多种实际应用场景下，赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中，包括智能问答、智能质检、法庭庭审实时记录、实时演讲...

自动化测试

仅上传文本文本测试集适用于没有音频数据，只有文本语料数据的场景，我们会通过语音合成帮您合成相应的音频数据构造标注好的测试集。要求如下：请上传1个文本文件，仅支持TXT格式（UTF-8无BOM编码）。请不要携带标点符号，每行不超过300字...

C++ Demo

如果传入的文本没有采用UTF-8编码，在文本中含有中文字符时，语音合成SDK调用start函数会失败，返回错误信息 Socket recv failed,errorCode:0。错误码为0表示服务端已经关闭了连接，此时应检查传入的文本是否采用UTF-8编码。