在线tts语音合成-在线tts语音合成文档介绍内容-移动阿里云

模型上架与更新

实时语音合成-通义千问 语音合成 2025-09-22 qwen3-tts-flash、qwen3-tts-flash-2025-09-18 通义最新的离线语音合成大模型，不仅拥有17种高表现力的拟人音色，且能低延迟高稳定地合成音频；同时支持多种语言、方言。语音合成-通义千问实时...

产品优势

效果逼真在本地端实现了基于Knowledge-Aware Neural TTS(KAN-TTS)语音合成技术，基于深度神经网络和机器学习，将文本转换成真实饱满、抑扬顿挫、富有表现力的语音，使得离线语音合成效果趋近于在线合成效果。同样的语音合成声音定制的...

iOS SDK

TTS_EVENT_CANCEL 取消语音合成。TTS_EVENT_PAUSE 语音合成暂停。TTS_EVENT_RESUME 语音合成恢复。TTS_EVENT_ERROR 语音合成发生错误。onNuiTtsLogTrackCallback：SDK内部日志回调（2.6.4版本新增）。SDK内部日志回调。param level:大于此...

iOS SDK

本文档提供了语音合成Sambert iOS SDK的详细使用指南，帮助您将文本转换为高质量、富有表现力的语音。用户指南：关于模型介绍和选型建议请参见 语音合成-Sambert。在线体验：暂不支持。快速开始获取API Key：获取API Key 说明当需要为...

语音播报最佳实践

各系统语音播报方式及限制一览系统方式限制安卓消息透传+TTS语音合成 只能通过阿里云自有通道实现，无法使用厂商通道。设备在线时才能收到语音播报，对于离线通知/消息，设备重新上线时能收到语音播报。建议增加时效检查与多条消息...

智能语音交互

智能语音交互（Intelligent Speech Interaction），是基于语音识别、语音合成、自然语言理解等技术，为企业在多种实际应用场景下，赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中，包括智能问答、智能质检、法庭...

计费项

支持服务语音识别：录音文件识别、实时语音识别、一句话识别 语音合成：语音合成 语音分析：说话人识别、声音事件检测、性别识别、语种识别语音识别：录音文件识别、实时语音识别、一句话识别、录音文件识别（极速版）、录音文件识别（闲...

iOS SDK（旧版）

语音合成 语音合成即将文本转化为语音。我们支持多个说话人声音，支持PCM/WAV/MP3格式输出，示例实现了基于PCM的语音合成和播放。调用步骤说明请使用Embedded Binaries方式导入SDK到工程中。导入NlsSdk中的AliyunNlsClientAdaptor.h、...

iOS SDK

本文档提供了语音合成CosyVoice iOS SDK的详细使用指南，帮助您将文本转换为高质量、富有表现力的语音。用户指南：关于模型介绍和选型建议请参见 语音合成-CosyVoice。模型与价格在资源与预算允许的情况下，优先选择 cosyvoice-v3-plus ...

功能发布记录

优化无 语音合成 支持离线语音合成免费试用及自助接入用户可以免费试用5个标准版离线语音合成SDK和5个精品版离线语音合成SDK 支持购买商用版SDK，永久授权。新增离线语音合成产品详情开通授权模型更新增加艾飞、艾伦2个直播-视频配音...

Android SDK（旧版）

关键接口 NlsClient：语音处理客户端，利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全，建议全局仅创建一个实例。SpeechSynthesizer：代表一次语音合成请求。SpeechSynthesizerCallback：语音...

接口说明

长文本语音合成功能提供了将超长文本（如千字或者万字）合成为语音二进制数据的功能。返回语音合成产品详情页计费和并发限制异步长文本语音合成仅提供商用版，不支持试用，详情请参见试用版和商用版。要使用该功能，请开通商用版，详情...

语音&智能VUI

语音合成服务默认服务 TTS音色模板：可以根据自己需求选择音色模板，可以参考具体音色。通过大模型音色列表可以查询目前支持的大模型音色列表注意：大模型音色的voice参数在外呼机器人中，默认在音色列表中的voice对应的值前加上...

实时语音合成（CosyVoice）

阿里云实时语音合成(CosyVoice)可将文本实时转换为流畅、自然的人声。本文系统阐述了其API接口技术规范，助您快速为应用构建生动、自然的语音交互能力。

非开发者使用指南

语音合成（文字转语音）在 语音合成 处单击去配置，选择声音后，在右侧文本框输入文字，单击右下角扬声器按钮开始合成，完成后单击确认使用。五、免费试用功能简介服务能力免费试用期间权益试用期过后如何继续使用语音识别上传文件...

接口说明

长文本语音合成功能提供了将超长文本（如千字或者万字）合成为语音二进制数据的功能。说明 语音合成产品详情页仅提供大部分音色试听，若详情页没有您想要的音色试听，请通过接口文档进行调用试听。接口文档请参见 Java SDK、C++ SDK。计费...

HarmonyOS Next SDK

TTS_EVENT_CANCEL 取消语音合成。TTS_EVENT_PAUSE 语音合成暂停。TTS_EVENT_RESUME 语音合成恢复。TTS_EVENT_ERROR 语音合成发生错误。可通过 getparamTts("error_msg")获得详细错误消息。onTtsDataCallback：合成数据回调。合成数据回调，...

iOS SDK

SDK关键接口 startStreamInputTts：开始运行流式TTS/*与服务端完成建链，并开始流式语音合成任务*@param ticket：json string形式的初始化参数，参见下方说明。param parameters：json string形式的初始化参数，参见下方说明。param ...

Android SDK

本文档提供了语音合成Sambert Android SDK的详细使用指南，帮助您将文本转换为高质量、富有表现力的语音。用户指南：关于模型介绍和选型建议请参见 语音合成-Sambert。在线体验：暂不支持。快速开始获取API Key：获取API Key，为安全起见...

接口说明

语音合成为您提供将输入文本合成为语音二进制数据的功能。本文档介绍了当前目录下各SDK文档的通用信息。返回语音合成产品详情页计费和并发限制 语音合成提供试用版和商用版两种计费模式，详情请参见试用版和商用版。如果您需要将试用版...

tts-realtime、qwen-tts-realtime-latest、qwen-tts-realtime-2025-07-15 语音合成（Qwen-TTS）：qwen3-tts-flash、qwen3-tts-flash-2025-09-18、qwen-tts、qwen-tts-latest、qwen-tts-2025-05-22、qwen-tts-2025-04-10 实时语音识别...

计费定价FAQ

本文汇总了您在使用智能语音交互产品中关于计费相关的常见问题。录音文件识别所有的调用都会计费，还是只有识别成功的才会...语音识别和语音合成调用如果出错是否计费？请求的状态码如果是2xx，则正常计费，其他状态码如4xx或者5xx不会计费。

产品更新动态

语音算法服务拆分为语音合成与语音识别描述：将大模型场景与小模型场景中【语音&VUI】的语音算法能力拆分成语音合成和语音识别服务配置，方便客户对ASR和TTS的自定义选择。大模型场景支持第三方语音ASR识别服务描述：大模型场景支持第三...

简介与SDK代码示例

重要 CosyVoice声音复刻产生的语音，只能在 语音合成CosyVoice大模型中使用，请勿在其它语音合成中使用，否则会合成失败。服务调用方式：声音复刻服务当前仅支持通过调用API方式使用。计费说明声音复刻为免费服务，复刻成功后，使用文字...

Python SDK

在服务器上运行请将此开关关闭 PLAY_REALTIME_RESULT=True if PLAY_REALTIME_RESULT:import pyaudio test_text=["流式文本语音合成SDK，","可以将输入的文本","合成为语音二进制数据，","相比于非流式语音合成，","流式合成的优势在于实时...

Android SDK

TTS_EVENT_CANCEL 取消语音合成。TTS_EVENT_PAUSE 语音合成暂停。TTS_EVENT_RESUME 语音合成恢复。TTS_EVENT_ERROR 语音合成发生错误。可通过 getparamTts("error_msg")获得详细错误消息。onTtsDataCallback：合成数据回调。合成数据回调，...

iOS SDK

功能是否支持一句话识别是实时语音识别是 语音合成 是实时长文本语音合成 是流式文本语音合成 是离线语音合成 否录音文件识别极速版是唤醒及命令词否听悟实时推流是解压ZIP包，将ZIP包中的nuisdk.framework添加到您的工程中...

智能语音合成服务及服务改进计划协议

您在使用商业版智能语音合成服务时，您应当阅读并遵守本《智能语音合成服务及服务改进计划协议》（以下称“本协议”）。在接受本协议之前，请您务必仔细阅读本协议的全部内容，特别是免除或者限制责任的条款、使用您上传数据的授权以及管辖...

话术配音

语音合成 语音合成也称作文本转语音（TTS），支持从声音类型、声音风格、音量、语速维度进行偏好设置。登录智能联络中心控制台。在左侧导航栏，选择小模型通信智能联络机器人话术管理。在话术管理页面，单击话术或话术右上角的配置，...

数字人服务SSML使用指南

本文介绍虚拟数字人开放平台提供的3D、2D流媒体服务和视频合成服务中如何使用阿里云智能语音合成服务的SSML标记语言。1.使用方式 1.1 数字人流媒体服务中使用在 SendMessage API 中的 SpeechText直接传入SSML文本重要目前3D数字人流媒体...

ALIYUN:NLS:Project

SpeechRecognitionAndSynthesisAndAnalysis：语音识别+语音合成+语音分析。DeviceSDKSolution：设备端解决方案。SpeechSynthesisOnly：语音合成 Description String 否否项目描述。无 SdkType String 否否 SDK类型。取值：...

Android SDK

功能是否支持一句话识别是实时语音识别是 语音合成 是实时长文本语音合成 是流式文本语音合成 是离线语音合成 否录音文件识别极速版是唤醒及命令词否听悟实时推流是解压ZIP包，在 app/libs 目录下获取AAR格式的SDK包，将AAR...

应用场景

语音合成 智能客服提供多行业多场景的智能客服语音合成能力。提高解答效率，提升客户满意度，降低呼叫中心人工成本。智能设备为智能家居、音箱、车载和可穿戴设备等赋予一个最有温度的声音。文学有声阅读让富有感染力的声音为您讲故事、...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是 语音合成 是实时长文本语音合成 是流式文本语音合成 是离线语音合成 否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是 语音合成 是实时长文本语音合成 是流式文本语音合成 是离线语音合成 否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

Web SDK 发布说明

开启语音合成成功 OnStartTtsSuccess（见被调接口 64）。开启语音合成失败 OnStartTtsFailed（见被调接口 65）。语音合成结果 OnTtsResult（见被调接口 66）。录制相关。录制默认参数调整（见主调接口 3、21）。如果 recordTotalStream=0，...

从这里开始

智能语音交互产品基于语音识别、语音合成、自然语言理解等技术，实现“能听、会说、懂你”式的智能人机交互体验，适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。本文为您介绍如何使用智能语音交互，帮助您快速了解其使用...

AI Chat 应用语音转文字功能启用指南

步骤一：创建阿里云智能语音交互语音识别项目进入阿里云智能语音交互，并开通服务进入阿里云智能语音交互-全部项目，创建项目创建项目，选择“语音识别+语音合成+语音分析”或“仅语音识别”。进入项目，记录下 appkey，根据需要修改...

实时语音合成-通义千问

实时语音合成-通义千问提供低延迟、流式文本输入与流式音频输出能力，提供多种拟人音色，支持多语种/方言合成，可在同一音色下输出多语种，并能自适应调节语气，流畅处理复杂文本。核心功能实时生成高保真语音，支持中英等多语种自然发声 ...

Android SDK

stopStreamInputTts:停止语音合成/*停止语音合成，等待接收完所有合成数据直到STREAM_INPUT_TTS_EVENT_SYNTHESIS_COMPLETE。return：参见错误码:https://help.aliyun.com/document_detail/459864.html。public synchronized int ...