在线语音合成器-在线语音合成器文档介绍内容-移动阿里云

计费项

支持服务语音识别：录音文件识别、实时语音识别、一句话识别 语音合成：语音合成 语音分析：说话人识别、声音事件检测、性别识别、语种识别语音识别：录音文件识别、实时语音识别、一句话识别、录音文件识别（极速版）、录音文件识别（闲...

iOS SDK（旧版）

语音合成 语音合成即将文本转化为语音。我们支持多个说话人声音，支持PCM/WAV/MP3格式输出，示例实现了基于PCM的语音合成和播放。调用步骤说明请使用Embedded Binaries方式导入SDK到工程中。导入NlsSdk中的AliyunNlsClientAdaptor.h、...

调用官方Agent

模型支持的源语言到目标语言翻译组合包括：中-英，中-日，中-韩，英-中，英-日，英-韩，（日、韩、粤、德、法、俄、意、西、泰、马来、印尼）-（中、英）翻译语音管控台否设置是否把翻译结果合成语音播报出来，默认为不播报。...

产品计费

根据播放句数进行计算费用=0.05(轻量版语音识别)+0.8(意图识别)+1.7(语音合成)*n(播放句数)+0.02(新闻电台)费用构成：语音识别+意图识别+单次启动+语音合成，其中每个播放的句子会调用语音合成功能，该部分按句计费。节省计划节省计划是...

实时语音合成交互流程

本文介绍实时语音合成服务端和客户端的交互流程。用户指南：关于模型介绍和选型建议请参见实时语音合成-通义千问 qwen-tts 的交互流程采用 WebSocket 持久连接+事件驱动响应机制，支持客户端实时输入文本并持续接收语音流。交互模型支持两...

话术配音

为话术内容配音是话术配置的最后一步，目前有在线录音、单个录音文件上传、从录音文件列表中选择录音文件以及语音合成4种配音方式。文本为您介绍不同的话术配音方式。上传录音登录智能联络中心控制台。在左侧导航栏，选择小模型通信 ...

实时语音合成（CosyVoice）

阿里云实时语音合成(CosyVoice)可将文本实时转换为流畅、自然的人声。本文系统阐述了其API接口技术规范，助您快速为应用构建生动、自然的语音交互能力。

Python SDK

long_tts bool 语音合成方式，取值说明如下：True：使用实时长文本语音合成，详情请参见接口说明。False：使用实时短文本合成，默认为 False。token String 访问Token，详情可参见获取Token概述。on_metainfo Function 如果 start 方法中...

产品公共FAQ

以下是相关的功能的视频介绍：音频基础知识+智能语音控制台介绍 ASR产品使用介绍自学习平台 语音合成 性能类 ASR语音识别和TTS语音合成超并发会有什么现象？超并发可能会出现以下情况：查看日志会有大量超时现象，具体服务状态码为...

Node.js SDK

nls"/import { SpeechSynthesizer } from"alibabacloud-nls"关键接口和参数描述 Node.js中，实现语音合成的功能，围绕 SpeechSynthesizer 类进行，一般按照如下步骤编写代码（步骤2和步骤3顺序可互换）：创建 SpeechSynthesizer 实例，此时...

CosyVoice声音复刻API

''' 重要 target_model：驱动音色的语音合成模型，须和后续调用语音合成接口时使用的语音合成模型一致，否则合成会失败 language_hints：仅适用于cosyvoice-v3-flash和cosyvoice-v3-plus模型请求示例 from dashscope.audio.tts_v2 import ...

Android SDK

本文介绍了如何使用阿里云离线语音合成服务提供的Android NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 ...

微信小程序

关键接口和参数描述实现语音合成的功能，围绕 SpeechSynthesizer 类进行，一般按照如下步骤编写代码（步骤2和步骤3顺序可互换）：创建 SpeechSynthesizer 实例，此时会传入语音合成服务地址和认证信息。设置语音合成的发音人、采样率、...

计费定价FAQ

本文汇总了您在使用智能语音交互产品中关于计费相关的常见问题。录音文件识别所有的调用都会计费，还是只有识别成功的才会...语音识别和语音合成调用如果出错是否计费？请求的状态码如果是2xx，则正常计费，其他状态码如4xx或者5xx不会计费。

数据概览

功能介绍在概览页面中可以查询当前数据统计信息以及趋势图、离线语音和离线文本指标。在概览页面上方导航栏单击质检用量统计，可查看近七日的计费统计信息。数据统计图数据统计图包括：大模型调用量、文本质检字符数（包括实文本...

语音&VUI

内容配置语音算法服务 语音合成服务默认服务：有关语音算法服务内容配置项的含义及系统界面如下图所示：TTS音色模板：可以选择已有的音色模板，具体可点击查看音色。语速、音量、语调可以进行自定义设置。同时支持点击内容试听。...

简介与SDK代码示例

重要 CosyVoice声音复刻产生的语音，只能在 语音合成CosyVoice大模型中使用，请勿在其它语音合成中使用，否则会合成失败。服务调用方式：声音复刻服务当前仅支持通过调用API方式使用。计费说明声音复刻为免费服务，复刻成功后，使用文字...

常见问题

功能介绍 语音合成支持哪些音色？CosyVoice-V2 支持的音色请参见：语音合成-CosyVoice/Sambert 中 CosyVoice音色列表（CosyVoice-V2）。Sambert 支持的音色请参见：语音合成-CosyVoice/Sambert 中 Sambert音色列表。通义千问-TTS 支持的...

Python SDK

本文介绍语音合成Sambert Python SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音合成-CosyVoice/Sambert。在线体验：暂不支持。前提条件已开通服务并获取与配置 API Key。请配置API Key到环境变量，而非硬编码...

智能语音合成服务及服务改进计划协议

您在使用商业版智能语音合成服务时，您应当阅读并遵守本《智能语音合成服务及服务改进计划协议》（以下称“本协议”）。在接受本协议之前，请您务必仔细阅读本协议的全部内容，特别是免除或者限制责任的条款、使用您上传数据的授权以及管辖...

Go SDK

语音合成 1.SpeechSynthesisStartParam 实时语音合成参数。参数类型参数说明 Voice String 发音人，默认值：“xiaoyun”。Format String 音频格式，默认使用WAV。SampleRate Integer 采样率，默认值：16000 Hz。Volume Integer 音量，...

通义晓蜜CCAI-对话分析AIO计费项变更通知

调整内容新增计费类型：本次调整后，语音识别能力通过API接入方式实现离线语音转译服务将进行收费：离线语音识别：0.33元/小时新增图片识别能力，通过通义晓蜜-VLMax模型实现图片文字识别、总结、推理，该服务的API接入将进行收费。...

2025年07月12日V6.1.9产品更新

优化离线语音质检分析描述：离线语音质检分析以及对应的相关AP支持返回通话者角色信息。ASR模型支持方言等能力描述：需要对带有方言内容对语音进行质检，可以在新建质检任务时，在选择完质检方案后，然后在语言模型中选择其对应的方言...

数字人服务SSML使用指南

本文介绍虚拟数字人开放平台提供的3D、2D流媒体服务和视频合成服务中如何使用阿里云智能语音合成服务的SSML标记语言。1.使用方式 1.1 数字人流媒体服务中使用在 SendMessage API 中的 SpeechText直接传入SSML文本重要目前3D数字人流媒体...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成 否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

ALIYUN:NLS:Project

SpeechRecognitionAndSynthesisAndAnalysis：语音识别+语音合成+语音分析。DeviceSDKSolution：设备端解决方案。SpeechSynthesisOnly：语音合成 Description String 否否项目描述。无 SdkType String 否否 SDK类型。取值：...

接口说明

长文本语音合成功能提供了将超长文本（如千字或者万字）合成为语音二进制数据的功能。返回语音合成产品详情页计费和并发限制异步长文本语音合成仅提供商用版，不支持试用，详情请参见试用版和商用版。要使用该功能，请开通商用版，详情...

从这里开始

智能语音交互产品基于语音识别、语音合成、自然语言理解等技术，实现“能听、会说、懂你”式的智能人机交互体验，适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。本文为您介绍如何使用智能语音交互，帮助您快速了解其使用...

AI Chat 应用语音转文字功能启用指南

步骤一：创建阿里云智能语音交互语音识别项目进入阿里云智能语音交互，并开通服务进入阿里云智能语音交互-全部项目，创建项目创建项目，选择“语音识别+语音合成+语音分析”或“仅语音识别”。进入项目，记录下 appkey，根据需要修改...

Java SDK

本文介绍语音合成Sambert Java SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音合成-CosyVoice/Sambert。在线体验：暂不支持。前提条件已开通服务并获取与配置 API Key。请配置API Key到环境变量，而非硬编码在...

语音&智能VUI

语音合成服务默认服务 TTS音色模板：可以根据自己需求选择音色模板，可以参考具体音色。通过大模型音色列表可以查询目前支持的大模型音色列表注意：大模型音色的voice参数在外呼机器人中，默认在音色列表中的voice对应的值前加上...

iOS SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成 否录音文件识别极速版是唤醒及命令词否听悟实时推流是解压ZIP包，将ZIP包中的nuisdk.framework添加到您的工程中...

文字转语音（阿里云智能语音交互）

音色：可在阿里云智能语音交互文档中查看可选音色，若音色不存在将无法播放阿里云智能语音交互-流式语音合成-接口说明。音量：1~100，用于控制语音的音量。语速：500~500，用于控制语音的语速。语调：500~500，用于控制语音的语调。回调...

https://help.aliyun.com/zh/ram/developer-reference/sts-sdk-overview //STS Python SDK调用示例：https://help.aliyun.com/zh/ram/developer-reference/use-the-sts-openapi-example // //账号需求说明:/若使用离线功能(离线语音合成、...

创建质检任务

离线语音质检离线语音是来自呼叫中心中上传的离线语音文件，用户可以根据质检匹配条件筛选出需要质检的数据，系统支持AND和OR条件的简单逻辑筛选。实时语音质检实时语音是来自呼叫中心中的语音数据，用户可以根据质检匹配条件筛选出需要...

iOS SDK

本文介绍了如何使用阿里云离线语音合成服务提供的iOS NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 AccessKey ...

Python SDK

调用示例以下Python代码示例使用了带有SSML文本输入请求语音合成，使用扬声器进行音频播放并保存。重要代码运行前需要替换 your-appkey 以及 your-token。coding=utf-8#Installation instructions for pyaudio:#APPLE Mac OS X#brew ...

启动通话及个性参数配置

工作流覆盖参数 enableIntelligentSegment Bool 智能断句开关 asrConfig ARTCAICallAgentAsrConfig 语音识别配置 ttsConfig ARTCAICallAgentTtsConfig 语音合成配置 llmConfig ARTCAICallAgentLlmConfig 大语言模型配置 avatarConfig ...

启动通话及个性参数配置

工作流覆盖参数 enableIntelligentSegment Bool 智能断句开关 asrConfig ARTCAICallAgentAsrConfig 语音识别配置 ttsConfig ARTCAICallAgentTtsConfig 语音合成配置 llmConfig ARTCAICallAgentLlmConfig 大语言模型配置 avatarConfig ...

SubmitAvatarVideoTask-提交合成视频任务

接口说明该接口是针对有定制化视频合成样式的需求使用，正常的视频合成任务请直接使用：提交 3D 文本合成视频任务、提交 3D 语音合成视频任务、提交 2D 文本合成视频任务、提交 2D 语音合成视频任务即可。调试您可以在OpenAPI Explorer中...