在线语音模块-在线语音模块文档介绍内容-移动阿里云

移动端应用如何安全访问智能语音交互服务

背景信息方案适用接口方案一：通过App服务端创建Token并下发到移动端使用一句话识别实时语音识别录音文件识别极速版语音合成实长文本时语音合成语音分析等方案二：使用STS临时访问凭证调用语音服务离线语音合成方案一：通过App...

功能特性

PCM、WAV、MP3 Java/C++/Harmony 暂不支持免费试用资源包购买非实时 RESTful API 离线语音合成实时无网状态下，离线进行本地的语音合成。语音播报、新闻小说、有声阅读、无障碍播报。PCM、WAV、MP3 iOS/Android 暂不支持免费试用资源...

模型上架与更新

实时语音合成-通义千问语音合成 2025-09-22 qwen3-tts-flash、qwen3-tts-flash-2025-09-18 通义最新的离线语音合成大模型，不仅拥有17种高表现力的拟人音色，且能低延迟高稳定地合成音频；同时支持多种语言、方言。语音合成-通义千问实时...

2021年8月24日产品更新动态

产品功能亮点解释智能导航能力打通2.0、并在IVR模块中上线阿里云智能语音导航已完成与云呼2.0的对接，并在IVR中新增一个节点类型【智能导航】，可直接选择相同账号下的智能导航实例，即可由IVR转到导航中短信满意度收集模式优化现已将...

2021年7月13日 V3.12.0产品更新

功能模块亮点解释优化评分大盘将离线大盘拆分成离线语音和离线文本大盘，精细化统计热线、在线场景的客服评分情况，并支持分析数据导出。优化在线客服场景质检结果中的图片展示优化在线客服场景结果中的图片查看、缩放等操作。优化通话...

智能语音交互SDK合规配置指引（鸿蒙）

SDK功能及相关个人信息功能采集个人信息字段个人信息采集目的功能配置方案及示例语音离线唤醒和离线语音合成设备型号用于离线功能的统计和计费无 SDK合规初始化配置方案/*向服务端发起交互请求*@param vad_mode:多种模式，对于识别...

界面化的TTS下载工具

如果您还没有配置语音合成服务，单击语音合成模块内的去配置。选择语音合成模型。设置基础参数。在测试文本框内输入不超过300字符的文字。单击播放试听合成效果，单击下载可将音频下载到本地。单击右下角确认使用，保存配置信息...

语音信箱

语音信箱一般是用于客户呼入进行语言留言等场景，如用户呼入电话过来，坐席侧下班了，非工作时间模块后面链接了语音信箱模块之后可让用户进行语音留言，次日坐席上班后可以看见留言信箱录音信息。以下将为您介绍语音信箱用户可在语音...

智能语音交互SDK合规配置指引（安卓）

SDK功能及相关个人信息功能采集个人信息字段个人信息采集目的功能配置方案及示例语音离线唤醒和离线语音合成设备型号用于离线功能的统计和计费无 SDK合规初始化配置方案/*向服务端发起交互请求*@param vad_mode:多种模式，对于识别...

含UI集成方案

采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、应用中心的AI模型。按照OpenAI规范或阿里规范来接入自研...

含UI集成方案

采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、应用中心的AI模型。按照OpenAI规范来接入自研的大语言...

含UI集成方案

采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、应用中心的AI模型。按照OpenAI规范来接入自研的大语言...

C_SDK错误码

28696/0x7018 in the json of new param,neither contain cloud's configuration nor the native's configuration New参数中没有配置native或者cloud模块创建引擎时，未配置任何的在线或者离线模块 28697/0x7019 ensure you have ...

快速开始

}/收到语音合成的语音二进制数据@Override public void onAudioData(ByteBuffer message){ if(firstRecvBinary){/此处计算首包语音流的延迟，收到第一包语音流时，即可以进行语音播放，以提升响应速度（特别是实时交互场景下）。...

语音识别FAQ

语音识别服务支持离线功能吗？语音识别支持哪些模型？语音识别是否可以混合识别极少量英文单词和字母？开启ITN（逆文本规整）后，中文数字混合时为什么并不是全部转为阿拉伯数字？录音文件识别的enable_sample_rate_adaptive和极速版本里的...

AI实时互动场景

采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、应用中心的AI模型。按照OpenAI规范或阿里规范来接入自研...

AI实时互动场景

采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、应用中心的AI模型。按照OpenAI规范或阿里规范来接入自研...

AI实时互动概览

采用标准协议与您自主研发的语音合成模块进行对接。支持将MiniMax的语音能力作为第三方插件进行集成。文生文大语言模型：预置阿里云通义的产品能力。选择阿里云百炼平台上模型中心、应用中心的AI模型。按照OpenAI规范来接入自研的大语言...

接口说明

录音文件识别闲时版是针对已经录制完成的录音文件，进行离线识别的服务。录音文件识别闲时版是非实时的，识别的文件需要提交基于HTTP可访问的URL地址，不支持提交本地文件。与录音文件识别区别在于返回时间不同，闲时版为24小时内返回结果...

接口说明

录音文件识别是针对已经录制完成的录音文件，进行离线识别的服务。录音文件识别是非实时的，识别的文件需要提交基于HTTP可访问的URL地址，不支持提交本地文件。计费和并发限制录音文件识别提供试用版和商用版两种计费模式，详情请参见 ...

功能发布记录

服务端 2025-05-16 语音识别热词离线视频分析支持离线视频重新分析。服务端 2025-05-31 记忆轮数工作流支持记忆对话轮数配置。控制台 2025-05-31 消息对话富消息输入和输出 Web端支持输出代码/表格的 Markdown格式。Web 2025-05-31 ...

通话记录

语音邮箱 IVR中配置挂机原因节点，并选择「语音邮箱」。用户来电进入到该节点后挂机，则显示该挂机原因。排队溢出含义：根据IVR中的转人工模块—队列溢出，设置的人数进行判断当前通话是否排队溢出 IVR中配置挂机原因节点，并选择「排队...

通话记录

单击页面右上角菜单按钮，选择语音业务进入语音业务控制台。在左侧导航栏选择话务报表通话记录。即可查看所有客服的通话记录，并且支持搜索功能。说明通话记录页面最多支持展示前10000条数据，如需获取更多数据，请进行报表下载。实时...

智能语音交互SDK合规配置指引（iOS）

SDK功能及相关个人信息功能采集个人信息字段个人信息采集目的功能配置方案及示例语音离线唤醒和离线语音合成设备型号用于离线功能的统计和计费无 SDK合规初始化配置方案/*向服务端发起交互请求*@param vad_mode:多种模式，对于识别...

管理项目

在语音合成TTS 模块下，选择语音合成模型并配置基础参数（语速、语调、音量）。发布上线后，将与项目Appkey绑定。如果您的应用程序中没有设置这些参数值，将使用控制台的默认值。单击目标项目右侧的项目功能配置。在语音合成TTS 区域，...

产品更新记录

前端跳转逻辑调整，付费、开通流程优化智能外呼模块实现智能外呼产品的菜单融入，前端跳转逻辑调整，付费、开通流程优化语音导航模块实现智能语音导航产品的菜单融入，前端跳转逻辑调整，付费、开通流程优化产品控件统一升级实现全...

iOS SDK

本文介绍了如何使用阿里云离线语音合成服务提供的iOS NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 AccessKey ...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象光模块连接后，接口指示灯没有变为绿色。可能原因光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见光模块型号。说明目前仅SAG-1000设备支持光模块插入。解决方案通用多...

IOT SDK开发参考

这一步成功后，整个流水线全部打通，就实现了和频道内其他用户之间的全双工语音实时通讯。5 接口描述 IOT SDK除了提供RTC接口，和DingRTC其他的Native SDK相比，增加了流水线接口。RTC接口：负责建立RTC推拉流链路 JoinChannel:加入某个...

语音数据集

本文介绍了如何使用语音数据集模块管理自己的ASR热词表。ASR泛热词表在语音识别服务中，如果您的业务领域有部分词汇默认识别效果不够好，可以考虑使用热词功能，将这些词添加到词表从而改善识别结果。如地名、人名、特定品牌名等。这些热...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

HarmonyOS Next SDK

功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/...

离线语音合成使用问题

本文为您介绍离线语音合成的常见问题和解答。合成初始化失败通常有哪些原因？常见鉴权失败情况有哪些？初始化成功但是播报失败该如何处理？回调数据长度和时间对应关系是怎样的？配额消耗的规则是什么？一个Deviceid一天可以注册几次？如果...

SDK包裁剪说明

aliyun-faceaudio-[version]-[timestamp].aar 可裁剪适老语音提醒资源模块，如果您的App不考虑适老化支持，该模块可裁剪。aliyun-facelanguage-[version]-[timestamp].aar 可裁剪多语言资源，如果您的App不考虑多语言支持，该模块可裁剪...

呼入控制

如下图所示，赋值选择“${进行其他判断}自定义参数”，然后该节点出口选择转“语音信箱”，可参考下图配置，具体操作请参见语音留言信箱模块。其他号码标签节点同理，可根据您的实际场景配置转人工或转外线或其他IVR流程。

热词组管理

热词配置热词组仅对离线/实时语音质检分析场景生效，用于提升语音转译的准确性。1.热词组管理进入热词组管理的路径：路径1：进入通义晓蜜CCAI-对话分析AIO 后，点击我的应用，可在界面中看到热词组管理按钮。路径2：通过进入具体应用...

IVR模块介绍

语音留言信箱模块该模块主要是用于非工作时间的语言留言等场景，如用户呼入电话过来，坐席侧下班了，链接该模块可让用户留言，次日坐席上班后可以看见留言录音等信息。模块名称：可自定义填写。语言留言信箱提示音：可选择上传音频文件...

场景管理

VAD模块 VAD（Voice Activity Detection）模块是用于检测语音活动的模块，常用于语音识别和语音通信系统中。以下是与VAD模块相关的两个配置选项的解释：噪音过滤阈值：该参数用于判断噪音和语音的概率。取值越趋近于-1，表示噪音被判定为...

https://help.aliyun.com/zh/ram/developer-reference/sts-sdk-overview //STS Python SDK调用示例：https://help.aliyun.com/zh/ram/developer-reference/use-the-sts-openapi-example // //账号需求说明:/若使用离线功能(离线语音合成、...