信息语音播报-信息语音播报文档介绍内容-移动阿里云

情感陪伴

请参见如何进行语音播报。大模型输出下一道题：由于用户并没有讲话，故而若想让AI继续输出，您可以通过文本形式直接驱动模型输出。请参见如何传入文本作为大语言模型输入。对话内容文本转录&音视频录制您可以对整个陪伴过程中产生的音频...

PageQuerySharedSpeechOpen

您可在千里传音语音播报服务的分享语料管理页面，获取分享码。IotInstanceId String 否 iot-2w*实例ID。您可在物联网平台控制台的实例概览页面，查看当前实例的 ID。注意若有ID值，必须传入该ID值，否则调用会失败。若无实例概览页面...

平台简介

语音播报方面支持公共声音、私有声音两种选择，公共声音涵盖了多种常见的语音风格，满足用户的基本需求。而私有声音则允许用户上传自己的语音样本，整合阿里云大模型语音能力支持进行播报。AI互动：基于通义大模型和RAG，针对用户问题，...

CreateSharePromotionActivity

使用说明由于一个设备只能加入一个分享任务且只能播报该分享任务中共享语料，千里传音语音播报服务提供了促销活动功能，可指定分享任务中共享设备播报促销活动中的语料。配置流程如下：1.调用本接口为当前实例下所有分享任务创建促销活动...

会议邀约按键收集配置

设置播报内容语音配置-开启按键，设定位数收集。用户说，新建用户分支选择意图为AnythingElse。保存节点后，点击下图箭头的位置，选择跳转节点到服务节点上。选择好后，点击确定即可。2.5.4、输入有误节点配置此处为用户没有按照提示输入...

语音&智能VUI

目前支持第三方克隆音色，填入需要的音色ID即可，请注意需要提前在外呼系统管理中进行配置对应的鉴权信息语音识别默认服务：配置项的含义及系统界面如下图所示：ASR模型：支持中文以及英文等多语种场景。ASR热词：可在语音数据集中上...

Android SDK

本文介绍了如何使用阿里云离线语音合成服务提供的Android NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 ...

新功能发布记录

2025-04-10 绝对定位与视口定位 语音播报 支持阿里云智能语音交互的文字转语音功能。2025-04-10 文字转语音（阿里云智能语音交互）域名配置流程优化支持自动化配置 2025-04-10 环境和域名域名备案码订阅和续费魔笔服务，免费提供域名...

语音合成FAQ

语音合成时，能否控制一串数字是按数字来整体播报还是按字符来单独播报，有参数可以控制吗？对于多音字，TTS语音合成服务发音的策略是怎么样的？长文本语音合成有调用限制吗？性能类为什么TTS语音合成服务的调用有字数限制？为什么语音...

时间戳功能介绍

该时间信息可用于视频配音字幕或有声书播报文字高亮等场景。本文为您介绍时间戳功能。使用限制针对长文本语音合成，目前只支持长文本RESTful接口句级时间戳。参数设置在客户端将请求参数enable_subtitle设置为true，开启时间戳功能。以...

CreateAppAgentTemplate-创建智能体模版

1-向用户语音播报 content 指定的提示消息 2-把 content 指定的提示消息和历史对话发送给 LLM，并播报模型生成的回复默认值：1 2 Content string 否静默提示消息的内容。AmbientSoundConfig object 否智能体环境音配置。不传表示不使用...

ModifyAppAgentTemplate-修改智能体模板

1-向用户语音播报 content 指定的提示消息 2-把 content 指定的提示消息和历史对话发送给 LLM，并播报模型生成的回复默认值：1 2 Content string 否静默提示消息的内容。AmbientSoundConfig object 否智能体环境音配置。不传表示不使用...

数据结构

byWords 1 因为识别到特定词 byVoice 2 因为语音打断 byInterruptSpeaking 3 因为调用了API：interruptSpeaking bySpeechBroadCast 4 因为主动语音播报打断 byLlmQuery 5 因为主动LLM查询打断 AICallVoiceprintResult Vad反馈结果枚举值 ...

数据结构

byWords 1 因为识别到特定词 byVoice 2 因为语音打断 byInterruptSpeaking 3 因为调用了API：interruptSpeaking bySpeechBroadCast 4 因为主动语音播报打断 byLlmQuery 5 因为主动LLM查询打断 AICallVoiceprintResult Vad反馈结果枚举值 ...

数据结构

通话场景：greeting：欢迎语 normal：语音回复 speech：主动播报消息对话场景：normal：文本回复 announcement：主动推送文字 custom：自定义消息 nodeID String 分片消息对应的节点信息 extend String 用户自定义扩展信息 ...

语音计费FAQ

语音服务套餐包不是一个号码对应一个套餐包，套餐包的抵扣和使用的语音功能有关，例如：语音通知计费时优先抵用语音通知套餐包中分钟数，语音验证码计费时优先抵用语音验证码套餐包中条数。更多计费相关，请参见国内语音服务定价。语音...

StartAgent-启动智能体

1-向用户语音播报 content 指定的提示消息 2-把 content 指定的提示消息和历史对话发送给 LLM，并播报模型生成的回复默认值：1 1 Content string 否静默提示消息的内容*WebhookTriggerTimeout integer 否触发智能体静默超时 webhook 的...

语音通知/语音验证码FAQ

您在使用语音通知/语音验证码时如果遇到疑问，可参考以下常见问题及处理建议。语音通知支持英文吗？语音通知支持中文和英文。语音通知服务，如果用户挂线，会不会重拨？不会重拨。语音流控频率规则是怎么样的？说明若同一主叫号码与被叫...

API&SDK常见问题

更多信息请参见语音模板规范，API错误码请参见 API错误码。语音服务公网接入域名策略是否为双向放开？公网域名接入是双向放开，公网接入点请参见服务接入点。说明语音服务接口接入只能通过公网域名接入，不能通过IP访问。语音服务控制台...

创建语音模板

语音模板即用户听到的音频内容，您在发送语音通知和语音验证码前，需要先创建语音模板，审核通过后即可发送语音任务。注意事项文本转语音模板目前仅支持在语音服务控制台创建，暂不支持API接口创建模板。申请创建的文本转语音模板需...

开通授权

背景信息离线语音合成提供了商业版SDK，包含标准版/精品版两种声音品质，您可以根据使用场景及设备性能状况选择合适的版本。精品版音质更好；但如果设备性能比较差（如主频在1.6G以下），建议使用标准版。（可选）步骤一：购买所需个数的...

DescribeAppAgentTemplates-查询智能体模版列表

1-向用户语音播报 content 指定的提示消息 2-把 content 指定的提示消息和历史对话发送给 LLM，并播报模型生成的回复 1 AlertTimeout integer 静默提醒的超时时间（单位：秒）。可能多次触发，若智能体静默提醒超时后依然静默，则再超时还...

Android SDK（旧版）

} 返回语音时间戳信息/调用onMetaInfo，需要设置：SpeechSynthesizer.setEnableSubtitle(true)。Override public void onMetaInfo(String message,int code){ Log.d(TAG,"onMetaInfo"+message+":"+String.valueOf(code));}

Python SDK调用示例

步骤三：调用OpenAPI 本文以Python语言SDK调用OpenAPI为例，其他语言SDK的用法也类似，更多信息请参见语音服务SDK。您也可根据业务的实际需要选择其他调用方式，更多调用方法请参见调用方式。准备Python环境下载并安装 Python 3。如您已...

API列表

GetParser 查询指定解析器的详细信息，包括解析器基本信息、解析脚本、运行状态和关联的数据源等。是。DeleteParser 删除解析器。是。数据源 CreateParserDataSource 创建待流转的数据源。是。UpdateParserDataSource 更新数据源名称和描述...

应用场景

语音IVR（Interactive Voice Response，交互式语音应答）通过调用API向指定号码发起呼叫，呼叫被应答后，播放一段指定音频，用户根据音频引导，通过手机按键信息返回意图，语音平台通过消息回执返回按键信息给企业业务系统。通过IVR交互...

功能特性

提交智能任务API 数字人支持进行真人形象模型生成，高度还原表情、动作、口型等形象特征，并可基于文字或语音驱动形象模型实现数字人拟真播报，同时可添加动态视觉内容（视频、图片、动态图表等）和补充字幕信息的自动化视频成片服务。...

公共模式/专属模式FAQ

语音服务场景信息，请参见应用场景。一般情况下支持常用场景。说明根据客户资质等条件，具体场景有所不同。开通条件无需申请号码，使用公共号码池内的号码随机外呼。需要单独申请真实号码，并使用申请的号码外呼。也可将申请的多个真实...

API错误码

100008 数据不存在请您确认语音API、呼叫的机器人或任务信息是否存在。isv.INVALID_JSON_PARAM JSON参数不合法请您确认JSON参数的格式是否合法。isv.VOICE_FILE_ILLEGAL 语音文件非法请您确认语音文件是否存在或者是否通过审核。isv....

Quick BI智能问数的语音问答开通，已经完成了语音服务...

概述 Quick BI智能问数的语音问答开通，已经完成了语音服务的购买，需要提供哪些信息给到运维人员开启呢？详细信息需要提供红框部分的信息。注：AK信息来自购买语音服务的阿里云主账号（或者具备权限的RAM账号，详情请咨询阿里云账号中心...

Node.js SDK

3.回调函数 on on 函数源码如下：on(which,handler){ this._event.on(which,handler)} 语音合成任务开启后，服务端会回调该函数，将语音合成过程中的一些信息返回给客户端。参数类型参数说明 which String 事件名称。handler Function 回...

数据结构

枚举值值描述 unknown 0 未知原因 byWords 1 因为识别到特定词 byVoice 2 因为语音打断 byInterruptSpeaking 3 因为调用了API：interruptSpeaking bySpeechBroadCast 4 因为主动语音播报打断 byLlmQuery 5 因为主动LLM查询打断 ...

数据结构

枚举值值描述 unknown 0 未知原因 byWords 1 因为识别到特定词 byVoice 2 因为语音打断 byInterruptSpeaking 3 因为调用了API：interruptSpeaking bySpeechBroadCast 4 因为主动语音播报打断 byLlmQuery 5 因为主动LLM查询打断 ...

数据结构

BySpeechBroadCast 因为主动语音播报打断 ByLlmQuery 因为主动LLM查询打断 ARTCAICallAudioProfile 音频编码配置枚举名描述 ARTCAICallAudioLowQualityMode 音频低音质模式，默认8000Hz采样率，单声道，最大编码码率12kbps ...

数据结构

BySpeechBroadCast 因为主动语音播报打断 ByLlmQuery 因为主动LLM查询打断 ARTCAICallAudioProfile 音频编码配置枚举名描述 ARTCAICallAudioLowQualityMode 音频低音质模式，默认8000Hz采样率，单声道，最大编码码率12kbps ...

微信小程序

关键接口和参数描述实现语音合成的功能，围绕 SpeechSynthesizer 类进行，一般按照如下步骤编写代码（步骤2和步骤3顺序可互换）：创建 SpeechSynthesizer 实例，此时会传入语音合成服务地址和认证信息。设置语音合成的发音人、采样率、...

产品更新动态

按键语音交互打断配置优化描述：大模型场景下开启语音打断配置后，按键、语音输入可打断收号前置播报话术；关闭打断配置后，按键输入可打断收号前置播报话术，语音输入不可打断收号前置播报话术。新增闪信供应商描述：在闪信配置中新增...

运行示例

本文基于使用主账号且从控制台获取测试Token的方式，为您介绍快速入门体验或轻量级开发测试，助您快速体验语音产品能力。前提条件已按照从这里开始完成准备阿里云主账号、开通服务、管理项目和通过控制台获取Token等操作。体验方式使用...

应用场景

呼叫中心语音质检上传呼叫中心的录音文件，通过录音文件识别得到文本，进一步通过文本检索，检查有无违规话术、敏感词等信息。庭审数据库录入上传庭审记录的录音文件，进行识别后，将识别文本录入数据库。会议记录总结对会议记录的音频...

创建并配置数字人项目

效果预览：提供实时预览功能，可以通过发送文本驱动数字人进行播报（针对客服助理场景还提供了语音交互体验能力），查看对应的数字人播报效果，以及数字人位置、字幕、背景图等效果。效果不满意，可以重新修改配置信息，并再次点击“保存并...