智能电视语音交互-智能电视语音交互文档介绍内容-移动阿里云

产品优势

本文为您介绍智能语音交互的产品核心优势。语音识别识别准确率高基于SAN-M自研的“识音石”通用端到端语音识别框架，中文识别准确率可达业内最高水平；在输入法、客服、会议等领域，文字识别错误率相比上一代系统下降10%～30%，大幅提高...

Node.js Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用Node.js SDK提交识别请求和查询识别结果，采用的是RPC风格的POP API调用方式。关于阿里云Node.js SDK请参见快速开始。SDK...

Python Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。SDK说明录音文件识别的Python示例使用了阿里云Python SDK的CommonRequest提交录音文件识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于使用...

PHP Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。说明本文PHP示例基于阿里云新版PHP SDK（Alibaba Cloud SDK for PHP ）开发。如果您已接入阿里云旧版PHP SDK（aliyun-openapi-php-sdk ），仍然可以继续...

移动端应用如何安全访问智能语音交互服务

为了避免在移动端App或者桌面端工具中保存固定AccessKey ID和AccessKey Secret可能引起的泄露风险，您可以通过在App服务端创建Token并下发到移动端使用，或使用STS临时访问凭证调用语音服务两种方式，更加安全地访问智能语音交互服务。...

Python Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。SDK说明录音文件识别的Python示例使用了阿里云Python SDK的CommonRequest提交录音文件识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于使用...

VoiceReport

说明获取智能语音交互呼叫记录信息时，如需开启号码状态（早媒体）识别功能，请在调用发起智能语音交互通话和发起智能语音指定动作时设置 EarlyMediaAsr 参数值为 true。智能联络中心用户使用此回执消息获取智能外呼机器人呼叫记录...

Go Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用Go SDK的CommonRequest提交识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于阿里云Go SDK请参见使用阿里云Go...

iOS SDK

对象说明 SDK名称 智能语音交互移动端SDK 开发者阿里云计算有限公司 SDK版本 2.6.7-01B SDK更新时间 2025-07-29 SDK整合包大小 25 MB SDK整合包MD5值 f0e2af28e434e17993037406f48462ff 隐私政策 智能语音交互产品隐私政策合规配置说明 ...

PHP Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。说明本文PHP示例基于阿里云新版PHP SDK（Alibaba Cloud SDK for PHP ）开发。如果您已接入阿里云旧版PHP SDK（aliyun-openapi-php-sdk ），仍然可以继续...

Go Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用Go SDK的CommonRequest提交识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于阿里云Go SDK，请参见使用阿里云...

ALIYUN:NLS:Project

ALIYUN:NLS:Project类型用于创建智能语音交互项目。语法 {"Type":"ALIYUN:NLS:Project","Properties":{"Name":String,"ProjectType":String,"Description":String,"SdkType":String } } 属性属性名称类型必须允许更新描述约束 Name ...

公共模式/专属模式FAQ

公共模式目前仅支持以下业务场景：语音通知语音验证码注意：其他业务场景（如智能语音机器人、智能语音交互等）请申请企业专属号码使用专属模式。1.3 公共模式和专属模式的区别是什么？对比项公共模式专属模式适用场景仅支持语音...

CreateInstance-创建业务实例

Managed：旧版外呼画布，智能外呼产品默认智能语音交互产品服务（公共服务）。枚举值：DialogStudio：对话引擎3.0。Authorized：公有云版本对话机器人。Provided：独立部署版本对话机器人。Managed：旧版画布。DialogStudio ...

新功能发布记录

2025-04-10 文字转语音（阿里云智能语音交互）域名配置流程优化支持自动化配置 2025-04-10 环境和域名域名备案码订阅和续费魔笔服务，免费提供域名备案服务码。2025-04-10 域名备案服务码计量计费报表新增计量计费报表页面。2025-04-...

Android SDK

合规配置说明 智能语音交互SDK合规配置指引（安卓）SDK整合包下载下载Android SDK 类别兼容范围系统支持Android 4.0 以上版本，API LEVEL 14 架构 armeabi-v7a，arm64-v8a，x86，x86_64 此SDK还包含如下功能，若未支持您想要的功能，请...

简介与SDK代码示例

版权与合法性：您需对所提供声音的所有权及合法使用权负责，请注意阅读开通智能语音交互-流式文本语音合成的服务协议。复刻后语音的使用：使用复刻产生的语音（VoiceName）的用法和语音合成CosyVoice大模型中的预设音色（例如：...

通过SDK获取Token

背景信息通过SDK获取Token方式说明通过智能语音交互SDK获取Token 适用于通过智能语音交互SDK直接获取Token的场景，建议您集成此SDK。通过阿里云公共SDK获取Token 适用于当前智能语音交互暂未提供对应语言SDK获取Token的场景。前提条件 ...

SmartCallOperate-发起智能语音指定动作

接口说明在智能语音交互呼出通话中，转接呼叫中心坐席时，可以使用本接口指定被叫号码发起指定动作。说明当前仅支持指定动作为被叫号码与呼叫中心坐席桥接。QPS 限制单用户调用频率：100 次/秒。调试您可以在OpenAPI Explorer中直接...

服务等级协议

自然语言处理服务等级协议智能语音交互“智能语音交互-模型服务”服务等级协议智能语音交互服务等级协议通义听悟API服务等级协议决策智能优化求解器服务等级协议 AI应用 2D真人形象定制服务等级协议【虚拟数字人-品牌智能直播间】...

CreateRobotTask-发起智能语音机器人外呼任务

在智能语音交互通话中，支持使用控制台预设的机器人话术，或在每轮通话中通过回调接口返回业务方设置的回应方式。QPS 限制单用户调用频率：100 次/秒。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后...

SDK FAQ

如果未生成TaskId，说明请求未成功到达智能语音交互的服务端，一般为本地环境问题。建议您优先排查本地网络和环境，将线上Demo和本地对比检查。Java SDK通过传入阿里云账号的AccessKey ID和AccessKey Secret，调用阿里云Java SDK得到client...

地域和域名

本文为您介绍智能语音交互产品的地域和域名信息。背景信息为进一步降低华北和华南用户的网络接入时延，智能语音交互产品在当前华东2（上海）地域的基础上新增华北2（北京）和华南1（深圳）地域。对时延敏感的业务，建议选择最近的地域...

功能发布记录

本文介绍智能语音交互产品功能的最新动态和相关文档。2023年04月~2024年01月功能分类功能名称功能描述更新类型文档链接语音识别字幕上屏录音文件识别、录音文件识别极速版、录音文件识别闲时版支持字幕上屏场景。新增接口说明 ...

语音合成FAQ

语音合成（TTS）是概率模型，目前业界能做到的读音正确率在96%~98%之间，阿里云智能语音交互产品在通用场景下测试准确率在97%左右。这意味着不是所有读音错误都能被修复掉，建议您可以通过换字或使用SSML功能。语音合成的发音读错怎么办？...

WebSocket协议说明

本文介绍如何使用智能语音交互流式文本WebSocket协议使用语音合成。如果您不希望引入阿里云智能语音交互产品SDK，或者目前提供的SDK不能满足您的要求，可以基于本文描述自行开发代码访问阿里语音服务。前提条件在使用WebSocket协议对接...

DescribeTTSDemo-TTS 试听

使用 doubao 服务时，须填入 volc 使用 xunfei 作为服务方时，填入 xunfei（只能在小模型场景使用）ali NlsServiceType string 否服务类型 Managed：智能外呼产品默认智能语音交互产品服务（公共服务）。Authorized：公有云客户自己购买的...

WebSocket协议说明

本文介绍如何使用智能语音交互WebSocket协议使用Cosyvoice大模型的长文本语音合成服务。如果您不希望引入阿里云智能语音交互产品SDK，或者目前提供的SDK不能满足您的要求，可以基于本文描述自行开发代码访问阿里语音服务。前提条件在使用...

BatchRobotSmartCall-批量发起智能语音机器人外呼任务

在智能语音交互通话中，支持使用控制台预设的机器人话术，或在每轮通话中通过回调接口返回业务方设置的回应方式。此接口用于直接使用控制台预设的机器人话术，发起机器人外呼任务。前提条件已实名认证为企业用户，并审核通过了企业资质。...

Python SDK

本文介绍如何使用智能语音交互一句话识别的Python SDK，包括SDK的安装方法及SDK代码示例等。前提条件在使用SDK前，请先阅读接口说明，详情请参见接口说明。SDK仅支持Python3，暂不支持Python2。已安装Python包管理工具setuptools。如果未...

语音识别FAQ

智能语音交互的一句话识别，标点符号是根据什么来判断逗号和句号的？离线文件转写如何区分左右声道？语音识别可以支持多个词表吗？设置录音文件识别服务的版本，"4.0"和"2.0"两个版本有什么区别？在电话端支持哪些国家的语音识别？在语音...

Node.js SDK

本文介绍如何使用智能语音交互一句话识别的Node.js SDK，包括SDK的安装方法及SDK代码示例等。前提条件在使用SDK前，请先阅读接口说明，详情请参见接口说明。请确认已经安装nodejs&npm环境，并完成基本配置。SDK支持nodev14及以上版本。...

首次呼入回调

content_type String 是 callin 智能语音交互的类型，callin表示用户拨打指定号码发起呼叫。content JSON 是 {"caller":"1371111*","callee":"0571111*","orgcallee":"05712222*"} 具体的语音内容，JSON格式。caller：呼入场景主叫号码。...

.NET Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用.Net SDK的CommonRequest提交识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于阿里云.NET SDK的详细介绍请...

语音识别输入格式FAQ

本文主要介绍智能语音交互的语音识别输入格式说明，以及输入语音格式不符合要求时常见问题以及方法，您可以优先在文本档获取对应解决方案。语音识别各服务支持的语音输入格式语音识别服务语音输入格式说明一句话识别支持的输入格式：单...

聊天

可参考文字转语音（阿里云智能语音交互）。图标：操作项显示图标。图标颜色：操作项显示图标颜色。隐藏：是否隐藏该操作项。位置：操作项出现位置，可选“工具栏”、“下拉框”或“同时出现”。当选择“下拉框”时，该操作项将仅被收起在...

.NET Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用.Net SDK的CommonRequest提交识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于阿里云.NET SDK的详细介绍，请...

使用函数计算方式的录音文件识别

已开通智能语音交互服务，有对应的AccessKey ID、AccessKey Secret、Appkey，详情参见 智能语音交互。效果说明本文使用的OSS Bucket为nls-file-trans，音频文件存放路径为 filetrans/raw，识别结果存放路径为 filetrans/result。识别结果...

通过控制台使用语音通知/语音验证码

语音文件：若需要播放固定内容的音频文件（WAV或MP3格式），在左侧导航栏点击语音文件管理，根据业务需要选择语音通知文件、通话中放音文件或 智能语音交互放音文件页签，单击导入语音文件。语音文件审核通过后即可使用。重要在创建...

QueryCallDetailByCallId-查询指定通话的呼叫详情

此接口可查询语音通知、语音验证码、语音 IVR、智能语音交互、智能外呼机器人的呼叫详情。由于接口数据同步需要时间，建议您呼叫结束后等待 3 到 5 分钟再尝试调用接口。调用外呼接口发起通话后，返回参数中会携带 CallId，使用获取的 ...

智能电视 语音交互

智能电视语音交互