导航语音交互-导航语音交互文档介绍内容-移动阿里云

SDK和API概览

阿里云智能语音交互SDK提供RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式，可帮助您更方便、快捷、灵活地将语音识别或语音合成功能集成到您的服务当中。SDK接入类型接入方式服务能力 RESTful API RESTful API ...

Quick BI智能问数开通智能问数语音服务要怎么配置呢？

详细信息语音服务这里使用的是阿里云的智能语音交互，目前只能使用阿里云的服务，需要用户购买后，提供购买的服务及appkey，然后联系技术支持同学协调做数据订正即可开通。开通后，在配置面板-智能问数-全局配置-语音问答开关配置中开启...

配置语音交互

当选择交互端为云智能App时，可以开启 语音交互 天猫精灵控制口令的按钮，接入天猫精灵语音，使用天猫精灵音箱进行语音控制设备。选择接入Alexa或Google Assistant平台。当选择交互端为云智能App时，不需要创建技能，可单击新增配置将...

配置人机交互

在左侧导航栏中选择 语音交互 天猫精灵，单击开启按钮，并查看产品用于天猫精灵音箱的语音控制口令。说明您可以使用平台透出的控制口令语料进行语音语义训练，完善使用天猫精灵音箱对设备的语音控制功能。在左侧导航栏中选择产品说明书...

关于语音服务回执消息VoiceReport（呼叫记录消息）...

受影响的业务包括：SingleCallByVoice（语音通知）-VoiceReport SingleCallByTts（语音验证）-VoiceReport IvrCall（语音IVR）-VoiceReport DoubleCall（坐席双呼）-VoiceReport SmartCall（智能语音交互）-VoiceReport 感谢您的支持与信赖...

语音识别问题排查

出现“吞音、辨识度不高、听不懂”等情况无法解决时：如果存在方言和重口音，可能由于ASR的训练数据覆盖不全造成识别错误，请联系阿里智能语音交互工程师进一步评估。如果有大量的重口音（非方言）识别需求，请联系阿里智能语音交互工程师...

HTTP批量推送模式

响应说明响应样例 {"code":0,"msg":"接收成功"} 字段说明 ...相关阅读语音服务各功能的回执消息数据结构：SingleCallByVoice（语音通知）SingleCallByTts（语音验证）IvrCall（语音IVR）DoubleCall（坐席双呼）SmartCall（智能语音交互）

AliyunNLSFullAccess

AliyunNLSFullAccess 是阿里云管理的产品系统策略，您可以将 AliyunNLSFullAccess 授权给 RAM 身份（RAM 用户、RAM 用户组和 RAM 角色），本策略定义了管理智能语音交互（NLS）的权限。策略详情类型：系统策略创建时间：2019-03-14 13:...

AliyunNLSSpeechServiceAccess

AliyunNLSSpeechServiceAccess 是阿里云管理的产品系统策略，您可以将 AliyunNLSSpeechServiceAccess 授权给 RAM 身份（RAM 用户、RAM 用户组和 RAM 角色），本策略定义了管理智能语音交互（NLS）语音服务的权限。策略详情类型：系统策略...

云智能App使用天猫精灵控制设备

当选择交互端为云智能App时，可以开启语音交互 天猫精灵控制口令的按钮，接入天猫精灵语音，使用天猫精灵音箱进行语音控制设备。调试设备使用云智能App配网绑定了您的测试设备后，可以根据下方消费者使用步骤，绑定天猫精灵，即可实现...

AliyunNLSReadOnlyAccess

AliyunNLSReadOnlyAccess 是阿里云管理的产品系统策略，您可以将 AliyunNLSReadOnlyAccess 授权给 RAM 身份（RAM 用户、RAM 用户组和 RAM 角色），本策略定义了只读访问智能语音交互（NLS）的权限。策略详情类型：系统策略创建时间：...

AliyunNLSSlpAccess

AliyunNLSSlpAccess 是阿里云管理的产品系统策略，您可以将 AliyunNLSSlpAccess 授权给 RAM 身份（RAM 用户、RAM 用户组和 RAM 角色），本策略定义了管理智能语音交互（NLS）自学习平台的权限。策略详情类型：系统策略创建时间：2019-03...

业务流程

系统基于已学习的指令集进行实时语音识别，支持高并发、低延迟的工业级语音交互响应。③ 结果呈现：设备端首先接收原始语音转写结果，Agent 随即进行语义理解与上下文纠错，输出修正后指令。转写结果可实时刷新并推送至您的业务系统，确保...

智能语音交互自定义权限策略参考

本文介绍智能语音交互使用自定义权限策略的场景和策略示例。什么是自定义权限策略在基于RAM的访问控制体系中，自定义权限策略是指在系统权限策略之外，您可以自主创建、更新和删除的权限策略。自定义权限策略的版本更新需由您来维护。创建...

安装SDK

智能语音交互实时转写SDK 当您使用实时记录时，创建实时任务后，安装此实时转写SDK（不含音频采集功能）实现实时音频流的采集和推送，以及实时转写结果的接收。安装阿里云SDK 本产品（听悟/2022-09-30及听悟/2023-09-30）两个版本的Open...

SmartCall-发起智能语音交互通话

智能语音交互服务，是一种人机交互技术，它允许用户通过语音与机器进行自然的对话和沟通。接口说明 SmartCall 需要与智能外呼回调 HTTP 接口联合使用，语音平台发起呼叫后会把转换后的语音文本回传给业务方，业务方把下一步的执行动作...

获取Token

访问令牌（Access Token）主要用于身份验证和授权，在调用阿里云智能语音交互API时，客户端应用或服务器端程序需要先获取一个有效的Token作为凭证，以此来证明请求的合法性，并获得对智能语音服务的访问权限。本文介绍Token的获取方式和...

管理项目

智能语音交互中的一个项目代表一个业务场景，由于各个场景的词汇各异，如果您有多个业务场景，可以创建多个项目，并根据各项目业务特点做个性化配置。本文为您介绍如何创建以及配置管理智能语音交互项目。前提条件已开通智能语音交互服务...

智能语音合成服务及服务改进计划协议

阿里云不会故意识别、提取、搜集或单独储存业务数据中可能包含的个人信息，亦不会将您业务数据中可能包含的个人信息和阿里云掌握的其他数据进行关联或融合，阿里云仅会将可能包含个人信息的业务数据用于智能语音交互服务改进、优化用途。...

在控制台创建热词

通过智能语音交互控制台中的添加热词功能，开发者可以上传自定义的热词列表，提升其识别准确率。本文为您介绍如何在控制台创建热词。背景信息热词包括名称类和业务类，具体说明如下：名称类（人名/地名）目前名称类热词只支持人名和...

数字人对话WebSDK

onFirstFrameReceived 在数字人首页画面出现的时候触发该事件回调 avatar.onFirstFrameReceived(()={ console.log('数字人渲染完毕')})onReadyToSpeech 在数字人可以开始进行语音交互的时候触发该事件回调 avatar.onReadyToSpeech(()={ ...

通过播报数字人实现对话效果

开通智能语音交互 接入步骤进入虚拟数字人开放平台控制台配置播报数字人配置数字人形象发布播报数字人接入数字人播报能力后端开发接入 3D播报数字人前端引入阿里云音视频通信 SDK 集成到网页端数字人视频流前端接入语音收音能力...

计费说明文档

单价定价第一种，资源池模式，按照对话次数计费智能体服务类别定价（单位：元/次）语音交互类应用 0.083 多模态交互类应用 0.117 文本交互类应用 0.013 视觉处理任务类应用 0.033 翻译应用 0.093 第二种，按照License计费，限制每天的...

C++ Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用了nlsCommonSDK的 AlibabaNlsCommon:FileTrans 提交识别请求和查询识别结果，采用的是RPC风格的POP API调用方式。下载安装...

语言模型定制

阿里云智能语音交互对某些场景（包括通用、教育、司法、医疗等）进行了大量语音识别训练，提供了高准确率场景模型。当您的语音识别需求超出预设模型范畴，或是希望对现有的标准模型进行个性化定制时，可以通过自学习平台的语言模型定制功能...

内容设置

语音输入需要绑定语音转文字，可参考语音转文字（阿里云智能语音交互）。开启文件输入后，请结合所使用的大模型所处平台的相关文档，对上传的文件进行消费。若对接百炼平台，可参考如何快速构建具有文件交互能力的百炼聊天应用。将发送...

Node.js Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用Node.js SDK提交识别请求和查询识别结果，采用的是RPC风格的POP API调用方式。关于阿里云Node.js SDK请参见快速开始。SDK...

通义听悟实时流

步骤2:触发通义听悟集成“开始实时任务”操作 1、创建“听悟实时流”操作 2、获取步骤一中返回的 websocket 的推流地址 3、在“实时流”操作中填写上一步中的推流地址 4、点击开始录音，进行实时推流步骤3:通过麦克风进行语音交互 1、通过...

天猫精灵语音调试

本文介绍如何使用天猫精灵App内已绑定的真实设备对产品进行语音调试。前提条件已成功添加了测试设备，参见新增测试设备。...标准语料的详细介绍请参见配置语音交互。泛化语料在泛化语料页签中，输入泛化的测试语料，并单击发送测试。

WebSocket协议说明

如果您不希望引入阿里云智能语音交互产品SDK，或者目前提供的Java、C或C++的SDK不能满足您的要求，可以基于本文描述自行开发代码访问阿里语音服务。功能介绍阿里云智能语音交互产品通过WebSocket协议对外提供实时语音流语音转写功能，支持...

应用创建

语音交互应用：实时纯语音对话，适用于带麦克风的软硬件。例如AI耳机、儿童玩具等。支持选择全能版或轻量版。（本应用不支持实时视频对话）全能版：支持意图识别、工具调用、联网搜索、多场景Agent，广泛适用于各类交互场景。轻量版：更...

Node.js Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用Node.js SDK提交识别请求和查询识别结果，采用的是RPC风格的POP API调用方式。关于阿里云Node.js SDK请参见快速开始。SDK...

并发和QPS说明

登录智能语音交互控制台，在左侧导航栏选择服务管理与开通。在语音识别页签，单击实时语音识别右侧的升级并发。在购买页面，选择对应的类型、规格、购买数量和购买时长后，单击立即购买。说明购买后次日才会显示用量。相关文档更多...

PHP Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。说明本文PHP示例基于阿里云新版PHP SDK（Alibaba Cloud SDK for PHP ）开发。如果您已接入阿里云旧版PHP SDK（aliyun-openapi-php-sdk ），仍然可以继续...

Python Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。SDK说明录音文件识别的Python示例使用了阿里云Python SDK的CommonRequest提交录音文件识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于使用...

iOS SDK

对象说明 SDK名称智能语音交互移动端SDK 开发者阿里云计算有限公司 SDK版本 2.6.7-01B SDK更新时间 2025-07-29 SDK整合包大小 25 MB SDK整合包MD5值 f0e2af28e434e17993037406f48462ff 隐私政策智能语音交互产品隐私政策合规配置说明 ...

Python Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。SDK说明录音文件识别的Python示例使用了阿里云Python SDK的CommonRequest提交录音文件识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于使用...

常见问题

如果需要语音交互，建议配合有降噪功能的收音设备。3D交互数字人时延大概在多久？时延大概3秒以内。营销图文是否支持免费测试？有业务需求的客户，联系运营小二开通营销图文测试额度。是否支持API对接？目前提供了openAPI对接方式，详见...

Go Demo

已开通智能语音交互并获取AccessKey ID和AccessKey Secret，详情请参见从这里开始。示例说明录音文件识别示例使用Go SDK的CommonRequest提交识别请求和查询识别结果，采用RPC风格的POP API调用方式。关于阿里云Go SDK请参见使用阿里云Go...

ALIYUN:NLS:Project

ALIYUN:NLS:Project类型用于创建智能语音交互项目。语法 {"Type":"ALIYUN:NLS:Project","Properties":{"Name":String,"ProjectType":String,"Description":String,"SdkType":String } } 属性属性名称类型必须允许更新描述约束 Name ...