导航语音是怎么做到的-导航语音是怎么做到的文档介绍内容-移动阿里云

服务端回调通知

登录RTC控制台，在左侧导航栏选择配置管理事件通知选中对应的AppID，进行回调设置页面。按需配置具体的事件。触发回调事件。完成AppID应用事件通知配置之后，您可以通过服务端API，发起相关任务，比如开启录制、开启推流等操作来触发...

1.0与2.0实例管理部分功能变动对比

智能语音导航 是是检查智能语音导航的对接和运转。智能对话分析是否暂无此模块。批量外呼是新增号码并发数量配置。设置工作台设置是是来电显示、外呼显示、呼入挂机方式、自动接听来电、录音下载、选择技能组。坐席侧录音、工作...

API详情

当明确知道需要识别的语音是中英文时，选择paraformer-v1模型的准确率通常会比paraformer-MTL-v1模型更高。电话录音一般采用8kHz进行录制，对这类文件应选择paraformer-8k-v1模型进行语音识别以获得更佳的效果。Paraformer语音识别返回较为...

如何修改导航

如何修改导航添加导航：注：第一个样式和第二个样式的导航是固定屏幕顶部的，若您不需要固定屏幕，可以选择下面的样式修改导航名称：

数据概览

总会话数为智能语音导航的接通量。七日内智能导航解决率：等于“解决问题数/总会话数”。历史7/14/30日内并发峰值数：7/14/30日内峰值最高并发使用数量。数字员工服务总量趋势图：图中横坐标为时间，纵坐标为解决问题数或总会话数。并发...

WebSocket API

如果语音时长超过了一分钟，则认为这一分钟内的语音是一句话。模型与价格模型名模型简介单价 gummy-chat-v1 Gummy一句话识别、翻译模型，在识别、翻译出一句话后会结束任务。默认进行标点符号预测和逆文本正则化（INT，Inverse Text ...

Python SDK

如果语音时长超过了一分钟，则认为这一分钟内的语音是一句话。前提条件已开通服务并获得API-KEY：获取API Key。建议您配置API Key到环境变量，从而避免在代码里显示配置API Key，降低泄漏风险。已安装最新版DashScope SDK：安装SDK。模型...

WebSocket API

如果语音时长超过了一分钟，则认为这一分钟内的语音是一句话。模型与价格模型名模型简介单价 gummy-chat-v1 Gummy一句话识别、翻译模型，在识别、翻译出一句话后会结束任务。默认进行标点符号预测和逆文本正则化（INT，Inverse Text ...

Python SDK

如果语音时长超过了一分钟，则认为这一分钟内的语音是一句话。前提条件已开通服务并获得API-KEY：获取API Key。建议您配置API Key到环境变量，从而避免在代码里显示配置API Key，降低泄漏风险。已安装最新版DashScope SDK：安装SDK。模型...

Java SDK

如果语音时长超过了一分钟，则认为这一分钟内的语音是一句话。前提条件已开通服务并获得API-KEY：获取API Key。建议您配置API Key到环境变量，从而避免在代码里显示配置API Key，降低泄漏风险。已安装最新版DashScope SDK：安装SDK。模型...

Java SDK

如果语音时长超过了一分钟，则认为这一分钟内的语音是一句话。前提条件已开通服务并获得API-KEY：获取与配置 API Key。建议您配置API Key到环境变量，从而避免在代码里显示配置API Key，降低泄漏风险。已安装最新版DashScope SDK：安装...

LaTeX 公式转语音

在有声读物、在线教育等场景中，将包含复杂数学公式的文本转换为流畅、准确的语音是一大挑战。CosyVoice 语音合成服务支持解析文本中嵌入的公式，并将其以符合人类阅读习惯的方式朗读出来，显著提升了数学、物理等学科内容的听觉体验。使用...

基本概念

本文为您介绍智能语音交互服务中的相关概念，以便于更好地理解本产品。采样率（sample rate）音频采样率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。目前语音识别服务支持16000Hz和8000Hz两种采样...

Java SDK

aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv 0.00026元/秒 fun-asr-2025-11-07 相较fun-asr-2025-08-25做了远场VAD优化，识别更准快照版 fun-asr-2025-08-25 中文（普通话）、英文 fun-asr...

Python SDK

aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv 0.00026元/秒 fun-asr-2025-11-07 相较fun-asr-2025-08-25做了远场VAD优化，识别更准快照版 fun-asr-2025-08-25 中文（普通话）、英文 fun-asr...

语音导航的审计事件

语音导航已与操作审计服务集成，您可以在操作审计中查询用户操作语音导航产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中，满足实时审计、问题回溯分析等需求。操作审计记录了用户通过Open...

企业资质FAQ

是的。语音服务使用的前提是：必须要有审核通过的资质，不论公共或专属模式。为什么让我在申请公函上填写管理员身份证号码？号码申请公函落款处需要填写管理员身份证号码以及日期和加盖企业公章。“请提供话术和业务场景”是什么意思？运营...

产品更新记录

前端跳转逻辑调整，付费、开通流程优化智能外呼模块实现智能外呼产品的菜单融入，前端跳转逻辑调整，付费、开通流程优化 语音导航模块实现智能语音导航产品的菜单融入，前端跳转逻辑调整，付费、开通流程优化产品控件统一升级实现全...

基本概念

调用语音识别服务时，如果语音数据采样率高于16000Hz，需要先把采样率转换为16000Hz才能发送给语音识别服务；如果语音数据采样率是8000Hz，请勿将采样率转换为16000Hz，项目中选用支持8000Hz采样率的模型。采样位数（sample size）采样值或...

接口说明

长文本语音合成功能提供了将超长文本（如千字或者万字）合成为语音二进制数据的功能。返回语音合成产品详情页计费和并发限制异步长文本语音合成仅提供商用版，不支持试用，详情请参见试用版和商用版。要使用该功能，请开通商用版，详情...

移动端SDK说明

时长限制：识别语音文件大小不能超过100 MB。设置多语言识别：在管控台编辑项目中进行模型选择，详情请参见管理项目。服务地址访问类型说明 URL Host 外网访问所有服务器均可使用外网访问URL。上海：...

接口说明

一句话识别功能支持对一分钟内的短语音进行识别，适用于对话聊天、控制口令、语音输入法、语音搜索等较短的语音识别场景。计费和并发限制一句话识别提供试用版和商用版两种计费模式，详情请参见试用版和商用版。如果您需要将试用版升级为...

接口说明

对长时间的语音数据流进行识别，适用于会议演讲、视频直播等长时间不间断识别的场景。计费和并发限制实时语音识别提供试用版和商用版两种计费模式，详情请参见试用版和商用版。如果您需要将试用版升级为商用版，请参见试用版升级为商用...

接口说明

长文本语音合成功能提供了将超长文本（如千字或者万字）合成为语音二进制数据的功能。说明语音合成产品详情页仅提供大部分音色试听，若详情页没有您想要的音色试听，请通过接口文档进行调用试听。接口文档请参见 Java SDK、C++ SDK。计费...

ASR效果优化方案

如果在所有情况下语音识别都不准确，或者识别率很低，需要确保录音文件的采样率（8k或者16k）与调用时设置的采样率参数（8k或者16k）保持一致，否则会影响ASR识别效果。图中通用模型为中文8k通用模型。怎么查看音频文件的采样率？可以使用...

接口说明

目前支持的语种和方言模型如下：语种和方言模型无法在编码时指定，需要在智能语音交互控制台的全部项目中对相关项目执行项目功能配置操作，选择对应的模型。详情请参见管理项目。语种语言模型名称采样率标点 ITN 顺滑语义断句 ...

接口说明

目前支持的语种和方言模型如下：语种和方言模型无法在编码时指定，需要在智能语音交互控制台的全部项目中对相关项目执行项目功能配置操作，选择对应的模型。详情请参见管理项目。语种语言模型名称采样率标点 ITN 顺滑语义断句 ...

C++ SDK

本文介绍如何使用阿里云智能语音服务提供的C++ SDK，包括SDK的安装方法及SDK代码示例。SDK下载说明当前最新版本：3.2.1b，支持Linux平台。发布日期：2024年12月25日。使用SDK前，请先阅读接口说明，详情请参见接口说明。该版本C++ SDK ...

C++ SDK

本文介绍如何使用阿里云智能语音交互提供的C++ SDK，包括SDK的安装方法、SDK代码示例以及常见问题等。SDK下载说明当前最新版本：3.2.1b，支持Linux平台。发布日期：2024年12月25日。使用SDK前，请先阅读接口说明，详情请参见接口说明。...

Python SDK

本文介绍Fun-ASR实时语音识别Python SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音识别-Fun-ASR/Gummy/Paraformer。前提条件已开通服务并获取与配置 API Key。请配置API Key到环境变量，而非硬编码在代码中，...

IVR模块介绍

应用场景菜单选择‌：在电话导航菜单中，收号模块可以让用户通过按键选择所需的服务，如售前咨询请按1、售后咨询请按2，投诉建议请按3等。（DTMF类型配置成RFC2833）。账户信息收集‌：在金融或防伪码查询系统中，收号模块可以用于收集...

快速关联对话机器人与云联络中心服务

本指南介绍如何将购买的智能对话机器人服务与云联络中心服务进行关联。1.关联概述智能对话机器人服务与云联络中心服务进行关联实现以下典型场景：...当需要使用语音导航机器人做大模型呼入场景可参考具体步骤：大模型语音呼入机器人接入方案

产品简介

产品介绍语音合成CosyVoice大模型服务是依托大规模预训练语言模型，深度融合文本理解和语音生成的一项新型语音合成技术，能够精准解析并诠释各类文本内容，将其转化为宛如真人般的自然语音。产品优势高度拟人化：采用阿里通义语音实验室...

机器人管理

本类型机器人需配合语音导航能力使用，即：由语音导航能力完成音义一体化、双工控制等语音导航场景外层逻辑后，由本机器人提供对话服务。您可以购买阿里云智能语音导航，或接入三方语音导航能力。语音外呼机器人用于电话渠道，根据配置...

语音模板FAQ

语音通知和语音验证码的文本转语音模板则用于实际外呼，模板的内容就是实际外呼时的语音内容。公共模式和专属模式的语音模板是通用的吗？不通用。在语音服务控制台新增语音模板时，必须选择该模板用于公共模式外呼或专属模式外呼。公共...

什么是智能语音交互

智能语音交互（Intelligent Speech Interaction）是基于语音识别、语音合成、自然语言理解等技术，为企业在多种实际应用场景下，赋予产品“能听、会说、懂你”式的智能人机交互功能。适用于智能问答、智能质检、法庭庭审实时记录、实时演讲...

语音通知/语音验证码FAQ

您在使用语音通知/语音验证码时如果遇到疑问，可参考以下常见问题及处理建议。语音通知支持英文吗？语音通知支持中文和英文。语音通知服务，如果用户挂线，会不会重拨？不会重拨。语音流控频率规则是怎么样的？说明若同一主叫号码与被叫...

SingleCallByVoice-发送语音通知文件类型的语音通知

调用接口给单个被叫号码发送语音通知文件类型的语音通知。接口说明请在使用该接口前，了解语音服务套餐包及功能计费，详情请参见国内语音服务定价。语音文件公共模式和专属模式不通用，如果您使用公共模式调用本接口，请在导入语音文件...

计量计费

计费方式模型服务模型名计费单元计费单价 Paraformer语音识别 paraformer-1 秒（不足1秒四舍五入）0.00008元/秒 paraformer-8k-1 paraformer-mtl-1 重要 Paraformer语音识别模型服务仅对音轨中被判定为语音内容的时长进行语音转写，并...

新功能发布记录

2025-04-10 绝对定位与视口定位语音播报支持阿里云智能语音交互的文字转语音功能。2025-04-10 文字转语音（阿里云智能语音交互）域名配置流程优化支持自动化配置 2025-04-10 环境和域名域名备案码订阅和续费魔笔服务，免费提供域名...