网络语音聊天-网络语音聊天文档介绍内容-移动阿里云

Demo体验

打开体验Demo，单击互动直播 语音聊天室。在登录页面输入我的用户ID，单击登录。创建或进入已创建的聊天室。单击创建聊天室可直接创建并进入新的语音聊天室。新创建聊天室的创建者即为此聊天室的主持人。单击进入可加入已创建的聊天...

Demo体验

打开体验Demo，单击互动直播 语音聊天室。在登录页面输入我的用户ID，单击登录。创建或进入已创建的聊天室。单击创建聊天室可直接创建并进入新的语音聊天室。新创建聊天室的创建者即为此聊天室的主持人。单击进入可加入已创建的聊天...

设置音频属性

业务场景 Profile设置 Scene设置特性普通语音聊天室标准音质模式默认场景音质较好，传输流畅，优先保证通话质量。适用于对音质没有极致追求的场景。语音教学小班课高音质模式默认场景音质高清，传输流畅，优先保证通话质量。适用于...

产品简介

产品优势高度拟人化：采用阿里通义语音实验室自研的CosyVoice 生成式神经网络语音大模型算法，使生成的语音在语调、韵律、情感表达等方面达到超拟人程度。多样化音色选择：提供海量优质的音库资源，包括不同性别、年龄、方言以及各种特色...

情感陪伴

当前AI语聊多基于IM场景的离线文字或语音聊天，GPT-4o的发布推动多模态大模型应用至实时语音或视频交互，带来更真实互动的虚拟娱乐体验。阿里云结合第三方大模型与TTS等技术，实现边消费边创作、剧情多变的实时互动情感陪伴，让用户获得...

简介与SDK代码示例

高度拟真：利用阿里通义语音实验室自研的CosyVoice生成式神经网络语音大模型算法，结合前沿的零样本学习技术，能够在语调、韵律以及情感表达上高度还原真人声音，很难与真实录音相辨。即时合成：秒级还原真实音色，提供高效、实时的声音...

模型上架与更新

视觉理解语音识别 2025-12-19 qwen3-asr-flash-filetrans、qwen3-asr-flash-filetrans-2025-11-17、qwen3-asr-flash、qwen3-asr-flash-2025-09-08 新增捷克语、丹麦语等共 9 种语言的语音识别支持。录音文件识别-通义千问语音识别 2025-...

阿里云百炼智能语音效果示例

cosyvoice-v1 音色音频试听音频下载 model参数 voice 参数适用场景语言默认采样率（Hz）默认音频格式龙婉龙婉.mp3 cosyvoice-v1 longwan 语音助手、导航播报、聊天数字人中文普通话 22050 mp3 龙橙龙橙.wav cosyvoice-v1 ...

智能语音效果示例

cosyvoice-v1 音色音频试听音频下载 model参数 voice 参数适用场景语言默认采样率（Hz）默认音频格式龙婉龙婉.mp3 cosyvoice-v1 longwan 语音助手、导航播报、聊天数字人中文普通话 22050 mp3 龙橙龙橙.wav cosyvoice-v1 ...

API&SDK常见问题

您在使用语音服务API或SDK时，如果遇到疑问后可以参考以下常见问题及处理建议。语音服务SDK是否支持Android终端？当前语音服务SDK不支持Android和iOS终端编译。语音服务VoiceReport接口返回后会再次推送吗？一个通话结束推送后，只要您有一...

通过API使用语音互动（语音IVR）

语音互动（语音IVR）是通过API接口向指定号码发起交互式语音通话，用户接听电话后，播放一段指定音频，用户根据音频引导，通过手机按键信息返回意图。工作原理语音互动（IVR）的完整工作流程包含API调用、云端处理、用户交互和结果回调四...

语音服务使用FAQ

如果您希望关闭语音服务，可以删除创建的语音模板并注销语音号码，语音号码注销后不发起通话将不会产生语音服务费，但会产生当月语音号码月租费。语音服务配置放音或者转接功能计入平台通话时长吗？配置放音是客户呼入平台自动放音，普通...

语音号码FAQ

您在使用语音号码时如果遇到疑问，可参考以下常见问题及处理建议。问题分类相关问题高频问题用户在使用语音类产品时，语音号码如何获取？语音服务号码开通失败？号码申请后为什么不能立即注销？号码的最高并发数是多少？提示“号码拨打...

AI Chat 应用语音转文字功能启用指南

步骤一：创建阿里云智能语音交互语音识别项目进入阿里云智能语音交互，并开通服务进入阿里云智能语音交互-全部项目，创建项目创建项目，选择“语音识别+语音合成+语音分析”或“仅语音识别”。进入项目，记录下 appkey，根据需要修改...

产品计费

3.使用语音业务+网络业务收费项：语音业务&网络业务+录音存储+通信费用 4.使用语音业务+数字员工收费项：语音业务+录音存储+数字员工+通信费用 5.若使用数字员工收费项：数字员工+通信费用平台资费收费项（阿里云收取）收费模式阶梯 ...

音色列表

进行语音合成时：每个模型（model）仅支持一组特定的音色（voice），不能将一个模型的音色与另一个模型混用待合成文本（text）必须在所选音色支持的语言范围内，否则可能出现发音错误或不自然对于支持SSML的音色，如需使用SSML功能，请...

使用OpenAPI

调用方式支持情况调用方式支持情况备注阿里云SDK（推荐）支持物联网络管理平台SDK支持语言及依赖安装方法请参考物联网络管理平台SDK。阿里云SDK集成方式说明请参见阿里云SDK。阿里云CLI 不支持阿里云CLI调用方式说明请参见阿里云...

地域和域名

背景信息为进一步降低华北和华南用户的网络接入时延，智能语音交互产品在当前华东2（上海）地域的基础上新增华北2（北京）和华南1（深圳）地域。对时延敏感的业务，建议选择最近的地域进行接入。您可以在监控统计页面或总览页面的 ...

iOS SDK

由于在线合成是需要连接网络，网络状况会直接影响接口响应时间，如果您的业务需要快速停止任务并开始下一条，可以根据业务需求调整网络超时时间。使用语音合成iOS SDK，如何保存为文件，保存格式是什么？可以在onNuiTtsUserdataCallback...

最佳实践

预处理视频文件以提高文件转写效率 Paraformer语音识别API可以兼容视频文件，但由于视频文件尺寸通常较大、传输较为耗时，因此建议您对视频文件进行预处理。仅提取需要进行语音识别的音轨，并进行合理压缩，从而显著降低文件尺寸、减少API...

智能语音交互SDK合规配置指引（鸿蒙）

根据《个人信息保护法》、《数据安全法》、《网络安全法》等法律法规和监管部门规章要求，App开发运营者（以下简称为“开发者”）在提供网络产品服务时应尊重和保护最终用户的个人信息，不得违法违规收集使用个人信息。为帮助开发者在使用...

智能语音交互SDK合规配置指引（iOS）

根据《个人信息保护法》、《数据安全法》、《网络安全法》等法律法规和监管部门规章要求，App开发运营者（以下简称为“开发者”）在提供网络产品服务时应尊重和保护最终用户的个人信息，不得违法违规收集使用个人信息。为帮助开发者在使用...

安全合规资质

网络安全等级保护等保三级-阿里通信国家实行网络安全等级保护制度，网络运营者应当按照网络安全等级保护制度的要求，履行安全保护义务，保障网络免受干扰、破坏或者未经授权的访问，防止网络数据泄露或者被窃取、篡改。阿里云坚持突出...

接口说明

语音包列表名称 voice参数值类型适用场景支持语言支持采样率（Hz）备注下载链接艾佳 aijia 标准女声通用场景支持中文及中英文混合场景 24K 精品版下载语音包艾诚 aicheng 温暖男声通用场景支持中文及中英文混合场景 24K 精品...

智能语音交互SDK合规配置指引（安卓）

根据《个人信息保护法》、《数据安全法》、《网络安全法》等法律法规和监管部门规章要求，App开发运营者（以下简称为“开发者”）在提供网络产品服务时应尊重和保护最终用户的个人信息，不得违法违规收集使用个人信息。为帮助开发者在使用...

回执消息简介与配置流程

本文档介绍阿里云语音服务的回执消息接收机制与配置方法。当您使用语音服务的API接口发送外呼后，可以通过轻量消息队列（原MNS）消费模式或HTTP批量推送模式来接收语音服务的回执消息。说明如果出现网络异常、响应超时等情况，可能导致...

聊天

简介聊天组件是专为 AI 对话场景设计的可视化构建模块。它由可高度定制的会话列表和输入区域组成，为开发者提供了开箱即用的 AI 对话界面解决方案。该组件不仅提供直观的用户交互视图，还可以和百炼应用或模型服务无缝集成，使构建 AI ...

离线语音合成使用问题

本文为您介绍离线语音合成的常见问题和解答。合成初始化失败通常有哪些原因？常见鉴权失败情况有哪些？初始化成功但是播报失败该如何处理？回调数据长度和时间对应关系是怎样的？配额消耗的规则是什么？一个Deviceid一天可以注册几次？如果...

Java SDK

适用于调用大规模","语言模型（LLM），以","流式输入文本的方式","进行语音合成的场景。};StreamInputTtsPlayableDemo demo=new StreamInputTtsPlayableDemo(appKey,token,url);demo.process(textArray);demo.shutdown();} public void...

Java SDK

本文介绍如何使用阿里云智能语音服务提供的Java SDK，包括SDK的安装方法及SDK代码示例。前提条件使用SDK前，请先阅读接口说明，详情请参见接口说明。已准备项目Appkey，详情请参见创建项目。已获取Access Token，详情请参见获取Token...

错误码

为方便进行问题定位，本文为您介绍语音识别业务中详细的错误码信息。错误码识别成功错误码错误信息描述 0 SUCCESS 成功配置或参数错误错误码错误消息描述解决方案 240999 DEFAULT_ERROR 内部默认错误。内部错误，请重试。240001 ...

Java SDK

本文介绍如何使用阿里云智能语音服务提供的Java SDK，包括SDK的安装方法及SDK代码示例。使用说明在使用SDK之前，请先阅读接口说明，详情请参见接口说明。为使用长文本语音合成服务，请将SDK版本更新至2.1.1及以上。下载安装从Maven...

Java SDK

本文介绍如何使用智能语音交互流式文本语音合成的Java SDK，包括SDK的安装方法及SDK代码示例等。前提条件在使用SDK之前，请先阅读接口说明。下载安装从Maven服务器下载最新版本的SDK nls-sdk-java-demo+flowingtts+3.zip。dependency ...

WebSocket协议说明

本文介绍如何使用智能语音交互流式文本WebSocket协议使用语音合成。如果您不希望引入阿里云智能语音交互产品SDK，或者目前提供的SDK不能满足您的要求，可以基于本文描述自行开发代码访问阿里语音服务。前提条件在使用WebSocket协议对接...

错误码

为方便进行问题定位，本文为您介绍语音识别业务中详细的错误码信息。错误码识别成功错误码错误信息描述 0 SUCCESS 成功配置或参数错误错误码错误消息描述解决方案 240999 DEFAULT_ERROR 内部默认错误。内部错误，请重试。240001 ...

计费说明

语音服务无按语音服务产品计费方式按语音服务产品定价呼叫中心语音服务号码费用和外呼电话费用。阿里云语音服务产品独立计算、收取费用。请参见语音服务产品定价。购买注意事项只有企业用户才可以开通呼叫中心功能。如果坐席数（包括...

Java SDK

本文介绍如何使用阿里云智能语音服务提供的Java SDK，包括SDK的安装方法及SDK代码示例。前提条件获取鉴权需要的Appkey以及Token。具体操作，请参见管理项目和通过SDK获取Token。如果通过SDK方式接入，需要下载安装SDK。具体操作，请...

交互流程

此模式适用于客户端能明确判断语句边界的场景，如聊天软件中的发送语音。启用方式：将客户端 session.update 事件的 session.turn_detection 设为null。客户端通过发送 input_audio_buffer.append 事件将音频追加到缓冲区。客户端通过发送 ...

接口说明

语音合成提供将输入文本合成为语音二进制数据的功能。功能介绍 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求，NUI SDK既能够提供全链路的语音能力，同时可做原子能力SDK进行使用，并保持接口的统一。语音合成功能支持...

错误码查询

本文主要介绍智能语音交互的错误码和解决办法。您可以优先在本文档查询错误码，获取对应解决方案。什么是智能语音交互的错误码？您在使用SDK或者调用API接口过程中，如果本地或者服务端返回结果报错，则表示操作失败。您可以通过返回结果中...