系统音频录音-系统音频录音文档介绍内容-移动阿里云

声音克隆

仅需提供时长较短的音频，即可迅速生成高度相似且听感自然的定制声音。功能入口登录云联络中心控制台，在左侧导航栏选择实例管理-V2，单击具体实例的访问地址进入实例控制台。单击页面左上角菜单按钮，选择数字员工进入数字员工业务...

使用指南

音频类型仅限内容来源为录音文件识别时需要选择音频类型：电话录音或 16K及以上单声道 16K及以上多声道（车载设备录制）转写模型仅限内容来源为录音文件识别和实时转写时需要选择转写模型：paraformer-v2（中英文）paraformer-v2...

数据类型

RtcEngineErrorMicInterrupt 系统性能不足、采集设备媒体服务异常、音频设备被占用。建议重启应用或重启设备。RtcEngineErrorSpeakerInterrupt 系统性能不足，播放设备媒体服务异常，音频设备被占用。建议重启应用或重启设备。...

Link Visual SDK更新记录

SDK名称操作系统/语言版本号更新描述发布时间相关文档 LinkVisual视频Media SDK Android 2.1.0-ilop 支持抽帧倍速下对虚拟I帧的播放，改善高倍数下设备本地录像点播效果支持AMR/WAV音频文件的录制和播放支持音频文件上传功能增加...

音频

图表样式音频是媒体组件的一种，支持自定义音频的URL地址、音频播放设置，音量设置等，支持mp4格式的音频，能够在可视化应用中添加音频播放器来播放您的音频。配置面板搜索配置：单击配置面板右上角的搜索配置，可在搜索配置面板中...

模型上架与更新

录音文件识别-通义千问语音识别 2025-12-17 fun-asr-mtl、fun-asr-mtl-2025-08-25 支持对中、英、日、韩等共 31 种语言的语音识别，尤其适合东南亚出海场景。录音文件识别-Fun-ASR/Paraformer/SenseVoice 文生图 2025-12-16 wan2.6-t2i ...

Java SDK

注意 ⚠️：如果 input_audio_transcription为会话配置了音频转录，系统会转录音频。提交输入音频缓冲区不会从模型创建响应。public void createResponse(String instructions,List OmniRealtimeModality modalities)服务端事件服务端开始...

Python SDK

注意 ⚠️：如果 input_audio_transcription为会话配置了音频转录，系统会转录音频。提交输入音频缓冲区不会从模型创建响应。def create_response(self,instructions:str=None,output_modalities:list[MultiModality]=None)-None 服务端...

错误码表

0x01040406 17040390 audio recording error or audio device occupied 系统性能不足、采集设备媒体服务异常、音频设备被占用。重启应用或重启设备。0x01040407 17040391 audio playing error or audio device occupied 系统性能不足，播放...

坐席工作台设置

其中传统（嘟嘟嘟）与预置音频为不同的系统定义模板音频，若设置为自定义音频，可以上传不超过15分钟的音频，并且可以进行试听，支持MP3、WAV、M4A、WMA格式。坐席来电铃声：可选配置项连续音、金属明亮、金属连续、拨盘电话声、电子音、...

数据类型

3.0 DingRtcAudioSessionOperationRestriction SDK对AudioSession的控制权限（仅适用于iOS系统）。3.0 DingRtcVideoStreamType 相机流类型。3.0 DingRtcDeviceVolumeType 设备音量类型（仅适用于iOS系统）。3.0 DingRtcVideoSource 视频裸...

数据类型

RtcEngineErrorMicInterrupt 系统性能不足、采集设备媒体服务异常、音频设备被占用。建议重启应用或重启设备。RtcEngineErrorSpeakerInterrupt 系统性能不足，播放设备媒体服务异常，音频设备被占用。建议重启应用或重启设备。...

回调及监听

通过阅读本文，您可以了解Web SDK回调及监听的接口详情。注意自2020年2月起，阿里云RTC将逐步停止...aliWebrtc.on('onShareSystemAudioStart',()={ console.log('您已分享系统中的音频');});说明只有本地会收到此通知，远端不会收到此通知。

使用指南

时需要选择音频类型：电话录音或 16K及以上单声道 16K及以上多声道（车载设备录制）2.制定洞察规则洞察模型目前支持以下模型：ccai-pro（默认，基于qwen-plus增强内容理解和指令遵循，效果最佳）qwen-plus qwq 场景描述填写需要洞察...

JS SDK开发文档

快速接入 1、SDK说明 jssdk通过使用Web Audio API完成在浏览器上的录音。然后将录制的原始音频流进行wav格式封装。在封装之后进行speex压缩以及ogg格式的重新封装，最终将ogg格式的采样率为16000的音频通过WebSocket流式传输到引擎，进行...

WebSocket API

一句话的结束，通过静音时长来判断，当语音后面出现的静音时长超过预设的静音时长（默认为700ms，可在发送run-task指令时通过请求参数 max_end_silence 设置），系统会认为当前的一句话已结束。如果语音时长超过了一分钟，则认为这一分钟...

WebSocket API

一句话的结束，通过静音时长来判断，当语音后面出现的静音时长超过预设的静音时长（默认为700ms，可在发送run-task指令时通过请求参数 max_end_silence 设置），系统会认为当前的一句话已结束。如果语音时长超过了一分钟，则认为这一分钟...

使用函数计算方式的录音文件识别

概述对于将音频文件存储在阿里云OSS上的用户，除使用SDK集成录音文件识别的开发方式外，还可以通过函数计算的方式，录音文件识别通过触发器函数自动执行，将识别结果保存回OSS或者其他存储器上，您只需关注最终的识别结果，减少SDK集成...

发送音频帧数据*@param streamId 流ID*@param directByteBuffer 源数据*@param length 数据长度*@param timeStampInMs 音频帧时间戳，单位ms*/void sendAudioData(int streamId,ByteBuffer directByteBuffer,int length,long timeStampInMs...

Linux(C++)

计算音频时延与系统时钟的差值，sleep来控制输入频率 delay_ms=frame.timestamp;int64_t elapsed_ms=std:chrono:duration_cast std:chrono:milliseconds(std:chrono:high_resolution_clock:now()-start_clock).count();if(delay_ms-elapsed...

功能特性

SingleCallByTts 语音IVR 通过调用API向指定号码发起呼叫，呼叫被应答后，播放一段指定音频，用户根据音频引导，通过手机按键信息返回意图，语音平台通过消息回执返回按键信息给企业业务系统。通过IVR交互自动完成意图确认，减少人力投入。...

使用指南

时需要选择音频类型：电话录音或 16K及以上单声道 16K及以上多声道（车载设备录制）2.制定洞察规则洞察模型目前支持以下模型：ccai-pro（默认，基于qwen-plus增强内容理解和指令遵循，效果最佳）qwen-plus qwq 场景描述在“请输入品牌...

语音识别输入格式FAQ

根据录音文件识别或录音文件识别闲时版服务产品介绍，服务支持的最大音频时长是12小时，当您提交的音频时长大于12小时会报此错误。您可以使用 ffmpeg 命令，将长音频切分成多个音频文件，分别识别。ffmpeg工具下载地址：...

Android SDK

在 onNuiAudioStateChanged 回调中，根据音频状态开启录音设备。在 onNuiNeedAudioData 回调中持续提供录音数据。在 onNuiEventCallback 回调中监听事件并获取语音识别结果。调用 stopDialog 停止识别，并通过监听EVENT_TRANSCRIBER_...

使用指南

时需要选择音频类型：电话录音或 16K及以上单声道 16K及以上多声道（车载设备录制）2.制定客户画像规则洞察模型目前支持以下模型：ccai-pro（默认，基于qwen-plus增强内容理解和指令遵循，效果最佳）qwen-plus qwq 场景描述在“请输入...

语音输入

stop 停止状态，展示自定义文字及图标 recording 录音状态，展示录音图标 processing 处理状态，展示加载图标交互方式开启录音的方式，选择“外部控制”时，组件会被隐藏，仅允许通过组件 API 开启和停止录音。语音上传开启后，会自动将...

iOS SDK

在 onNuiAudioStateChanged 回调中，根据音频状态开启录音设备。在 onNuiNeedAudioData 回调中持续提供录音数据。在 onNuiEventCallback 回调中监听事件并获取语音识别结果。调用 nui_dialog_cancel 停止识别，并通过监听EVENT_TRANSCRIBER...

交互流程与实现

本文介绍如何使用SDK来支持实时记录场景下的音频识别流程。交互流程前提条件安装智能语音交互实时转写SDK 创建实时记录并成功获得推流地址示例代码 Java package com.alibaba.tingwu.client.demo.realtimemeeting;import ...

数字人流媒体服务AndroidSDK

如果采集间隔 60ms 或者采集间隔 1000ms，会触发运行时错误在启用自定义采集时，开始收音、结束收音、音频闪避、回声消除功能将不生效，onRecordingStart和onRecordingStop回调也不会触发销毁实例断开rtc拉流、断开im连接、停止录音，...

Android SDK

在 onNuiAudioStateChanged 回调中，根据音频状态开启录音设备。在 onNuiNeedAudioData 回调中持续提供录音数据。在 onNuiEventCallback 回调中监听事件并获取语音识别结果。调用 stopDialog 停止识别，并通过监听EVENT_TRANSCRIBER_...

iOS SDK

在 onNuiAudioStateChanged 回调中，根据音频状态开启录音设备。在 onNuiNeedAudioData 回调中持续提供录音数据。在 onNuiEventCallback 回调中监听事件并获取语音识别结果。调用 nui_dialog_cancel 停止识别，并通过监听EVENT_TRANSCRIBER...

Link Visual视频Media SDK

录音开启 }@Override public void onRecorderEnd(){/录音结束 }@Override public void onRecorderVolume(int volume){ }@Override public void onError(LVLiveIntercomError error){/对讲发生错误：code:+error.getCode()+error.getSubCode...

WebSocket API

发送音频流：客户端开始发送音频流，并同时接收服务端持续返回的 result-generated 事件，该事件包含语音识别结果。通知服务端结束任务：客户端发送 finish-task 指令通知服务端结束任务，并继续接收服务端返回的 result-generated 事件。...

WebSocket API

发送音频流：客户端开始发送音频流，并同时接收服务端持续返回的 result-generated 事件，该事件包含语音识别结果。通知服务端结束任务：客户端发送 finish-task 指令通知服务端结束任务，并继续接收服务端返回的 result-generated 事件。...

Android SDK

在 onNuiAudioStateChanged 回调中，根据音频状态开启录音设备。在 onNuiNeedAudioData 回调中持续提供录音数据。在 onNuiEventCallback 回调中监听事件并获取语音识别结果。调用 stopDialog 停止识别，并通过监听EVENT_TRANSCRIBER_...

Android SDK

在 onNuiAudioStateChanged 回调中，根据音频状态开启录音设备。在 onNuiNeedAudioData 回调中持续提供录音数据。在 onNuiEventCallback 回调中监听事件并获取语音识别结果。调用 stopDialog 停止识别，并通过监听EVENT_TRANSCRIBER_...

移动端iOS SDK

录音数据回调，RTC链路支持 public var onRecorderData:((UnsafeMutablePointer UInt8,Int32)-Void)?合成音频数据回调 public var onSynthesizedData:((UnsafeMutablePointer UInt8,Int32)-Void)?MultiModalRequestParam 请求参数类请求...

iOS SDK

在 onNuiAudioStateChanged 回调中，根据音频状态开启录音设备。在 onNuiNeedAudioData 回调中持续提供录音数据。在 onNuiEventCallback 回调中监听事件并获取语音识别结果。调用 nui_dialog_cancel 停止识别，并通过监听EVENT_TRANSCRIBER...

iOS SDK

在 onNuiAudioStateChanged 回调中，根据音频状态开启录音设备。在 onNuiNeedAudioData 回调中持续提供录音数据。在 onNuiEventCallback 回调中监听事件并获取语音识别结果。调用 nui_dialog_cancel 停止识别，并通过监听EVENT_TRANSCRIBER...

什么是语音服务

产品架构面向未来的智能语音架构产品功能功能描述语音通知调用API向指定号码拨打电话并播放音频（支持文本转语音或录音文件），作为短信通知的补充手段，提供多样化、及时的通知方式以解决通知延迟问题。语音验证码调用API向指定...