转写模型 仅限内容来源为 音频文件 时需要选择转写模型:汽车领域模型(中英粤)paraformer-v2(中英日韩粤)paraformer-8k-v2(中文)paraformer-v1(中英)paraformer-8k-v1(中文)教育领域模型(中英)音频类型 仅限内容来源为 音频...
refreshAuthInfoWithToken 刷新鉴权信息 发布及订阅相关接口 API 功能描述 publishLocalAudioStream 设置是否发布音频流,默认会推送音频流。isLocalAudioStreamPublished 查询当前是否推音频流。setDefaultSubscribeAllRemoteAudioStreams...
转写模型 仅限内容来源为 音频文件 时需要选择转写模型:汽车领域模型(中英粤)paraformer-v2(中英日韩粤)paraformer-8k-v2(中文)paraformer-v1(中英)paraformer-8k-v1(中文)教育领域模型(中英)音频类型 仅限内容来源为 音频...
注意:该接口需要在SDK start接口前调用生效 参数名称 类型 默认值 描述 playOutAudioVolume Integer 100 TTS音频增益,值域为[0,400],大于100标识增大音量,小于100标识降低音量 recordAudioVolumeBeforeVAD Integer 100 VAD唤起前采集...
参数 类型 描述 msg String 可扩展的数据字段 开始收音 开始使用麦克风采集音频数据,并向服务端发送数据,自定义采集模式下不可用 avatarSDK.startRecording();结束收音 停止使用麦克风采集音频数据,并停止向服务端发送数据,自定义采集...
public initialize(callback:INativeNuiCallback,parameters:string,level:number,save_log:boolean=false):number 其中,INativeNuiCallback接口类型包含如下回调。onNuiAudioStateChanged:根据音频状态进行录音功能的开关。当start/stop...
public initialize(callback:INativeNuiCallback,parameters:string,level:number,save_log:boolean=false):number 其中,INativeNuiCallback接口类型包含如下回调。onNuiAudioStateChanged:根据音频状态进行录音功能的开关。当start/stop...
保存数字人项目接口新增参数:resolution SDK版本更新到2.10.0 2025-01-20 v1.5 新增 新增websocket业务类型:流式音频驱动 2024-12-17 v1.4 更新:数字人形象模版接口,增加出参(supportBgChange识别模型是否可以更换背景)交互示例流程...
转写模型 仅限内容来源为 音频文件 时需要选择转写模型:汽车领域模型(中英粤)paraformer-v2(中英日韩粤)paraformer-8k-v2(中文)paraformer-v1(中英)paraformer-8k-v1(中文)教育领域模型(中英)音频类型 仅限内容来源为 音频...
通过阅读本文,您可以了解Android SDK回调及监听的接口详情。目录 DingRtcEngineSubtitleManagerListener:字幕管理器回调及监听 API 描述 支持的最低版本 onLanguageListsUpdated 语言列表更新回调通知。3.8 ...
在合成时,指定音频的采样率,优先级高于接口请求参数 sample_rate 指定的音频采样率。rate String[-500,500]之间整数。默认值为0。大于0表示加快语速。小于0表示减慢语速。否 阿里巴巴语音合成特有标签。在合成时,指定音频的语速,优先级...
通过阅读本文,您可以了解iOS SDK和Mac SDK回调及监听的接口详情。目录 DingRtcEngineDelegate:回调及监听 API 描述 支持的最低版本 onJoinChannelResult 加入频道回调。3.0 onLeaveChannelResult 离开频道回调。3.0 ...
音频类型 仅限内容来源为 录音文件识别 时需要选择音频类型:电话录音 或 16K及以上单声道 16K及以上多声道(车载设备录制)转写模型 仅限内容来源为 录音文件识别 和 实时转写 时需要选择转写模型:paraformer-v2(中英文)paraformer-v2...
通过阅读本文,您可以了解Windows SDK的AliEngineEventListener回调及监听接口详情。目录 API 描述 支持的最低版本 OnJoinChannelResult 加入频道结果的回调。2.1 OnLeaveChannelResult 离开频道结果的回调。2.1 OnRemoteUserOnLineNotify ...
获取媒体转码信息 调用/v2/file/get_video_preview_play_info接口,设置转码类型为Domain已开通的转码能力类型(比如quick_video),设置参数template_id="模板id"(比如264_480p)即可获取到"模板id"对应的播放信息(为空时会返回所有转码...
参数 类型 描述 audioSource AliRtcAudioSource 音频裸数据源类型。audioSample AliRtcAudioDataSample*_Nonnull 音频裸数据。onPlaybackAudioFrameBeforeMixing:混音前的指定用户的音频数据的回调。(void)...
通过阅读本文,您可以了解Windows SDK的DingRtcEngineEventListener回调及监听接口详情。接口说明 目录 视频数据回调及监听 API 描述 支持的最低版本 GetVideoFormatPreference 视频格式采集偏好。3.0 OnCaptureVideoFrame 本地采集视频...
媒资管理 API 标题 API概述 媒资搜索 媒资搜索 SearchMedia 搜索媒体信息 本接口用于搜索视频点播生产的视频、音频和图片等媒资信息,调用本接口配合媒资搜索协议可实现在视频点播中进行指定返回字段、精确匹配、模糊匹配、多值查询、范围...
2D数字人视频合成服务为您提供 输入文本 和 输入音频 合成为2D虚拟数字人指定格式的视频,并且通过返回的视频链接下载视频内容。说明 如您需要单日提交超过1000条视频,请提前联系工作人员。功能介绍 形象配置 支持选择平台内置的2D数字人...
GetCaseFileUploadUrl 获取预测式外呼名单上传参数 调用GetCaseFileUploadUrl获取指定实例下预测式外呼名单文件的OSS上传参数,当使用文件导入的方式创建预测式外呼活动时,需要先调用此接口拿到文件上传参数,然后再调用CreateCampaign...
测试工具 在根据Websocket协议开发接口过程中,可以下载 NlsStreamInputTtsMockServer.py 脚本,运行如下命令安装依赖,并在本地模拟公有云流式语音合成服务进行调试:pip install websocket-client python NlsStreamInputTtsMockServer.py...
3D数字人视频合成服务为您提供 输入文本 以及 输入音频 合成为3D虚拟数字人指定格式的视频,并且通过返回的视频链接下载视频内容。功能介绍 形象配置 支持选择不同3D数字人形象,并进行装扮。具体可参考:配置数字人形象 支持通过参数指定...
当操作类型为 查询任务状态和结果 时,需要填写以下参数:任务 ID:开始实时任务 和 创建离线任务 操作返回的任务 ID 回调配置 数据转化:对接口返回的数据进行处理,默认为 return data,即不进行处理。成功回调:配置接口调用成功时触发...
媒体处理 API 标题 API概述 转码接口 转码接口 SubmitTranscodeJob 提交转码任务 用户可以调用SubmitTranscodeJob接口,指定需要转码的源文件、输出格式以及相关参数,并提交视频或音频文件的转码任务到智能媒体服务。GetTranscodeJob 查询...
接口说明 在剪辑过程中,素材可添加到时间线上,但不一定完全被使用。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权...
前端资源 重要 更新前端资源版本以后,一定要在本地环境做全面测试以后再发布线上环境!sdk样式文件-link rel="stylesheet"type="text/css"href="https://g.alicdn.com/cloudcallcenter/acc-ivr/{version-ivr-sdk}/main.min.css" !sdk js...
AudioStream:音频流信息 名称 类型 描述 Index String 音频流序号,标识音频流在整个媒体流中的位置。CodecName String 编码格式简述名。CodecLongName String 编码格式长述名。CodecTimeBase String 编码时基。CodecTagString String ...
需要开通对应的转码功能,枚举如下:live_transcoding(live 边转边播)quick_video(quick 边转边播)offline_audio(离线音频转码)offline_video(离线视频转码)quick_video template_id string 否 清晰度模板 id。填空表示取所有可用...
在完成了媒体上传和媒体处理后会产生大量的媒资,视频点播提供统一强大的媒资管理服务,支持通过控制台和调用接口进行管理。本文为您介绍什么是媒资、媒资的类型、媒资管理功能、媒资管理方式和使用场景。什么是媒资 内容生产过程中会产生...
string AudioMessageContent(音频消息)参数 描述 类型 duration 音频时长。number src 音频文件资源链接。string uploadProgress 音频文件发送进度。string SatisfactionMessageContent(满意度消息)参数 描述 类型 surveyId 满意度ID。...
参数 类型 描述 track AliRtcAudioTrack 音频流类型。sent_bitrate int 发送码率,单位:Kbps。sent_samplerate int 发送的采样率。num_channel int 声道数。send_loss int 发送丢包率。AliRtcRemoteAudioStats:远端音频统计信息。参数 ...
可用于剪辑的媒体资源需要存到点播媒资库,支持类型包括视频、音频、图片和文本。云剪辑工程 用于描述一次视频创作过程中涉及的数据。一般包括基本元数据(如标题、创建时间等),本次视频创作所需的素材,以及描述实际视频创作内容的时间...
通过阅读本文,您可以了解Android SDK回调及监听的接口详情。目录 AliRtcEngineEventListener:本地用户行为回调。API 描述 支持的最低版本 onJoinChannelResult 加入频道结果回调。1.1 onLiveStreamingSignalingResult 低延迟互动直播拉流...
雪碧图列表 ✓×DownloadSwitch String 下载开关 ✓×TranscodeMode String 转码模式 ✓×StorageClass String 分级存储类型 ✓×✓×音频信息:Audio 名称 类型 描述 返回字段 精确匹配 模糊匹配 多值查询 范围查询 排序字段 AudioId ...
参数 类型 描述 track AliRtcVideoTrack 音频流类型。sent_bitrate int 发送码率,单位:Kbps。sent_samplerate int 发送的采样率。num_channel int 声道数。sendLoss int 发送丢包率。AliRtcRemoteAudioStats:远端音频统计信息。参数 ...
10-14 Link Visual视频Media SDK LinkVisual视频Media SDK iOS 2.1.0-ilop 支持抽帧倍速下对虚拟I帧的播放,改善高倍数下设备本地录像点播效果 支持AMR/WAV音频文件的录制和播放 支持音频文件上传功能 增加播放停止时画面显示策略设置接口 ...
本文介绍了使用API接口异步检测语音内容的方法。语音内容审核帮助您检测音频文件或语音流(例如直播流)中的风险或违规内容,例如垃圾信息、广告、涉政、暴恐、辱骂、色情、灌水、违禁、无意义等内容。(语音异步检测)使用说明 业务接口:...
访问越界 8229/0x2025 未指的请求类型 内部错误 28675/0x7003 调用评测接口顺序错误 暂未使用 28677/0x7005 在线测评模块和对应的处理函数不匹配 内部错误 28678/0x7006 离线测评模块和对应的处理函数不匹配 内部错误 28679/0x7007 VAD模块...
文本/音频:TEXT/AUDIO audioUrl string 音频类型必填 音频文件地址(最长十分钟)textContent string 文本类型必填 音频文本(ttsVersion等于3的支持labtex语法)voiceTemplateId long 文本类型必填 声音模型id(需要跟主播匹配)volume ...
参数 类型 描述 track AliRtcVideoTrack 音频流类型。sent_bitrate int 发送码率,单位:Kbps。sent_samplerate int 发送的采样率。num_channel int 声道数。sendLoss int 发送丢包率。AliRtcRemoteAudioStats:远端音频统计信息。参数 ...