输出音频数据 当应用需要输出音频媒体数据时,首先需要先继承AliRtcEventListener接口,实现onAudioSampleCallback回调,用于接收音频媒体数据。音频数据通过回调中audioSample参数返回,数据格式为PCM数据,目前SDK支持输出不同环节的音频...
方案架构图 调用时序图 接口及使用 通过继承AliRtcEventListener回调类,实现 onAudioSampleCallback 回调接收音频媒体数据,并根据业务场景使用相应的数据源。onAudioSampleCallback:订阅的音频数据回调。参数 类型 描述 type ...
输出音频数据 当应用需要输出音频媒体数据时,首先需要先注册registerAudioObserver接口,实现AliAudioObserver回调,用于接收音频媒体数据。数据格式为PCM数据,目前SDK支持输出不同环节的音频数据,注册通过AliAudioType参数指明当前回调...
使用音频回调 AliAudioObserver 接收音频媒体数据,并根据业务场景使用相应的数据源。registerAudioObserver:注册音频数据回调。public abstract void registerAudioObserver(AliRtcEngine.AliAudioType audioType,AliRtcEngine....
名称 类型 描述 Channels String 源媒体音频声道数。取值范围:[1,8]。Samplerate String 源媒体音频采样率。取值范围:[0,320000]。单位:Hz。AliyunOutput 作业输出类型 名称 类型 描述 OutputFile AliyunOSSFile 输出文件。TemplateId ...
利用智能媒体管理服务的人工智能(AI)引擎对图片、视频、音频等媒体文件进行分析得到的标签、人物、文本等丰富的元数据信息。项目 开发者使用智能媒体管理服务的基本单元。开发者通过创建项目来使用IMM的功能,为数据集配置限额。数据集 ...
利用智能媒体管理服务的人工智能(AI)引擎对图片、视频、音频等媒体文件进行分析得到的标签、人物、文本等丰富的元数据信息。应用场景 企业文件管理系统 您可以根据关键词查询文件,例如查询包含某个关键词的文件,查询包含某个人物的视频...
智能标签搜索是阿里云的AI服务,可自动识别媒体内容,生成多维度结构化标签。本文深度解析其核心能力、应用场景与API接入指南,助您盘活海量媒体资产,实现精准检索与智能应用。
本文介绍媒体处理的计费组成、计费方式、计费周期,以及媒体处理关联产品费用。计费项 媒体处理详细计费分为 音视频转码费用、音视频增强费用 和 视频AI费用,计费组成如下图,详细说明请参见 计费项。计费方式 媒体处理产品提供两种计费...
视频转码 优势 阿里云媒体处理 自建转码 高性价比 无需前期投资,只按实际用量付费。窄带高清 TM 和H.265技术,同等视频质量,文件更小,更省流量。需要储备大量转码资源,维护成本高。强大的转码能力 高速稳定的并行转码系统,按需动态...
接口说明 目录 音频设备相关接口 API 描述 支持的最低版本 GetRecordingDeviceList 获取系统中的录音设备列表。3.0 GetCurrentRecordingDeviceId 获取使用的录音设备id。3.0 SetCurrentRecordingDeviceId 选择录音设备id。3.0 ...
关闭自动发布音频流 aliRtcEngine.publishLocalAudioStream(false);关闭自动发布屏幕流 aliRtcEngine.publishLocalScreenShareStream(false);执行后,即使开启摄像头、麦克风、屏幕共享等采集也不会推流。后续如果需要发布,重新调用传入...
当媒体文件为网络文件或需要自动化上传、大批量迁移时,可以通过调用智能媒体服务相关接口获取媒资上传地址和凭证,再调用OSS原生接口完成上传功能。通过阅读本文,您可以了解基于OSS API上传的方法。前提条件 您已经了解支持上传的文件...
通过阅读本文,您可以了解输出音频数据的方法。输出音频数据 开启音频数据接收回调。aliWebrtc.enableAudioVolumeIndicator=true;说明 该接口可以在实例化后任何时间开启。使用音频能量值回调。aliWebrtc.on("onAudioLevel",(data)={ ...
本文介绍媒体处理HLS加密的原理和接入流程,帮助用户更好的理解和实施HLS加密,在保证视频安全的同时,实现流畅的在线播放体验。工作原理 相关概念 媒体处理采用信封数据加密的方式加密视频。业务方调用阿里云密钥管理服务(KMS)生成数据...
智能审核服务基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容,包括色情、暴恐、政治敏感、广告识别等多个功能模块,同时支持视频图像文件内容质量审核功能,可以减轻人工审核的工作负担...
智能生产服务基于阿里云媒体AI技术,提供多种形式媒体内容处理及内容生成能力,支持智能封面、智能横转竖、绿幕抠图、人像抠图、智能图标模糊、智能去字幕、字幕提取、副歌检测、音乐节奏检测等多种媒体处理生成功能,提升媒体内容生产效率...
前提条件 在使用自定义音频播放前,请确保满足以下条件:用户已具备完整的音频播放模块开发能力,或已有成熟的第三方/自研音频播放器;了解基本的音频处理流程,包括 PCM 数据格式、采样率、声道数等概念;已集成 ARTC SDK 并完成基础音...
本文档介绍一种更便捷的素材对齐方式,您无需指定素材在时间线上的入出点,仅需配置对齐参数(详见下文),就能实现不同轨道间音频向视频对齐、音频向音频对齐、视频向音频对齐、视频向视频对齐的效果。二、详细介绍 2.1、时间线协议介绍 ...
MicrophoneAudioTrack 是本地麦克风音频轨道 继承自:LocalAudioTrack 属性列表 属性 类型 描述 支持的最低版本 isPlaying boolean 媒体轨道是否正在播放 3.0.0 trackMediaType TrackMediaType 媒体轨道类型 3.0.0 enabled boolean 本地轨道...
枚举名 描述 AudioFrameRawPcm 原始PCM音频帧格式 AudioFrameAacAdts AAC ADTS音频帧格式 AudioPcmFrame:音频PCM帧类。参数 类型 描述 frame_ms long 帧的时间戳。channels int 音频通道数,通常为1。sample_bits int 每个样本的位深,通常...
枚举名 描述 AudioFrameRawPcm 原始PCM音频帧格式 AudioFrameAacAdts AAC ADTS音频帧格式 AudioPcmFrame:音频PCM帧类。参数 类型 描述 frame_ms long 帧的时间戳。channels int 音频通道数,通常为1。sample_bits int 每个样本的位深,通常...
def PublishLocalAudioStream(enabled:bool)-int SDK默认设置推送音频流,在加入频道前也可以调用此接口修改默认值,并在加入频道成功时生效 参数说明 名称 类型 描述 enabled bool 是否开启/关闭本地音频流推送;true:开启音频流推送,...
SDK默认设置推送音频流,在加入频道前也可以调用此接口修改默认值,并在加入频道成功时生效 参数说明 名称 类型 描述 enabled bool 是否开启/关闭本地音频流推送;true:开启音频流推送,false:关闭音频流推送。返回说明 0表示方法调用成功...
true:订阅指定用户的音频流,false:停止订阅指定用户的音频流 返回说明 0表示方法调用成功,其他表示方法调用失败。SetVideoEncoderConfiguration 设置相机流视频编码属性。SetVideoEncoderConfiguration(config ...
应用场景 原创识别:准确识别是否为原创视频、编辑变换后视频、自媒体再创作视频。解决短视频领域维权问题,为视频素材交易生态提供技术基础,防止侵权视频侵害原创者及视频平台利益。视频查重:建立独立视频DNA库,在该库中对样本视频完成...
媒体处理中的音频编解码配置类型中支持以下五种Profile:aac_low aac_he aac_he_v2 aac_ld aac_eld 格式支持 媒体处理支持的输入格式 容器格式 3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM等。视频编码格式 H.264/AVC、H...
继承自:LocalTrack 属性列表 属性 类型 描述 支持的最低版本 isPlaying boolean 媒体轨道是否正在播放 3.0.0 trackMediaType TrackMediaType 媒体轨道类型 3.0.0 enabled boolean 本地轨道当前的启用状态。3.0.0 muted boolean 是否 mute 3...
媒体处理中的音频编解码配置类型中支持以下五种Profile:aac_low aac_he aac_he_v2 aac_ld aac_eld 格式支持 媒体处理支持的输入格式 容器格式 3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM等。视频编码格式 H.264/AVC、H...
true:订阅指定用户的音频流,false:停止订阅指定用户的音频流 返回说明 0表示方法调用成功,其他表示方法调用失败。setVideoEncoderConfiguration 设置相机流视频编码属性。public abstract void setVideoEncoderConfiguration...
术语 全称 中文 说明 OSS Object Storage Service 阿里云对象存储 媒体处理服务对用户存储于OSS的媒体文件进行转码,并将转码输出文件保存在MediaBucket中或者OutputBucket中。Bucket OSS Bucket OSS Bucket 遵守OSS Bucket定义,只能包括...
2024-05 发布日期 发布内容 相关文档 2024-05-10 接口更新:自2024年6月10日开始,查询媒体审核作业详情 最大可查询历史数据(Job信息)的时间范围为10天,右侧相关文档中其他任务最大可查询历史数据(Job信息)的时间范围为3个月。...
媒体重定向 媒体重定向可以将多种媒体格式重定向到终端用户的本地设备,实现在本地播放音频或视频文件,带来更流畅的媒体体验。使用场景 音频视频处理属于计算密集型的操作,对计算机的性能要求较高,开启媒体重定向具有以下优势:将多媒体...
本文介绍了利用智能媒体管理(IMM)媒体转码接口来实现音频转码的能力。功能简介 音频转码功能是指将一种音频格式转换为另一种格式的技术,其目的是提升音频文件的兼容性、在不降低音质的情况下减少文件体积。使用场景 音频格式兼容性:...
继承自:LocalAudioTrack 属性列表 属性 类型 描述 支持的最低版本 deviceId string 获取设备ID。1.0.0 isPlaying boolean 媒体轨道是否正在播放 1.0.0 接口列表 接口 描述 支持的最低版本 setDevice()更新设置轨道采集数据的媒体设备 1.0....
继承自:LocalAudioTrack 属性列表 属性 类型 描述 支持的最低版本 deviceId string 获取设备ID。1.0.0 isPlaying boolean 媒体轨道是否正在播放 1.0.0 接口列表 接口 描述 支持的最低版本 setDevice()更新设置轨道采集数据的媒体设备 1.0....
智能审核 类型说明 智能审核 是指对 视频、音频和图片媒体文件内容进行多维度精准识别,检测媒体文件中的风险或违规内容。点播媒体处理智能审核功能当前支持以下六种审核类型:审核类型 描述 鉴黄 检测媒体中是否包含色情或性感内容。暴恐...
功能概述 应用场景 原创识别:准确识别是否为原创视频、编辑变换后视频、自媒体再创作视频。解决短视频领域维权问题,为视频素材交易生态提供技术基础,防止侵权视频侵害原创者及视频平台利益。视频查重:建立独立视频DNA库,在该库中对...
返回 返回 MediaDeviceInfo[],本地所有可用的媒体设备列表 getMicrophones()枚举可用的音频输入设备,比如麦克风。调用成功后 SDK 会通过 MediaDeviceInfo 对象返回可用的音频输入设备。类型签名 getMicrophones():Promise ...
返回 返回 MediaDeviceInfo[],本地所有可用的音频播放设备列表 getDevices()枚举可用的媒体输入和输出设备,比如麦克风、摄像头、耳机等。调用成功后 SDK 会通过 MediaDeviceInfo 对象返回可用的媒体设备。类型签名 getDevices():Promise ...