音频自媒体-音频自媒体文档介绍内容-移动阿里云

Windows

输出音频数据当应用需要输出音频媒体数据时，首先需要先继承AliRtcEventListener接口，实现onAudioSampleCallback回调，用于接收音频媒体数据。音频数据通过回调中audioSample参数返回，数据格式为PCM数据，目前SDK支持输出不同环节的音频...

Windows

方案架构图调用时序图接口及使用通过继承AliRtcEventListener回调类，实现 onAudioSampleCallback 回调接收音频媒体数据，并根据业务场景使用相应的数据源。onAudioSampleCallback：订阅的音频数据回调。参数类型描述 type ...

Android

输出音频数据当应用需要输出音频媒体数据时，首先需要先注册registerAudioObserver接口，实现AliAudioObserver回调，用于接收音频媒体数据。数据格式为PCM数据，目前SDK支持输出不同环节的音频数据，注册通过AliAudioType参数指明当前回调...

Android

使用音频回调 AliAudioObserver 接收音频媒体数据，并根据业务场景使用相应的数据源。registerAudioObserver：注册音频数据回调。public abstract void registerAudioObserver(AliRtcEngine.AliAudioType audioType,AliRtcEngine....

数据类型

名称类型描述 Channels String 源媒体音频声道数。取值范围：[1,8]。Samplerate String 源媒体音频采样率。取值范围：[0,320000]。单位：Hz。AliyunOutput 作业输出类型名称类型描述 OutputFile AliyunOSSFile 输出文件。TemplateId ...

基本概念

利用智能媒体管理服务的人工智能（AI）引擎对图片、视频、音频等媒体文件进行分析得到的标签、人物、文本等丰富的元数据信息。项目开发者使用智能媒体管理服务的基本单元。开发者通过创建项目来使用IMM的功能，为数据集配置限额。数据集 ...

概述

利用智能媒体管理服务的人工智能（AI）引擎对图片、视频、音频等媒体文件进行分析得到的标签、人物、文本等丰富的元数据信息。应用场景企业文件管理系统您可以根据关键词查询文件，例如查询包含某个关键词的文件，查询包含某个人物的视频...

智能标签搜索

智能标签搜索是阿里云的AI服务，可自动识别媒体内容，生成多维度结构化标签。本文深度解析其核心能力、应用场景与API接入指南，助您盘活海量媒体资产，实现精准检索与智能应用。

计费概述

本文介绍媒体处理的计费组成、计费方式、计费周期，以及媒体处理关联产品费用。计费项媒体处理详细计费分为音视频转码费用、音视频增强费用和视频AI费用，计费组成如下图，详细说明请参见计费项。计费方式媒体处理产品提供两种计费...

产品优势

视频转码优势阿里云媒体处理自建转码高性价比无需前期投资，只按实际用量付费。窄带高清 TM 和H.265技术，同等视频质量，文件更小，更省流量。需要储备大量转码资源，维护成本高。强大的转码能力高速稳定的并行转码系统，按需动态...

DingRtcEngineAudioDeviceManager

接口说明目录音频设备相关接口 API 描述支持的最低版本 GetRecordingDeviceList 获取系统中的录音设备列表。3.0 GetCurrentRecordingDeviceId 获取使用的录音设备id。3.0 SetCurrentRecordingDeviceId 选择录音设备id。3.0 ...

按需发布和订阅

关闭自动发布音频流 aliRtcEngine.publishLocalAudioStream(false);关闭自动发布屏幕流 aliRtcEngine.publishLocalScreenShareStream(false);执行后，即使开启摄像头、麦克风、屏幕共享等采集也不会推流。后续如果需要发布，重新调用传入...

基于OSS API上传

当媒体文件为网络文件或需要自动化上传、大批量迁移时，可以通过调用智能媒体服务相关接口获取媒资上传地址和凭证，再调用OSS原生接口完成上传功能。通过阅读本文，您可以了解基于OSS API上传的方法。前提条件您已经了解支持上传的文件...

Web

通过阅读本文，您可以了解输出音频数据的方法。输出音频数据开启音频数据接收回调。aliWebrtc.enableAudioVolumeIndicator=true;说明该接口可以在实例化后任何时间开启。使用音频能量值回调。aliWebrtc.on("onAudioLevel",(data)={ ...

HLS标准加密

本文介绍媒体处理HLS加密的原理和接入流程，帮助用户更好的理解和实施HLS加密，在保证视频安全的同时，实现流畅的在线播放体验。工作原理相关概念媒体处理采用信封数据加密的方式加密视频。业务方调用阿里云密钥管理服务（KMS）生成数据...

智能审核

智能审核服务基于海量标注数据和深度学习算法实现，从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容，包括色情、暴恐、政治敏感、广告识别等多个功能模块，同时支持视频图像文件内容质量审核功能，可以减轻人工审核的工作负担...

智能生产

智能生产服务基于阿里云媒体AI技术，提供多种形式媒体内容处理及内容生成能力，支持智能封面、智能横转竖、绿幕抠图、人像抠图、智能图标模糊、智能去字幕、字幕提取、副歌检测、音乐节奏检测等多种媒体处理生成功能，提升媒体内容生产效率...

自定义音频播放

前提条件在使用自定义音频播放前，请确保满足以下条件：用户已具备完整的音频播放模块开发能力，或已有成熟的第三方/自研音频播放器；了解基本的音频处理流程，包括 PCM 数据格式、采样率、声道数等概念；已集成 ARTC SDK 并完成基础音...

素材与素材时长自动对齐

本文档介绍一种更便捷的素材对齐方式，您无需指定素材在时间线上的入出点，仅需配置对齐参数（详见下文），就能实现不同轨道间音频向视频对齐、音频向音频对齐、视频向音频对齐、视频向视频对齐的效果。二、详细介绍 2.1、时间线协议介绍 ...

MicrophoneAudioTrack

MicrophoneAudioTrack 是本地麦克风音频轨道继承自:LocalAudioTrack 属性列表属性类型描述支持的最低版本 isPlaying boolean 媒体轨道是否正在播放 3.0.0 trackMediaType TrackMediaType 媒体轨道类型 3.0.0 enabled boolean 本地轨道...

数据结构

枚举名描述 AudioFrameRawPcm 原始PCM音频帧格式 AudioFrameAacAdts AAC ADTS音频帧格式 AudioPcmFrame:音频PCM帧类。参数类型描述 frame_ms long 帧的时间戳。channels int 音频通道数，通常为1。sample_bits int 每个样本的位深，通常...

数据结构

枚举名描述 AudioFrameRawPcm 原始PCM音频帧格式 AudioFrameAacAdts AAC ADTS音频帧格式 AudioPcmFrame:音频PCM帧类。参数类型描述 frame_ms long 帧的时间戳。channels int 音频通道数，通常为1。sample_bits int 每个样本的位深，通常...

AliRTCLinuxEngine接口

def PublishLocalAudioStream(enabled:bool)-int SDK默认设置推送音频流，在加入频道前也可以调用此接口修改默认值，并在加入频道成功时生效参数说明名称类型描述 enabled bool 是否开启/关闭本地音频流推送;true：开启音频流推送,...

AliRTCLinuxEngine接口

SDK默认设置推送音频流，在加入频道前也可以调用此接口修改默认值，并在加入频道成功时生效参数说明名称类型描述 enabled bool 是否开启/关闭本地音频流推送;true：开启音频流推送,false：关闭音频流推送。返回说明 0表示方法调用成功...

AliRTCEngine接口

true：订阅指定用户的音频流，false：停止订阅指定用户的音频流返回说明 0表示方法调用成功，其他表示方法调用失败。SetVideoEncoderConfiguration 设置相机流视频编码属性。SetVideoEncoderConfiguration(config ...

媒体DNA

应用场景原创识别：准确识别是否为原创视频、编辑变换后视频、自媒体再创作视频。解决短视频领域维权问题，为视频素材交易生态提供技术基础，防止侵权视频侵害原创者及视频平台利益。视频查重：建立独立视频DNA库，在该库中对样本视频完成...

媒体处理FAQ

媒体处理中的音频编解码配置类型中支持以下五种Profile：aac_low aac_he aac_he_v2 aac_ld aac_eld 格式支持媒体处理支持的输入格式容器格式 3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM等。视频编码格式 H.264/AVC、H...

LocalAudioTrack

继承自:LocalTrack 属性列表属性类型描述支持的最低版本 isPlaying boolean 媒体轨道是否正在播放 3.0.0 trackMediaType TrackMediaType 媒体轨道类型 3.0.0 enabled boolean 本地轨道当前的启用状态。3.0.0 muted boolean 是否 mute 3...

媒体处理常见问题

媒体处理中的音频编解码配置类型中支持以下五种Profile：aac_low aac_he aac_he_v2 aac_ld aac_eld 格式支持媒体处理支持的输入格式容器格式 3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM等。视频编码格式 H.264/AVC、H...

AliRTCLinuxEngine接口

true：订阅指定用户的音频流,false：停止订阅指定用户的音频流返回说明 0表示方法调用成功，其他表示方法调用失败。setVideoEncoderConfiguration 设置相机流视频编码属性。public abstract void setVideoEncoderConfiguration...

术语表

术语全称中文说明 OSS Object Storage Service 阿里云对象存储媒体处理服务对用户存储于OSS的媒体文件进行转码，并将转码输出文件保存在MediaBucket中或者OutputBucket中。Bucket OSS Bucket OSS Bucket 遵守OSS Bucket定义，只能包括...

功能发布记录

2024-05 发布日期发布内容相关文档 2024-05-10 接口更新：自2024年6月10日开始，查询媒体审核作业详情最大可查询历史数据（Job信息）的时间范围为10天，右侧相关文档中其他任务最大可查询历史数据（Job信息）的时间范围为3个月。...

体验相关规则

媒体重定向媒体重定向可以将多种媒体格式重定向到终端用户的本地设备，实现在本地播放音频或视频文件，带来更流畅的媒体体验。使用场景音频视频处理属于计算密集型的操作，对计算机的性能要求较高，开启媒体重定向具有以下优势：将多媒体...

音频转码

本文介绍了利用智能媒体管理（IMM）媒体转码接口来实现音频转码的能力。功能简介音频转码功能是指将一种音频格式转换为另一种格式的技术，其目的是提升音频文件的兼容性、在不降低音质的情况下减少文件体积。使用场景音频格式兼容性：...

MicrophoneAudioTrack

继承自：LocalAudioTrack 属性列表属性类型描述支持的最低版本 deviceId string 获取设备ID。1.0.0 isPlaying boolean 媒体轨道是否正在播放 1.0.0 接口列表接口描述支持的最低版本 setDevice()更新设置轨道采集数据的媒体设备 1.0....

PlaybackAudioTrack

继承自：LocalAudioTrack 属性列表属性类型描述支持的最低版本 deviceId string 获取设备ID。1.0.0 isPlaying boolean 媒体轨道是否正在播放 1.0.0 接口列表接口描述支持的最低版本 setDevice()更新设置轨道采集数据的媒体设备 1.0....

智能审核

智能审核类型说明智能审核是指对视频、音频和图片媒体文件内容进行多维度精准识别，检测媒体文件中的风险或违规内容。点播媒体处理智能审核功能当前支持以下六种审核类型：审核类型描述鉴黄检测媒体中是否包含色情或性感内容。暴恐...

视频DNA

功能概述应用场景原创识别：准确识别是否为原创视频、编辑变换后视频、自媒体再创作视频。解决短视频领域维权问题，为视频素材交易生态提供技术基础，防止侵权视频侵害原创者及视频平台利益。视频查重：建立独立视频DNA库，在该库中对...

DingRTC

返回返回 MediaDeviceInfo[]，本地所有可用的媒体设备列表 getMicrophones()枚举可用的音频输入设备，比如麦克风。调用成功后 SDK 会通过 MediaDeviceInfo 对象返回可用的音频输入设备。类型签名 getMicrophones():Promise ...

DingRTC

返回返回 MediaDeviceInfo[]，本地所有可用的音频播放设备列表 getDevices()枚举可用的媒体输入和输出设备，比如麦克风、摄像头、耳机等。调用成功后 SDK 会通过 MediaDeviceInfo 对象返回可用的媒体设备。类型签名 getDevices():Promise ...