音频实时sdk-音频实时sdk文档介绍内容-移动阿里云

实时音视频ARTC SDK简介

欢迎使用实时音视频ARTC SDK来实现您的业务需求，阿里云实时音视频ARTC通过多年以来服务全球客户的深厚技术沉淀，以RTC形态向全球的开发者开放的产品，致力于帮助全球的开发者快速搭建高性价比的实时音视频互动解决方案。API设计与回调机制...

实时音视频ARTC SDK简介

欢迎使用实时音视频ARTC SDK来实现您的业务需求，阿里云实时音视频ARTC通过多年以来服务全球客户的深厚技术沉淀，以RTC形态向全球的开发者开放的产品，致力于帮助全球的开发者快速搭建高性价比的实时音视频互动解决方案。API设计与回调机制...

交互流程与实现

本文介绍如何使用SDK来支持实时记录场景下的音频识别流程。交互流程前提条件安装智能语音交互实时转写SDK 创建实时记录并成功获得推流地址示例代码 Java package com.alibaba.tingwu.client.demo.realtimemeeting;import ...

移动端IOS推流

SDK运行过程中收到音频的实时音频能量值。param rms:音频能量值，范围为-160至0*/-(void)onNuiRmsChanged:(float)rms;调用步骤重要请下载后在听悟的样例初始化代码中将Appkey和Token置为default，url置为您创建听悟实时记录返回的会议...

移动端Android推流

url String 是创建听悟实时记录任务时返回的会议MeetingJoinUrl 作为音频流推送地址，在后续实时音频流识别时通过该地址进行推流。service_mode String 是必须填“1”，表示启用在线功能。device_id String 是设备标识，唯一表示一台...

移动端Harmony推流

url String 是创建听悟实时记录任务时返回的会议MeetingJoinUrl 作为音频流推送地址，在后续实时音频流识别时通过该地址进行推流。service_mode String 是必须填“1”，表示启用在线功能。device_id String 是设备标识，唯一表示一台...

bind to the packaging phase-goals goal single/goal/goals/execution/executions/plugin/plugins/build/project Java SDK实时识别NlsClient类去连接server报错，提示ERROR NlsClient:102-failed to connect to server after 3 tries,...

安装SDK

智能语音交互实时转写SDK 当您使用实时记录时，创建实时任务后，安装此实时转写SDK（不含音频采集功能）实现实时音频流的采集和推送，以及实时转写结果的接收。安装阿里云SDK 本产品（听悟/2022-09-30及听悟/2023-09-30）两个版本的Open...

场景简介

AUI Kits 低代码应用方案提供实时音频语聊房场景的音视频应用UI组件，您可以根据业务需求复用AUI Kits低代码应用方案中的功能模块，快速搭建语聊房场景，有效降低研发成本和周期，提升业务效果。场景概述阿里云推出实时音频语聊房的方案，...

激活并授权离线SDK

能力使用方式实时视频分割实时视频分割SDK 离线图片分割离线图片分割SDK 实时无损分割实时无损分割SDK 离线视频分割离线视频分割SDK 证件识别证件识别SDK 车辆类识别车辆类识别SDK 通用文字识别通用文字识别SDK 肢体关键点肢体...

实时字幕

通过阅读本文，您可以了解如何通过AICallKit SDK实时获取到用户侧讲话字幕，及智能体回答字幕。使用说明本示例主要旨在帮助您在不含UI集成的情况下，如何利用API实现该功能。您需要提前集成AICallkit SDK。如何集成，请参见 Android集成...

Windows

音频识别SDK将音频数据发送至音频识别服务进行实时语音处理并返回识别结果。音频识别SDK为用户提供识别结果。更多信息，请参见智能语音交互。方案架构图调用时序图接口及使用通过继承AliRtcEventListener回调类，实现 ...

Android

音频识别SDK将音频数据发送至音频识别服务进行实时语音处理并返回识别结果。音频识别SDK为用户提供识别结果。更多信息，请参见智能语音交互。方案架构图调用时序图接口及使用通过调用接口 registerAudioObserver 注册音频数据回调，...

C++ SDK

setOnTranscriptionResultChanged 2.x 设置实时音频流识别中间结果回调函数。setOnTranscriptionCompleted 2.x 设置服务端结束服务回调函数。setOnChannelClosed 2.x 设置通道关闭回调函数。setOnMessage 3.1.16 设置服务端response ...

iOS和Mac

音频识别SDK将音频数据发送至音频识别服务进行实时语音处理并返回识别结果。音频识别SDK为用户提供识别结果。更多信息，请参见智能语音交互。方案架构图调用时序图接口及使用通过调用接口 subscribeAudioData 得到回调数据，从回调接口...

音视频终端SDK合规配置指引（安卓）

AUDIO 否音频录制时直播时、发起语音消息时获取麦克风声音直播推流SDK、实时音视频SDK、IM PaaS、短视频SDK TargetSDK 33之前：android.permission.WRITE_EXTERNAL_STORAGE TargetSDK 33之后：android.permission.READ_MEDIA_IMAGES ...

Android SDK

本文介绍了如何使用阿里云智能语音服务提供的Android NUI SDK，包括SDK下载安装、关键接口及代码示例。前提条件使用SDK前，首先阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取Access Token，详情请...

移动端Android SDK

本文介绍了如何使用阿里云百炼大模型服务提供的实时多模交互移动端 Android SDK，包括SDK下载安装、关键接口及代码示例。MultiModalDialog SDK是阿里云通义团队提供的支持音视频端到端多模实时交互的SDK。通过SDK对接通义大模型以及后端...

Android SDK

Android SDK是否可以上传OPUS音频数据，实现实时语音转文字？录音文件极速版：支持OPUS格式的音频文件。一句话识别和实时语音识别：仅支持用户输入PCM编码、16bit采样位数、单通道音频数据。支持PCM和OPUS两种音频传输格式（通过参数 sr_...

Android SDK

本文介绍了如何使用阿里云智能语音服务提供的Android NUI SDK，包括SDK下载安装、关键接口及代码示例。前提条件使用SDK前，首先阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取Access Token，详情请...

HarmonyOS Next SDK

类别兼容范围系统支持 HarmonyOS Next 5.0 版本，API LEVEL 12,DevEco Studio版本号 5.0.3.403 架构 arm64-v8a 此SDK还包含如下功能：功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成...

HarmonyOS Next SDK

类别兼容范围系统支持 HarmonyOS Next 5.0 版本，API LEVEL 12,DevEco Studio版本号 5.0.3.403 架构 arm64-v8a 此SDK还包含如下功能：功能是否支持一句话识别是实时语音识别是语音合成是实时长文本语音合成是流式文本语音合成...

功能发布记录

SDK选择与下载进阶功能进阶功能播放器SDK功能详情 2025-09 发布日期产品版本发布日志相关文档 2025-09-02 播放器SDK 短视频SDK 实时音视频SDK 场景化SDK v7.6.0 新增：RTC：新增订阅音频/视频的黑白名单。RTC：Android14屏幕共享...

自定义音频播放

关闭 SDK 内部播放当您需要使用 SDK 的自定义音频播放功能时，通常需要关闭 SDK 内部音频播放，推荐在调用 getInstance 创建引擎时传入 extras 参数来关闭 SDK 内部播放，相关参数如下：user_specified_use_external_audio_player：表示...

如何实现外部音频采集与推送

本文档介绍如何使用 AICallKit SDK，将您自行采集的音频 PCM 数据推送给 SDK，以实现自定义的音频采集功能。功能介绍在通话过程中，AICallKit 通常会使用默认的音频采集模块。但是受限于音频麦克风设备的差异性，当默认的音频采集没有办法...

SDK选择与下载

下载短视频SDK 实时音视频SDK 视频直播进行音视频通话、视频会议，直播连麦。实时音视频简介直播推流SDK 视频直播基础版可实现直播客户端推流。互动版RTC连麦SDK，包含了主播PK、连麦功能。下载直播推流SDK 超低延迟直播SDK 视频直播推...

C++ SDK

speechTranscriberRequest.h 实时音频流识别。FileTrans.h 录音文件识别。lib：SDK库文件。readme.md：SDK说明。release.log：版本更新说明。version：版本号。编译运行安装工具的最低版本要求如下：CMake 3.0 Glibc 2.5 Gcc 4.8.5 在...

C++ SDK

speechTranscriberRequest.h 实时音频流识别。FileTrans.h 录音文件识别。lib：SDK库文件。readme.md：SDK说明。release.log：版本说明。version：版本号。编译运行安装工具的最低版本要求如下：CMake 3.0 Glibc 2.5 Gcc 4.8.5 在Linux...

音视频终端SDK合规配置指引（iOS）

用于性能调优、故障分析兼容无需特殊配置直播推流SDK、实时音视频SDK、播放器SDK、上传SDK、超低延时直播SDK、短视频SDK、美颜特效SDK 拉流播放、音视频实时通信设备型号用于性能调优、故障分析兼容无需特殊配置直播推流SDK、实时音...

DingRTC

你可以使用这个方法将自己维护的 MediaStreamTrack 转换成一个可以用于 SDK 的音频轨道。3.0.0 createCustomVideoTrack()创建一个自定义的视频轨道。你可以使用这个方法将自己维护的 MediaStreamTrack 转换成一个可以用于 SDK 的视频轨道。...

DingRTC

你可以使用这个方法将自己维护的 MediaStreamTrack 转换成一个可以用于 SDK 的音频轨道。1.0.0 createCustomVideoTrack()创建一个自定义的视频轨道。你可以使用这个方法将自己维护的 MediaStreamTrack 转换成一个可以用于 SDK 的视频轨道。...

C++ SDK

speechTranscriberRequest.h 实时音频流识别。FileTrans.h 录音文件识别。lib：SDK库文件。readme.md：SDK说明。release.log：版本说明。version：版本号。编译运行安装工具的最低版本要求如下：CMake 3.0 Glibc 2.5 Gcc 4.8.5 在Linux...

播放与推流外部输入音频（包括音效、伴奏）

本文介绍如何在实时互动中，将外部音频（如背景音乐、音效或自定义的 PCM 音频流）混入 RTC SDK 的音频流中，实现本地播放和远端分享。功能介绍 ARTC SDK支持将外部音频输入进行本地播放和推流，兼容 MP4、WAV、AAC 等多种音频文件格式，也...

Java SDK

本文介绍如何使用智能语音交互一句话识别的Java SDK，包括SDK的安装方法及SDK代码示例等。注意事项在使用SDK前，请先阅读接口说明，详情请参见接口说明。从2.1.0版本开始，原有 nls-sdk-short-asr 更名为 nls-sdk-recognizer，升级时需...

方案介绍

ARTCKaraokeMusicLibraryImpl则是基于实时音视频SDK实现的曲库能力，包含丰富的歌曲资源；ARTCKaraokeRoomEngine：单纯的单人独唱、多人合唱功能接口，支持演唱开始、暂停、回复、停止、进度实时同步能力；ARTCKaraokeRoomEngineImpl则是...

快速接入

本文介绍Golang 集成实时音视频Linux ARTC SDK。准备工作解压Linux SDK压缩包，打开解压后的文件夹里面的Go文件夹，交付产物包括如下：artc_linux_go/├─alirtc│├─AliRTCEngine.go│├─AliRTCEngineImpl.go│├─...

如何获取音频PCM数据

在AI实时互动中，您可以通过集成AICallKit SDK来调用相关接口，来获取用户端或者智能体端的音频PCM数据。应用场景在数字人通话过程中，您可以利用获取的PCM数据以驱动数字人实现更为生动的肢体语言和表情。同时，您也可以将获取的PCM数据...

自定义音频采集

功能介绍 ARTC SDK 内部音频模块可满足您在应用中对基本音频功能的需求，但是在特定场景中，SDK 内部的音频采集模块可能无法满足开发需求，需要实现自定义音频采集功能，例如：解决音频采集设备被占用问题。开发者需要从定制的采集系统、...

快速接入

本文介绍Python 集成实时音视频Linux ARTC SDK。一、准备工作解压Linux SDK压缩包，打开解压后的文件夹里面的Python文件夹，交付产物包括如下：├─Release│└─lib#此目录包含需要链接的SDK动态库，以及打包后的elf文件。...

快速接入

本文介绍Python 集成实时音视频Linux ARTC SDK。一、准备工作解压Linux SDK压缩包，打开解压后的文件夹里面的Python文件夹，交付产物包括如下：├─Release│└─lib#此目录包含需要链接的SDK动态库，以及打包后的elf文件。...