语音系统sdk-语音系统sdk文档介绍内容-移动阿里云

HarmonyOS Next SDK

本文介绍了如何使用阿里云智能语音服务提供的HarmonyOS Next NUI SDK，包括SDK下载安装、关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取Access Token，详情请参见获取...

错误码查询

错误码分类错误码表示服务端错误码服务端报错 8位错误码，例如：50000000 客户操作错误导致的服务端报错 8位错误码，例如：40020105 SDK错误码移动端SDK（iOS SDK/Android SDK）6位错误码，例如：140008、240070 JAVA SDK/C++ SDK/...

WebSocket协议说明

如果您不希望引入阿里云智能语音交互产品SDK，或者目前提供的SDK不能满足您的要求，可以基于本文描述自行开发代码访问阿里语音服务。前提条件在使用WebSocket协议对接之前，请先阅读 API详情中的服务交互流程说明。鉴权服务端通过临时...

语音通知/语音验证码FAQ

具体操作请参见通过控制台上传语音文件或通过API/SDK上传语音文件。语音通知是否支持黑名单功能？暂时不支持黑名单功能。如果您需要禁止某个号码的外呼，建议您直接从呼叫名单中删除该号码。语音文件怎么查看语音ID？请登录语音服务...

C++ SDK

本文介绍如何使用阿里云智能语音交互提供的C++ SDK，包括SDK的安装方法、SDK代码示例以及常见问题等。SDK下载说明当前最新版本：3.2.1b，支持Linux平台。发布日期：2024年12月25日。使用SDK前，请先阅读接口说明，详情请参见接口说明。...

从这里开始

智能语音交互产品基于语音识别、语音合成、自然语言理解等技术，实现“能听、会说、懂你”式的智能人机交互体验，适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。本文为您介绍如何使用智能语音交互，帮助您快速了解其使用...

数字人对话AndroidSDK

其他限制：可参考 RTC SDK下载/集成云端渲染数字人的语音交互模式主要有两种模式：tap2talk模式、duplex双工模式在tap2talk模式下，SDK内部的语音服务会实时识别用户的语音输入。但是用户想打断数字人，需要通过额外事件来触发，比如点击...

移动端应用如何安全访问智能语音交互服务

用户应用服务器向阿里云智能语音服务发起创建语音Token的真正请求，此处请您使用阿里云SDK或智能语音交互SDK来创建Token，创建Token所需的AccessKey ID和AccessKey Secret保存在您的应用服务器上。由于语音Token具有时效性，您可以在有效期...

获取Token

通过SDK获取Token，当系统的时间不是标准时间时会获取失败，在SDK中是否可以自己设置timestamp，而不是获取系统的时间？获取的Token是否有时间限制？获取Token是否有次数限制？获取Token后调用服务报错”'status':40020105,'message':'Meta...

离线语音合成使用问题

SDK和语音包是完全独立的，SDK里并没有预置语音包。回调数据长度和时间对应关系是怎样的？以采样率16000的pcm，每次回调8000个字节为例，一秒钟包含字节数：16000×sizeof(short)=32000个，所以8000个字节对应时间：8000/32000秒=250毫秒。...

语音识别FAQ

移动端鸿蒙Next SDK中如何修改识别语音采样率为8000HZ或者16000HZ?计费类录音文件识别极速版不支持试用吗？功能类实时转写说话有停顿，但是语音识别不断句怎么办？如果是vad断句情况下，实时转写的vad断句依赖对音频中静音数据的判断，...

WebSocket协议说明

如果您不希望引入阿里云智能语音交互产品SDK，或者目前提供的Java、C或C++的SDK不能满足您的要求，可以基于本文描述自行开发代码访问阿里语音服务。功能介绍阿里云智能语音交互产品通过WebSocket协议对外提供实时语音流语音转写功能，支持...

RTC纯通道接入方案

纯语音场景在纯语音场景下，阿里云推荐的架构如下：在上述架构中，ARTC SDK和Linux SDK进入同一个RTC房间。Linux SDK会接收来自ARTC SDK的音频流，以及将解码后的音频数据传递给业务层。您也可以根据需求对音频做AI服务编排，经过ASR、TTS...

其他子产品SDK参考文档

本文为您提供其他子产品（包括 DLC、DSW、EAS 等）SDK相关文档入口链接汇总...FeatureStore Python SDK 使用FeatureStore Python SDK搭建推荐系统介绍如何使用FeatureStore Python SDK完成特征平台在推荐场景中全流程的创建以及上线的过程。

AI实时互动场景

易集成：阿里云为您提供四种集成方式来帮助您搭建AI实时互动系统，以满足不同场景和需求下的应用构建。实现原理用户通过终端SDK发起与云端AI智能体的实时音视频通话；AI智能体接收到用户的音视频输入后，开始运转工作流，并输出AI的响应...

Web端配置并运行

满足各类教育场景，使得老师、学生可随时随地通过文字、语音、视频、白板、屏幕共享等进行教学和学习。本文介绍Web端接入互动课堂的流程。前提条件已接入、运行、部署开源的Appserver服务。具体操作，请参见服务端配置与运行。项目框架 ...

IvrCall-向指定号码发起交互式语音通话

如果开启了消息回执，语音服务会将客户按键信息返回给调用的业务系统。该接口可用于收集客户的订单确认、问卷调查、满意度调查等信息。QPS 限制单用户调用频率：100 次/秒。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算...

API错误码

isv.VOICE_CALL_FAIL 呼叫发起失败请登录语音服务控制台业务统计页面，查看语音呼叫失败原因。isv.BILLID_NOT_EXIST 计费账号不存在请您登录语音服务控制台，在号码管理页面确认主叫号码是否属于您的账号。isv.BLACK_KEY_CONTROL_...

开发参考

增强版文本审核增强版PLUS服务文本审核增强版PLUS服务SDK及接入指南图片审核增强版同步检测API 图片审核增强版异步检测API 图片审核增强版多Service同步检测API 图片审核增强版SDK及接入指南语音审核增强版API 语音审核增强版SDK及接入...

C++ SDK

本文介绍如何使用阿里云智能语音服务提供的C++ SDK，包括SDK的安装方法及SDK代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取Access Token，详情请参见获取Token概述。下载安装 SDK...

API接口详情

通过阅读本文，您可以了解Web SDK接口详情。API概览说明旧版本SDK中存在弃用参数、方法，建议您将SDK升级到最新版本，请参见 Web使用指南。类/协议 API 说明 ARTCAICallEngine 引擎接口定义 call 开始通话 handup 挂断说明建议您在页面...

语音通知实现告警功能

本文以语音通知服务功能为例，为您介绍如何通过语音通知的功能，实现自身的系统、设备、服务器等相关的告警功能。适用场景适用于科技公司的各种语音告警需求。当您的系统检测到服务器出现异常，或者物联网等设备出现异常时，可以通过语音...

移动端iOS Lite SDK

通过SDK对接通义大模型以及后端多种Agent，能够支持用户接入语音对话、天气、音乐、新闻等多种能力，并支持视频和图像的大模型对话能力。多模态实时交互服务架构前提条件开通阿里云百炼实时多模交互应用，获取 Workspace ID、APP ID 和 ...

C++ SDK

本文介绍如何使用阿里云智能语音服务提供的C++ SDK，包括SDK的安装方法及SDK代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取Access Token，详情请参见获取Token概述。下载安装 SDK...

什么是智能语音交互

智能语音交互（Intelligent Speech Interaction）是基于语音识别、语音合成、自然语言理解等技术，为企业在多种实际应用场景下，赋予产品“能听、会说、懂你”式的智能人机交互功能。适用于智能问答、智能质检、法庭庭审实时记录、实时演讲...

IVR SDK前端接入指南

服务端准备工作因为IVR SDK是嵌入到了您的自有业务系统中，在IVR SDK的使用过程中，会发起多个请求到自有业务系统的服务端，请求的调用地址可以通过四、config可选配置中的ajax相关配置来设置。需要将IVR SDK发出的请求经过您的服务端转发...

C++ SDK

本文介绍如何使用阿里云智能语音服务提供的C++ SDK，包括SDK的安装方法及SDK代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取Access Token，详情请参见获取Token概述。下载安装 SDK...

数据结构

通过阅读本文，您可以了解Web SDK涉及的数据类型。数据结构概览说明旧版本SDK中存在弃用参数、方法，建议您将SDK升级到最新版本，请参见 Web使用指南。结构类型数据类型描述 Enum AICallAgentType 智能体类型 AICallAgentState 智能体...

接口说明

对一分钟内的短语音进行识别，适用于对话聊天、控制口令、语音输入法、语音搜索等较短的语音识别场景。功能简介 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求，NUI SDK既能提供全链路的语音能力，同时可做原子能力SDK...

SDK参考

一、SDK版本说明 1.1 版本概述阿里云语音服务 OpenAPI门户为用户提供 V1.0 SDK 和 V2.0 SDK 两个版本：V1.0 SDK：原版SDK，目前已不再维护。V2.0 SDK：升级版SDK，主要提升SDK的健壮性及使用体验。1.2 版本选择建议重要提示：强烈推荐...

C++ Demo

本文介绍了如何使用阿里云智能语音服务提供的C++ SDK，包括SDK的安装方法及SDK代码示例。前提条件当前最新版本：1.2.2。发布日期：2018年11月14日。使用SDK前，请先阅读接口说明，详情请参见接口说明。已开通智能语音交互并获取AccessKey...

错误码

为方便进行问题定位，本文为您介绍语音识别业务中详细的错误码信息。错误码识别成功错误码错误信息描述 0 SUCCESS 成功配置或参数错误错误码错误消息描述解决方案 240999 DEFAULT_ERROR 内部默认错误。内部错误，请重试。240001 ...

错误码

为方便进行问题定位，本文为您介绍语音识别业务中详细的错误码信息。错误码识别成功错误码错误信息描述 0 SUCCESS 成功配置或参数错误错误码错误消息描述解决方案 240999 DEFAULT_ERROR 内部默认错误。内部错误，请重试。240001 ...

新手指引

通过控制台使用语音服务 API 如果您习惯使用API或SDK编码，可通过API来发送语音。通过API使用语音服务常见问题公共模式/专属模式FAQ 语音服务使用FAQ 企业资质FAQ 语音模板FAQ 语音通知/语音验证码FAQ 语音计费FAQ 视频讲解

产品简介

实时高效合成：系统具有出色的响应速度和流式语音合成处理能力，无论是长篇文档还是短句指令，都能实现快速、准确的实时语音合成。支持富语言声音事件以及多情感的高拟人语音生成，例如笑声、语气词等，以及不同情感表现的高拟人语音生成。...

Java SDK

本文档介绍如何使用 DashScope Java SDK 调用实时语音识别（Qwen-ASR-Realtime）模型。用户指南：模型介绍、功能特性和示例代码请参见实时语音识别-通义千问请求参数以下参数通过 OmniRealtimeParam 的链式方法设置。参数类型是否必须...

数据结构

通过阅读本文，您可以了解iOS SDK涉及的数据类型。数据结构概览说明旧版本SDK中存在弃用参数、方法，建议您将SDK升级到最新版本，请参见 iOS使用指南。结构类型数据类型描述 Enum ARTCAICallAgentType 智能体类型 ARTCAICallAgentState...

移动端SDK说明

时长限制：识别语音文件大小不能超过100 MB。设置多语言识别：在管控台编辑项目中进行模型选择，详情请参见管理项目。服务地址访问类型说明 URL Host 外网访问所有服务器均可使用外网访问URL。上海：...

接口说明

为满足不同用户需求，NUI SDK既能提供全链路的语音能力，同时可做原子能力SDK进行使用，并保持接口的统一。使用须知请在编码时严格遵循以下要求，否则可能导致识别失败（识别结果为空）。输入格式：PCM编码、16bit采样位数、单声道（mono...

通过API/SDK上传语音文件

您可以通过调用API或使用SDK进行文件上传。只支持上传专属模式外呼。语音文件上传完成后会进入审核阶段，预计2小时内会完成审核。说明请选择WAV或MP3格式且小于2 MB的语音文件。URL：...