语音电话api-语音电话api文档介绍内容-移动阿里云

UpgradeVideoFile-视频升级

从语音通话升级到视频通话。接口说明目前 5G 视频通话功能处于邀约制阶段，您需要联系运营经理为您开通此功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码...

时间戳功能介绍

实时长文本语音合成服务在输出音频流的同时，可输出每个汉字/英文单词在音频中的时间位置，即时间戳。时间戳功能又叫字级别音素边界接口，该时间信息可用于驱动虚拟人口型、做视频配音字幕等。功能概述实时长文本语音实时合成服务的时间戳...

智能语音交互呼出业务流程

步骤二：调用API发起外呼发起智能外呼通话有以下两个接口，您可按需任选其一。调用 SmartCall 接口发起智能语音外呼通话。调用 SmartCallOperate 接口在智能外呼通话中发起指定动作。调用API接口发起外呼后，自动调用智能语音交互呼入回调...

ResumeVideoFile-恢复视频

在语音通话中暂停视频播放后，恢复视频播放。接口说明目前 5G 视频通话功能处于邀约制阶段，您需要联系运营经理为您开通此功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以...

ListCallTask-获取通话任务状态列表

创建语音通话任务后，可以查看通话任务状态，包括：任务ID、任务当前状态、任务所选的模板信息等。QPS 限制单用户调用频率：100 次/秒。接口说明您也可以在语音服务控制台任务中心页面，查看任务状态，并根据需要对任务进行启动、定时...

CosyVoice声音复刻API

public Voice createVoice(String targetModel,String prefix,String url,VoiceEnrollmentParam customParam)throws NoApiKeyException,InputRequiredException 重要 targetModel：驱动音色的语音合成模型，须和后续调用语音合成接口时使用...

智能语音对话系统

语音合成参数 TTS_REFERENCE_AUDIO_ID=""#音色克隆参考音频 ID 三、体验与集成通过 Web UI 进行语音对话启动 Web UI 服务。在项目根目录下执行以下命令：python3 webui.py-ssl-port 7860 启动参数说明：ssl：启用 HTTPS（需要 asset/test...

PlayVideoFile-插播视频

在语音通话中插播视频文件。接口说明目前 5G 视频通话功能处于邀约制阶段，您需要联系运营经理为您开通此功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码...

QueryVideoPlayProgress-查询视频进度

在语音通话中插播视频文件后，查询视频播放进度。接口说明目前 5G 视频通话功能处于邀约制阶段，您需要联系运营经理为您开通此功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer...

QueryCallDetailByCallId-查询指定通话的呼叫详情

11000000300005：语音 IVR，向指定号码发起交互式语音通话。11000000300009：语音 SIP。11030000180001：智能外呼。说明获取的 CallId 与 ProdId 参数值必须匹配，不匹配或传入错误的产品 ID 将无法返回 Data。11000000300006 QueryDate ...

实时音视频简介

语音通话 数字人通话视觉理解通话功能特性功能功能说明常见应用场景计费说明视频通话两人或多人视频通话，支持最低480P、720P、1080P高清画质。1对1视频、多人视频会议、视频客服、实时音视频通话等。音视频通话费用 语音通话 两人...

实时音视频简介

语音通话 数字人通话视觉理解通话功能特性功能功能说明常见应用场景计费说明视频通话两人或多人视频通话，支持最低480P、720P、1080P高清画质。1对1视频、多人视频会议、视频客服、实时音视频通话等。音视频通话费用 语音通话 两...

使用语音审核增强版识别语音违规风险

接口功能仅返回有违规风险的语音切片内容。默认不提供语音切片临时地址。通过输入参数（liveId）区分直播流和文件。返回所有语音切片内容和转写文本。提供语音切片临时地址用于人工复审。调整为根据输入参数（service）区分场景。功能特性...

AI实时互动场景

以创建语音通话工作流模板为例：以创建语音通话工作流模板为例：您只需要配置以下3个节点，就能完成语音通话工作流的创建。您可以前往 Demo体验，以全面了解上述能力。您也可以前往快速入门，开始AI实时互动能力的构建。产品优势全球高...

AI实时互动场景

以创建语音通话工作流模板为例：以创建语音通话工作流模板为例：您只需要配置以下3个节点，就能完成语音通话工作流的创建。您可以前往 Demo体验，以全面了解上述能力。您也可以前往快速入门，开始AI实时互动能力的构建。产品优势全球高...

语音服务的审计事件

IvrCall 向指定号码发起交互式语音通话。ListCallTask 获取通话任务。ListCallTaskDetail 获取通话任务细节列表。ListComplaintRecordTemplateUrl 查询投诉模板。ListDictionaryForComplaint 查询字典,支持数据来源和举报来源。...

回调HTTP接口

当前支持以下回调接口：智能语音交互呼出回调HTTP接口语音平台发起呼叫后，通过智能外呼回调HTTP接口，在通话中把转换后的语音文本回传给业务方，业务方把下一步的执行动作返回给语音平台。智能语音交互呼入回调HTTP接口用户拨打号码发起...

SDK参考

本文档介绍阿里云语音服务各语言SDK的版本说明、下载方式、安装方法及使用示例，帮助您快速集成语音服务功能。一、SDK版本说明 1.1 版本概述阿里云语音服务 OpenAPI门户为用户提供 V1.0 SDK 和 V2.0 SDK 两个版本：V1.0 SDK：原版SDK，...

语音通知实现告警功能

当您的系统检测到服务器出现异常，或者物联网等设备出现异常时，可以通过语音通知功能，以语音电话的形式，给告警处理人拨打电话，电话将播报您预先申请的语音通知模板中的内容，在语音通知模板中，您也可以添加变量，从而在实际使用时替换...

AI实时互动概览

电话呼出&呼入快速入门自定义智能体形象您可以为所创建的智能体上传一张图片，以便在语音通话场景中展示该智能体的形象。智能体情绪识别智能体能够识别用户当前的情绪，并做出带有情感色彩的回应。欢迎词您可以在控制台中配置欢迎词...

国内语音服务定价

语音通知按量计费语音通知类型语音分钟数阶梯（分钟数/月）分钟数≤5万 5万分钟数≤10万 10万分钟数≤50万 50万分钟数≤100万公共模式（元/分钟）￥0.11 专属模式（元/分钟）￥0.11￥0.108￥0.104￥0.10 套餐包为了降低用户的使用成本...

音视频通话快速入门

当您绑定的工作流类型为语音通话时，可以在高级功能配置中上传自定义形象，以便在语音通话场景中展示该形象。单击提交，完成音视频智能体创建。第三步体验智能体消息对话智能体创建完成后，您可以通过扫描体验二维码来进行智能体的体验...

语音服务

语音服务（Voice Messaging Service，VMS），是阿里云为了方便用户使用语音能力，联合运营商提供稳定可靠、安全可信的云通信服务。包含语音通知、语音验证码、语音机器人等丰富的PaaS/SaaS产品，具备高可用、高并发、高质量、便捷接入的...

智能语音交互

智能语音交互（Intelligent Speech Interaction），是基于语音识别、语音合成、自然语言理解等技术，为企业在多种实际应用场景下，赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中，包括智能问答、智能质检、法庭...

发送语音任务

相关API 您也可以通过API接口发送语音任务。向指定号码发送语音验证码、文本转语音类型的语音通知、带变量的语音通知，请使用 SingleCallByTts 接口。向指定号码发送语音通知文件类型的语音通知，请使用 SingleCallByVoice 接口。常见...

电话呼出&呼入快速入门

再来到智能体管理工作台，点击创建智能体，选择刚刚创建的 语音通话 类型的工作流，勾选电话呼出、电话呼入选项，完成智能体的创建。步骤二：控制台体验呼出在智能体管理工作台页面找到刚刚创建的智能体，点击体验电话呼出。填入...

含UI集成方案

自定义智能体形象您可以为所创建的智能体上传一张图片，以便在语音通话场景中展示该智能体的形象。智能体情绪识别智能体能够识别用户当前的情绪，并做出带有情感色彩的回应。欢迎词您可以在控制台中配置欢迎词内容，当用户与AI智能体...

API详情

paraformer-8k-v1 Paraformer中语音模型服务中文语音识别模型，支持8kHz电话语音识别。paraformer-mtl-v1 Paraformer中语音模型服务多语言语音识别模型，支持16kHz及以上采样率的音频或视频语音识别。支持的语种/方言包括：中文普通话、...

含UI集成方案

电话呼出&呼入快速入门自定义智能体形象您可以为所创建的智能体上传一张图片，以便在语音通话场景中展示该智能体的形象。智能体情绪识别智能体能够识别用户当前的情绪，并做出带有情感色彩的回应。欢迎词您可以在控制台中配置欢迎词...

含UI集成方案

电话呼出快速入门自定义智能体形象您可以为所创建的智能体上传一张图片，以便在语音通话场景中展示该智能体的形象。智能体情绪识别智能体能够识别用户当前的情绪，并做出带有情感色彩的回应。欢迎词您可以在控制台中配置欢迎词内容，当...

产品简介

该组件功能丰富，提供纯语音通话和视频通话功能，支持 PC、移动端、IoT 设备等多终端接入。音视频通话可实现一对一通话及多人会议，通话过程中支持屏幕录制、屏幕共享、截图等功能，同时支持即时文字消息和文件传输。此外，支持实时语音...

回执消息简介与配置流程

当您使用语音服务的API接口发送外呼后，可以通过轻量消息队列（原MNS）消费模式或HTTP批量推送模式来接收语音服务的回执消息。说明如果出现网络异常、响应超时等情况，可能导致回执消息推送重复。HTTP批量推送模式的响应超时时间为700 ms...

语音计费FAQ

语音服务套餐包不是一个号码对应一个套餐包，套餐包的抵扣和使用的语音功能有关，例如：语音通知计费时优先抵用语音通知套餐包中分钟数，语音验证码计费时优先抵用语音验证码套餐包中条数。更多计费相关，请参见国内语音服务定价。语音...

语音模板FAQ

语音模板是向终端用户发起呼叫后，用户接听电话时听到的音频内容。语音模板分为文本转语音模板和语音通知文件。文本转语音模板：指模板的内容是文本，在播放时自动转化为语音。例：尊敬的阿里云用户您好，您的验证码是${vericode}。变量是...

计费项

支持服务语音识别：录音文件识别、实时语音识别、一句话识别语音合成：语音合成语音分析：说话人识别、声音事件检测、性别识别、语种识别语音识别：录音文件识别、实时语音识别、一句话识别、录音文件识别（极速版）、录音文件识别（闲...

语音识别输入格式FAQ

本文主要介绍智能语音交互的语音识别输入格式说明，以及输入语音格式不符合要求时常见问题以及方法，您可以优先在文本档获取对应解决方案。语音识别各服务支持的语音输入格式语音识别服务语音输入格式说明一句话识别支持的输入格式：单...

ExecuteCallTask-执行语音通话任务

执行通话任务。接口说明 QPS 限制单用户调用频率：100 次/秒。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权信息下表是API对应的授权信息，...

什么是智能语音交互

智能语音交互（Intelligent Speech Interaction）是基于语音识别、语音合成、自然语言理解等技术，为企业在多种实际应用场景下，赋予产品“能听、会说、懂你”式的智能人机交互功能。适用于智能问答、智能质检、法庭庭审实时记录、实时演讲...

产品简介

产品介绍语音合成CosyVoice大模型服务是依托大规模预训练语言模型，深度融合文本理解和语音生成的一项新型语音合成技术，能够精准解析并诠释各类文本内容，将其转化为宛如真人般的自然语音。产品优势高度拟人化：采用阿里通义语音实验室...

通过控制台上传语音文件

语音文件是向终端用户发起呼叫后，用户接电话时听到的音频内容。您可以在控制台上传语音通知文件、通话中的放音文件以及智能语音交互放音文件，上传后语音文件审核完成即可使用。前提条件注册阿里云账号并完成企业实名认证。已开通 ...