自动语音电话-自动语音电话文档介绍内容-移动阿里云

API概览

交互式语音通话 API 标题 API概述 IvrCall 向指定号码发起交互式语音通话 向指定号码发起交互式语音通话。智能语音交互通话 API 标题 API概述 SmartCall 发起智能语音交互通话智能语音交互服务，是一种人机交互技术，它允许用户通过语音与...

音视频通话计费

计费说明音视频通话费用=语音通话单价×语音通话时长用量+各规格视频通话单价×相应规格视频通话时长用量说明视频通话规格（480P及以下、720P及以下等）由用户订阅的所有视频的集合分辨率决定。时长用量的精度为秒，计量时换算成分钟，...

语音记录查询

将加载命中当前查询条件的所有语音通话记录的通话时长、呼叫状态等信息。您也可单击通话报告列详情按钮，查看当前通话记录的详细通话报告。单击下载按钮，可将当前查询的所有数据导出到本地。相关阅读接口调用成功后，若呼叫状态为...

智能外呼机器人

智能外呼是综合利用自动语音识别（Automatic Speech Recognition，ASR）、文字转语音(Text To Speech，TTS)以及自然语言理解（Natural Language Understanding，简称NLU）技术并面向企业客户提供的一款智能客服机器人产品。智能外呼机器人...

通过API使用语音互动（语音IVR）

语音互动（语音IVR）是通过API接口向指定号码发起交互式语音通话，用户接听电话后，播放一段指定音频，用户根据音频引导，通过手机按键信息返回意图。工作原理语音互动（IVR）的完整工作流程包含API调用、云端处理、用户交互和结果回调四...

语音录制

功能概述语音录制功能用于录制 AI 实时互动中用户与智能体之间的语音通话，并将录音文件以 WAV 格式存储至您的对象存储（OSS）服务中。本功能支持以下两种录制模式：整通录制：将单次语音通话从开始到结束的完整内容，合流录制为一个 WAV ...

音视频通话费用

音视频通话费用=语音通话规格单价×语音通话时长用量+视频通话规格单价×视频通话时长用量通话定价音视频通话为后付费模式，精确到分钟计算（不足一分钟按一分钟计算），按日计费，实时扣费（每日零点后出前一日账单并扣费，具体出账时间...

AI实时互动

以创建语音通话工作流模板为例：您只需要配置以下3个节点，就能完成语音通话工作流的创建。您可以前往 Demo体验，以全面了解上述能力。您也可以前往快速入门，开始AI实时互动能力的构建。产品优势全球高可用、低延迟：依托阿里云的实时...

语音服务的审计事件

IvrCall 向指定号码发起交互式语音通话。ListCallTask 获取通话任务。ListCallTaskDetail 获取通话任务细节列表。ListComplaintRecordTemplateUrl 查询投诉模板。ListDictionaryForComplaint 查询字典,支持数据来源和举报来源。...

产品简介

该组件功能丰富，提供纯语音通话和视频通话功能，支持 PC、移动端、IoT 设备等多终端接入。音视频通话可实现一对一通话及多人会议，通话过程中支持屏幕录制、屏幕共享、截图等功能，同时支持即时文字消息和文件传输。此外，支持实时语音...

真实号管理

将号码关联到服务实例，使其能按预设的IVR流程、录音配置、坐席分配等逻辑来处理语音通话。服务实例是在语音服务中创建的一套具体的功能配置集合。在目标号码的操作列，单击绑定实例。在弹出的对话框中，从下拉列表中选择需要绑定的服务...

路由到语音电话

您可以通过事件规则过滤事件，将事件路由到语音电话，本文以自定义事件为例介绍将事件路由到语音电话的前提条件、操作步骤和结果验证。前提条件已开通事件总线。具体操作，请参见已开通事件总线EventBridge并授权。已创建自定义事件总线...

后付费模式

语音通话时长标准语音规格 0.008 元/分钟（前 200 分钟免费）暂不支持暂不支持视频通话时长 360P（640x360）及以下 0.016 元/分钟（前 200 分钟免费）540P（960x540）及以下 0.024 元/分钟（前 200 分钟免费）720P（1280x720）及以下 0....

用量统计

数据维度数据指标说明通话时长 语音通话时长统计时间段内使用纯语音通话的时长。说明在线用户创建或加入通话房间，与他人通过音视频进行交流时，即为通话状态。流畅（360P）通话时长统计时间段内使用 360P 及以下分辨率进行视频通话...

设置通话背景音

选择高级配置，在 语音通话背景音文件管理中，阿里云预设了官方背景音。您也可以上传自定义音色，在自定义背景音中，点击上传音频，获得环境音ID。2.通话时设置背景音音视频通话调用 StartAIAgentInstance-启动智能体实例时设置 ...

音视频通话智能体集成

AICallKit SDK能力概览功能项功能描述 iOS&Android Web 语音通话 用户通过语音与智能体交流对话，获取即时的信息反馈和服务。✔️ ✔️ 数字人通话通过视频方式与数字人对话，为用户提供更加真实的互动体验。✔️ ✔️ 视觉理解通话 ...

Android使用指南

AUIAICallAgentIdConfig.java/你的语音通话智能体ID private static String VOICE_AGENT_ID="控制台语音通话智能体ID;你的数字人通话智能体ID private static String Avatar_AGENT_ID="控制台数字人通话智能体ID;你的视觉理解通话智能体ID ...

情感陪伴

通话类型纯语音通话 数字人通话效果示例陪伴形式用户：语音 AI陪伴：语音用户：语音 AI陪伴：视频费用低中终端SDK SDK集成详情，请参见开发指南。SDK 说明 Web SDK 推荐使用桌面端浏览器：如Chrome等；移动端H5：如支付宝的H5、...

如何通过唤醒词快速启动通话

前提条件已经集成音视频通话智能体，并实现了基础的语音通话功能，请参考：集成概览功能实现核心过程说明：Token 预下发：业务服务器应提前将通话所需的 Token 下发并缓存在设备端，减少通话启动时的网络请求耗时。音频预采集：在创建...

Demo体验

可切换到语音通话、数字人通话等模式。电话通话场景电话呼出电话呼入使用自定义智能体在 Demo 中，您可以扫描自己创建的智能体二维码，以快速验证其功能，智能体创建过程请参见音视频通话快速入门或消息对话快速入门。从源码构建并...

什么是智能外呼机器人

产品概述智能外呼机器人是综合利用 自动语音识别（Automatic Speech Recognition，ASR）、文字转语音（Text To Speech，TTS）以及自然语言理解（Natural Language Understanding，NLU）等技术，面向企业客户提供的一款智能客服机器人产品...

接入流程

3 云端自动语音混音 4 更新视频混流参数调用服务端 UpdateMPUTask 更新混流参数，例如：视频混流的布局、对应布局的用户视频输入等。说明互动低延时自动混流任务的TaskId需要业务层按照 alirtc-mcu-%s%s,appid,channelId 规则生成，例如...

AIAgentTemplateConfig

名称类型描述示例值 object 智能体模版参数 VoiceChat object 语音通话参数 Greeting string 问候语，入会时生效。不填写则使用智能体模版配置的问候语。长度不超过 128。早上好，我的朋友 LlmHistory array object llm/mllm 历史对话上...

混流转推费用

三人进行视频通话，因此没有语音通话计费。A订阅B和C的视频流，因此A的视频通话规格为480P及以下（B和C的视频流）。B订阅A和C的视频流，因此B的视频通话规格为720P及以下（A的视频流）和480P及以下（C的视频流）。C订阅A和B的视频流，因此C...

智能降噪

智能降噪技术为用户提供更清晰的语音通话体验，节约2%客户端系统处理资源。更为舒适的听觉体验，可以为用户减少长时间在嘈杂环境中通信带来的疲劳感，增强用户使用满意度，并可扩大使用场景，无论用户身处咖啡厅、机场、家中或其他嘈杂环境...

口语陪练

通话类型纯语音通话 数字人通话效果示例陪练形式学员：语音 AI陪练：语音学员：语音 AI陪练：视频费用低中终端SDK SDK集成详情，请参见开发指南。SDK 说明 Web SDK 推荐使用桌面端浏览器：如Chrome等；移动端H5：如支付宝的H5、...

AI实时对话智能体

是否必选智能体类型目前支持“语音通话”。必选通话模式支持：“自然对话模式”和“对讲机模式”。“自然对话模式”：类似日常电话通话，双方可同时讲话和倾听，交流更流畅自然；“对讲机模式”：像实体对讲机，一次只能一方说话，对方...

智能语音对话系统

本文提供一个项目示例代码，旨在演示如何集成 ASR（自动语音识别）、LLM（大语言模型）和 TTS（语音合成）三大核心能力，构建智能语音对话系统。准备环境和代码请先在本地或开发服务器上完成环境准备和项目示例代码获取。重要本项目要求 ...

服务端Python SDK

parameters upstream type string 是上行类型：AudioOnly：仅语音通话 AudioAndVideo：上传视频 mode string 否客户端使用的模式，可选项：push2talk tap2talk duplex 默认tap2talk audio_format string 否音频格式，支持pcm，opus，...

支持电话语音通知吗？

本文介绍了如何在阿里云产品实例到期或释放前，设置电话语音通知以提醒相关联系人。目前支持部分阿里云产品实例到期/释放前，对联系人进行电话语音通知。其他产品的语音通知功能陆续开通中。通知电话默认拨打号码为您账号绑定的手机，请您...

API详情

paraformer-8k-v1 Paraformer中语音模型服务中文语音识别模型，支持8kHz电话语音识别。paraformer-mtl-v1 Paraformer中语音模型服务多语言语音识别模型，支持16kHz及以上采样率的音频或视频语音识别。支持的语种/方言包括：中文普通话、...

计费说明

数据存储无按量计费 1.5元/GB*月数据存储（电话语音记录，图片，文件等非文本信息）费用。存储产品独立计算、收取费用。每个实例 1GB 以内的存储免费，超出部分按每 GB 1.5元/月收费。语音服务无按语音服务产品计费方式按语音服务...

入门概述

OSS违规检测包含如下功能：增量扫描对OSS Bucket中新增的图片、视频和语音自动进行违规检测，每当Bucket中有新增内容，将自动触发扫描。存量扫描对OSS Bucket中的已有图片、视频和语音进行一次性违规检测。在控制台上配置即可。该功能...

功能特性

App语音搜索、语音电话客服、对话聊天、控制口令等场景。单声道（mono）、16 bit采样位数，包括PCM、PCM编码的WAV、OGG封装的OPUS、OGG封装的SPEEX、AMR、MP3、AAC。Java/C++/Python/C#Go/Node.js/RestfulAPI/Android/iOS/微信小程序/...

ALIYUN:Aligreen:OssStockTask

AudioAntispamFreezeConfig Map 否否 语音自动冻结配置。根据语音检测结果中的建议冻结结果。示例：{"Type":"suggestion","Value":"block"} AudioOpened Boolean 否否 OSS存量扫描任务是否扫描音频。取值：true：扫描 false：不扫描 ...

语音通知/语音验证码FAQ

被叫号码如果一直处于占线状态，系统会在收到来自被叫运营商返回的错误码后自动挂断电话。语音通知导入的是什么文件？语音通知导入的语音文件支持WAV或MP3格式，文件需要小于2 MB。具体操作请参见通过控制台上传语音文件或通过API/SDK...

动态IVR呼转回调接口

语音服务支持在控制台上对全局添加号码回拨设置，当客户回拨号码时，在通话中播放指定录音文件或设置动态IVR。本文档展示动态IVR的相关设置。前提条件在您做IVR动态呼转的配置之前，需进行语音SIP打标，详情请咨询您的商务经理。背景信息 ...

音视频通话简介

功能特性场景功能 iOS Android 双人音视频通话设置个人用户信息 ✓ ✓ 呼叫/接听/拒绝/挂断 ✓ ✓ 通话状态展示 ✓ ✓ 摄像头打开/关闭/翻转 ✓ ✓ 麦克风打开/关闭 ✓ ✓ 扬声器打开/关闭 ✓ ✓ 视频通话切换语音通话 ✓ ✓ 多人音视频...

创建语音模板

执行语音通话任务 ExecuteCallTask：启动已创建的语音通话任务。说明创建和执行语音通话任务也可通过控制台交互式界面完成，详情请参见通过控制台使用语音通知/语音验证码。常见问题语音模板是什么？公共模式和专属模式的语音模板是通用...

通信智能体管理

智能接听识别开启后自动识别语音助手/信箱并中断通话，提升呼叫效率。最大通话时长设置本次通话最大的通话时间，到期后自动挂断。单击确认完成配置。编辑通信智能体前提条件：创建的通信智能体已构造完成，状态为“调试中”。在通信...