自动语音播报器-自动语音播报器文档介绍内容-移动阿里云

服务介绍

阿里云物联网平台针对播报设备提供千里传音语音播报服务，帮助您高效完成大规模播报类设备的部署，实现智能语音播报。使用限制仅华东2（上海）地域支持使用千里传音语音播报服务。重要目前仅支持已开通千里传音服务的用户使用，不再支持...

开通服务

千里传音语音播报服务升级为按设备个数维度进行计费，您需先购买千里传音License开通该服务，然后将License授权绑定到播报设备，才能进行语音播报。本文介绍如何通过购买千里传音License开通该服务。使用限制仅华东2（上海）地域支持使用...

常见问题

本文介绍使用千里传音语音播报服务的相关问题和解决方法。物联网平台控制台产品管理页面没有功能定义页签？问题原因 2020年之前注册开通物联网平台服务的用户，在对应物联网平台控制台的产品管理页面没有功能定义页签，无法查看和配置物...

设备接入说明

本文主要介绍播报设备接入物联网平台并使用千里传音语音播报服务，需要具备的功能和支持的SDK。功能说明播报设备需具备以下功能：连接互联网。设备需可以自主或通过网关接入互联网（推荐使用直连方式，即设备自身具备接入IP网络的能力）。...

通过配置项目实现语音播报

千里传音语音播报服务通过项目管理播报设备和播报的语音文件，本文面向智能播报设备开发者，介绍如何快速将播报设备接入千里传音语音播报服务，获取来自服务的播报命令实现语音播报。前提条件已开通千里传音语音播报服务。具体操作，请...

创建钉钉群接收告警通知

千里传音语音播报服务的告警通知功能基于钉钉群机器人实现，即当服务运行异常、资源使用达到告警触发条件时，可通过已配置的钉钉群机器人接收告警通知，帮助用户及时处理服务异常。本文介绍如何创建并配置钉钉群机器人接收千里传音语音播报...

购买资源包

千里传音语音播报服务针对语音播报功能，需为对应物联网平台实例提供对应资源规格：每实例每月声码解析次数、每实例每月语料编辑次数、每实例每月语料推送次数。您可通过包年包月模式为物联网平台实例购买每月资源规格。本文介绍如何购买...

使用共享设备播报分享语料

千里传音语音播报服务提供分享语料功能，开启该功能后，被分享方可在分享方的分享任务中添加共享语料，分享方审核同意该语料后，会将该语料推送至分享任务的分享设备中，实现分享方设备播报被分享方的语料。前提条件分享方已创建项目并...

智能外呼机器人

智能外呼是综合利用自动语音识别（Automatic Speech Recognition，ASR）、文字转语音(Text To Speech，TTS)以及自然语言理解（Natural Language Understanding，简称NLU）技术并面向企业客户提供的一款智能客服机器人产品。智能外呼机器人...

回复节点

语音播报打断表示当机器人播报话术的时候，允许用户说话打断机器人发言。静音检测配置表示可配置当前轮次下，用户端音频静默多少毫秒之后，会被截断成一句话。按键录入表示当选择此项之后，用户的下一轮交互通过键盘按键收集。其中语音播报...

过滤播报内容

本文将介绍在智能体对所回答问题进行语音播报时，如何跳过特定内容，以实现更自然流畅的对话体验。功能描述在智能体输出对问题的回答中，可能包含部分辅助性文本信息，例如动作指令（“整理了一下领带”）、状态标记（“思考中…”）、...

回复节点

语音播报打断表示当机器人播报话术的时候，允许用户说话打断机器人发言。静音检测配置表示可配置当前轮次下，用户端音频静默多少毫秒之后，会被截断成一句话。按键录入表示当选择此项之后，用户的下一轮交互通过键盘按键收集。其中语音播报...

H5/小程序如何接入远程双录

通过客户端将语音播报信息合成语音，然后通过自定义推流接口将音频数据推送到房间。客户端通过接口获取到本地或远端音频流，然后在本地调用语音识别接口识别激活词。远程双录结束后，客户端调用上报结果接口，待后台关联数据后即可在远程双...

语音播报

本文将为您介绍在音视频通话中如何传入文本进行语音播报。功能描述 语音播报允许您通过调用OpenAPI接口，将需要播报的文本内容作为参数传入。客户端在接收到传入的文本内容后，即刻启动语音合成技术，将文本转化为语音并进行播报，使得信息...

产品概述

什么是通义晓蜜CCAI-语音对话机器人通义晓蜜CCAI-语音对话机器人是一个支持快速搭建自定义音色的大模型机器人，支持大模型对话、语音播报、语音转写等能力，可实现语音大模型实时交互支持多端快速集成。产品能力 Prompt构建模式提供灵活...

产品简介

自动化和智能化 自动语音风险提示：自动播报风险提示等内容，代替人工说明。视频点播：在视频通话过程中，播放视频、PPT 等风险提示画面。自动纪要：实时识别视频通话的语音内容，并按照时间分角色交替文字记录对话内容。自动确认：识别...

数字人概述

合成使用：指基于已经定制训练的数字化形象模型，通过文本或语音驱动其自动生成播报视频。下文会具体为您介绍，如何定制数字人形象以及如何使用已定制数字人形象进行合成使用。定制数字人形象智能生产制作提供仿真数字人形象定制服务，...

服务调用

千里传音播报服务与播报设备之间实现交互，完成智能语音播报，需要调用如下物模型服务。服务列表服务名称功能是否必须语料推送向设备推送更新语料的指令。是组合播报向设备下发组合播报的语料组及语音播报顺序的指令。设备可无需...

小模型通信

而智能联络机器人基于自动语音识别、文字转语音以及自然语言理解等技术，面向企业客户提供的一款智能客服机器人产品。智能联络机器人可根据业务场景，自动发起联络任务，根据客户的意图进行智能应答。前提条件已注册阿里云账号，并完成 ...

接入流程

3 云端自动语音混音 4 更新视频混流参数调用服务端 UpdateMPUTask 更新混流参数，例如：视频混流的布局、对应布局的用户视频输入等。说明互动低延时自动混流任务的TaskId需要业务层按照 alirtc-mcu-%s%s,appid,channelId 规则生成，例如...

对话机器人接入渠道

转人工系统消息设置排队位置播报：处于排队状态时，机器人自动播报的话术，其中`${queuePosition}`固定变量写法，表示排队位置。说明在排队位置播报以及坐席提示语中的${queuePosition}与${agentDisplayName}参数为固定写法，分别展示...

实时多模态交互协议（WebSocket）

语音合成支持的模型包括：语音合成CosyVoice-v2大模型（cosyvoice-v2），语音合成CosyVoice-v3-plus大模型（cosyvoice-v3-plus），语音合成CosyVoice-v3-Flash大模型（cosyvoice-v3-flash），Sambert语音合成（sambert），通义千问3-TTS...

功能特性

语音播报、新闻小说、有声阅读、无障碍播报。PCM、WAV、MP3 iOS/Android 暂不支持免费试用资源包购买重要除录音文件识别和录音文件识别极速版以外的其他识别服务只支持单声道（mono）语音数据。识别服务只支持8000 Hz/16000 Hz采样率、...

移动端Android SDK

客户端需持续上传音频，服务端自动检测语音活动的场景。用户随时可以说话打断大模型输出。示例如下：{"header":{"action":"run-task","task_id":"9B32878*3D053","streaming":"duplex"},"payload":{"task_group":"aigc","task":"multimodal...

入门概述

OSS违规检测包含如下功能：增量扫描对OSS Bucket中新增的图片、视频和语音自动进行违规检测，每当Bucket中有新增内容，将自动触发扫描。存量扫描对OSS Bucket中的已有图片、视频和语音进行一次性违规检测。在控制台上配置即可。该功能...

ALIYUN:Aligreen:OssStockTask

AudioAntispamFreezeConfig Map 否否 语音自动冻结配置。根据语音检测结果中的建议冻结结果。示例：{"Type":"suggestion","Value":"block"} AudioOpened Boolean 否否 OSS存量扫描任务是否扫描音频。取值：true：扫描 false：不扫描 ...

如何选择系统应用的插件版本？

编译版本号是日期（精确到秒）编译过程中由编译器自动生成；渠道号由IoVCC发布的渠道组成，比如，dingtalk，也可以加上型号以做区别。渠道号说明：渠道号含义备注 0 common 与平台无关，所有平台上都用同一个，如Container 1 dingtalk 在...

Android SDK

本文介绍了如何使用阿里云离线语音合成服务提供的Android NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 ...

SDK FAQ

demo是用语音文件模拟实时语音流的速度发送语音，通常一次发送间隔时间为100ms或200ms（sleepInterval）的语音数据，数据量（batchSize）和采样率有关：发送间隔过大，会导致延迟较大，容易断连；发送间隔过小，会消耗服务端和网络资源。...

语音播报最佳实践

本文是支付确认、实时活动通知等 语音播报 场景的最佳实践。前提条件请先确保已在EMAS控制台完成项目和应用的创建，若尚未完成，请详见快速入门。已阅读接入对应SDK，具体请参见 Android SDK接入、iOS SDK配置、HarmonyOS SDK接入。各...

新功能发布记录

2025-04-10 绝对定位与视口定位 语音播报 支持阿里云智能语音交互的文字转语音功能。2025-04-10 文字转语音（阿里云智能语音交互）域名配置流程优化支持自动化配置 2025-04-10 环境和域名域名备案码订阅和续费魔笔服务，免费提供域名...

语音模板FAQ

文本转语音模板：指模板的内容是文本，在播放时自动转化为语音。例：尊敬的阿里云用户您好，您的验证码是${vericode}。变量是：${vericode}。语音通知文件：指预先录制好的音频文件（MP3或WAV格式），在接听后直接播放该文件。“场景&话术...

iOS SDK

本文介绍了如何使用阿里云智能语音服务提供的iOS NUI SDK，包括SDK下载安装、关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已准备项目Appkey，详情请参见创建项目。已获取Access Token，详情请参见获取Token概述。...

iOS SDK

本文介绍了如何使用阿里云离线语音合成服务提供的iOS NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 AccessKey ...

数据结构

BySpeechBroadCast 因为主动语音播报打断 ByLlmQuery 因为主动LLM查询打断 ARTCAICallAudioProfile 音频编码配置枚举名描述 ARTCAICallAudioLowQualityMode 音频低音质模式，默认8000Hz采样率，单声道，最大编码码率12kbps ...

数据结构

BySpeechBroadCast 因为主动语音播报打断 ByLlmQuery 因为主动LLM查询打断 ARTCAICallAudioProfile 音频编码配置枚举名描述 ARTCAICallAudioLowQualityMode 音频低音质模式，默认8000Hz采样率，单声道，最大编码码率12kbps ...

2D数字人视频合成用户指南

文本输入框集成了语音合成的编辑器功能，可在该编辑器中对语音合成进行人工的调整，例如标注多音字、标注文本读法、标注数值读法等，详见下表。功能子功能备注操作方法多音/弹出浮层高亮多音字，逐一标注文本人名姓氏自动匹配、连续...

Linux设备接入实践

本文介绍在Linux和macOS环境中使用音频播放器的设备通过C Link SDK方式接入千里传音服务，实现智能语音播报。使用前必读本文操作步骤以普通用户权限为例。如果您在操作过程中涉及到管理员权限才能执行的操作，可尝试使用 sudo 命令执行。...

HarmonyOS Next SDK

this.stream_input_tts_instance.sendStreamInputTts(ttstext2)结束语音合成 this.stream_input_tts_instance.stopStreamInputTts()回调处理 onStreamInputTtsEventCallback：流式文本语音合成事件回调，根据语音合成状态控制播放器。...

HarmonyOS Next SDK

this.stream_input_tts_instance.sendStreamInputTts(ttstext2)结束语音合成 this.stream_input_tts_instance.stopStreamInputTts()回调处理 onStreamInputTtsEventCallback：流式文本语音合成事件回调，根据语音合成状态控制播放器。...