自动语音播报-自动语音播报文档介绍内容-移动阿里云

Android SDK

本文介绍了如何使用阿里云离线语音合成服务提供的Android NUI SDK，包括下载安装SDK和语音包、SDK关键接口及代码示例。前提条件阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取AccessKey ID和 ...

服务介绍

阿里云物联网平台针对播报设备提供千里传音语音播报服务，帮助您高效完成大规模播报类设备的部署，实现智能语音播报。使用限制仅华东2（上海）地域支持使用千里传音语音播报服务。重要目前仅支持已开通千里传音服务的用户使用，不再支持...

开通服务

千里传音语音播报服务升级为按设备个数维度进行计费，您需先购买千里传音License开通该服务，然后将License授权绑定到播报设备，才能进行语音播报。本文介绍如何通过购买千里传音License开通该服务。使用限制仅华东2（上海）地域支持使用...

常见问题

本文介绍使用千里传音语音播报服务的相关问题和解决方法。物联网平台控制台产品管理页面没有功能定义页签？问题原因 2020年之前注册开通物联网平台服务的用户，在对应物联网平台控制台的产品管理页面没有功能定义页签，无法查看和配置物...

设备接入说明

本文主要介绍播报设备接入物联网平台并使用千里传音语音播报服务，需要具备的功能和支持的SDK。功能说明播报设备需具备以下功能：连接互联网。设备需可以自主或通过网关接入互联网（推荐使用直连方式，即设备自身具备接入IP网络的能力）。...

通过配置项目实现语音播报

千里传音语音播报服务通过项目管理播报设备和播报的语音文件，本文面向智能播报设备开发者，介绍如何快速将播报设备接入千里传音语音播报服务，获取来自服务的播报命令实现语音播报。前提条件已开通千里传音语音播报服务。具体操作，请...

创建钉钉群接收告警通知

千里传音语音播报服务的告警通知功能基于钉钉群机器人实现，即当服务运行异常、资源使用达到告警触发条件时，可通过已配置的钉钉群机器人接收告警通知，帮助用户及时处理服务异常。本文介绍如何创建并配置钉钉群机器人接收千里传音语音播报...

购买资源包

千里传音语音播报服务针对语音播报功能，需为对应物联网平台实例提供对应资源规格：每实例每月声码解析次数、每实例每月语料编辑次数、每实例每月语料推送次数。您可通过包年包月模式为物联网平台实例购买每月资源规格。本文介绍如何购买...

使用共享设备播报分享语料

千里传音语音播报服务提供分享语料功能，开启该功能后，被分享方可在分享方的分享任务中添加共享语料，分享方审核同意该语料后，会将该语料推送至分享任务的分享设备中，实现分享方设备播报被分享方的语料。前提条件分享方已创建项目并...

智能外呼机器人

智能外呼是综合利用自动语音识别（Automatic Speech Recognition，ASR）、文字转语音(Text To Speech，TTS)以及自然语言理解（Natural Language Understanding，简称NLU）技术并面向企业客户提供的一款智能客服机器人产品。智能外呼机器人...

回复节点

语音播报打断表示当机器人播报话术的时候，允许用户说话打断机器人发言。静音检测配置表示可配置当前轮次下，用户端音频静默多少毫秒之后，会被截断成一句话。按键录入表示当选择此项之后，用户的下一轮交互通过键盘按键收集。其中语音播报...

过滤播报内容

本文将介绍在智能体对所回答问题进行语音播报时，如何跳过特定内容，以实现更自然流畅的对话体验。功能描述在智能体输出对问题的回答中，可能包含部分辅助性文本信息，例如动作指令（“整理了一下领带”）、状态标记（“思考中…”）、...

Linux设备接入实践

本文介绍在Linux和macOS环境中使用音频播放器的设备通过C Link SDK方式接入千里传音服务，实现智能语音播报。使用前必读本文操作步骤以普通用户权限为例。如果您在操作过程中涉及到管理员权限才能执行的操作，可尝试使用 sudo 命令执行。...

回复节点

语音播报打断表示当机器人播报话术的时候，允许用户说话打断机器人发言。静音检测配置表示可配置当前轮次下，用户端音频静默多少毫秒之后，会被截断成一句话。按键录入表示当选择此项之后，用户的下一轮交互通过键盘按键收集。其中语音播报...

H5/小程序如何接入远程双录

通过客户端将语音播报信息合成语音，然后通过自定义推流接口将音频数据推送到房间。客户端通过接口获取到本地或远端音频流，然后在本地调用语音识别接口识别激活词。远程双录结束后，客户端调用上报结果接口，待后台关联数据后即可在远程双...

语音播报

本文将为您介绍在音视频通话中如何传入文本进行语音播报。功能描述 语音播报允许您通过调用OpenAPI接口，将需要播报的文本内容作为参数传入。客户端在接收到传入的文本内容后，即刻启动语音合成技术，将文本转化为语音并进行播报，使得信息...

产品概述

什么是通义晓蜜CCAI-语音对话机器人通义晓蜜CCAI-语音对话机器人是一个支持快速搭建自定义音色的大模型机器人，支持大模型对话、语音播报、语音转写等能力，可实现语音大模型实时交互支持多端快速集成。产品能力 Prompt构建模式提供灵活...

产品简介

自动化和智能化 自动语音风险提示：自动播报风险提示等内容，代替人工说明。视频点播：在视频通话过程中，播放视频、PPT 等风险提示画面。自动纪要：实时识别视频通话的语音内容，并按照时间分角色交替文字记录对话内容。自动确认：识别...

ESP音频开发板设备接入实践

本文介绍使用ESP32-LyraT-Mini音频开发板设备（以下简称播报设备）通过Link SDK方式接入千里传音服务，实现智能语音播报。背景信息本文使用业界常见的ESP32-LyraT-Mini音频开发板作为接入实践的播报设备。ESP32-LyraT-Mini是基于ESP32-...

数字人概述

合成使用：指基于已经定制训练的数字化形象模型，通过文本或语音驱动其自动生成播报视频。下文会具体为您介绍，如何定制数字人形象以及如何使用已定制数字人形象进行合成使用。定制数字人形象智能生产制作提供仿真数字人形象定制服务，...

口语陪练

（操作方式：控制台-工作流-TTS节点-过滤播报）被标记的内容将不会被语音播报，您仅需解析该内容即可做自定义业务处理。用户信息透传模型在通话过程中，如果当前有多个用户同时在线时，对于同一个大模型而言需要能精准的区分当前的输入...

服务调用

千里传音播报服务与播报设备之间实现交互，完成智能语音播报，需要调用如下物模型服务。服务列表服务名称功能是否必须语料推送向设备推送更新语料的指令。是组合播报向设备下发组合播报的语料组及语音播报顺序的指令。设备可无需...

AI面试

（操作方式：控制台-工作流-TTS节点-过滤播报）被标记的内容将不会被语音播报，您仅需解析该内容即可做自定义业务处理。用户信息透传模型在通话过程中，如果当前有多个候选人同时在面试，对于同一个大模型而言需要能精准的区分当前的输入...

情感陪伴

请参见如何进行语音播报。大模型输出下一道题：由于用户并没有讲话，故而若想让AI继续输出，您可以通过文本形式直接驱动模型输出。请参见如何传入文本作为大语言模型输入。对话内容文本转录&音视频录制您可以对整个陪伴过程中产生的音频...

小模型通信

而智能联络机器人基于自动语音识别、文字转语音以及自然语言理解等技术，面向企业客户提供的一款智能客服机器人产品。智能联络机器人可根据业务场景，自动发起联络任务，根据客户的意图进行智能应答。前提条件已注册阿里云账号，并完成 ...

什么是智能外呼机器人

产品概述智能外呼机器人是综合利用 自动语音识别（Automatic Speech Recognition，ASR）、文字转语音（Text To Speech，TTS）以及自然语言理解（Natural Language Understanding，NLU）等技术，面向企业客户提供的一款智能客服机器人产品...

接入流程

3 云端自动语音混音 4 更新视频混流参数调用服务端 UpdateMPUTask 更新混流参数，例如：视频混流的布局、对应布局的用户视频输入等。说明互动低延时自动混流任务的TaskId需要业务层按照 alirtc-mcu-%s%s,appid,channelId 规则生成，例如...

智能语音对话系统

本文提供一个项目示例代码，旨在演示如何集成 ASR（自动语音识别）、LLM（大语言模型）和 TTS（语音合成）三大核心能力，构建智能语音对话系统。准备环境和代码请先在本地或开发服务器上完成环境准备和项目示例代码获取。重要本项目要求 ...

对话机器人接入渠道

转人工系统消息设置排队位置播报：处于排队状态时，机器人自动播报的话术，其中`${queuePosition}`固定变量写法，表示排队位置。说明在排队位置播报以及坐席提示语中的${queuePosition}与${agentDisplayName}参数为固定写法，分别展示...

功能特性

语音播报、新闻小说、有声阅读、无障碍播报。PCM、WAV、MP3 iOS/Android 暂不支持免费试用资源包购买重要除录音文件识别和录音文件识别极速版以外的其他识别服务只支持单声道（mono）语音数据。识别服务只支持8000 Hz/16000 Hz采样率、...

入门概述

OSS违规检测包含如下功能：增量扫描对OSS Bucket中新增的图片、视频和语音自动进行违规检测，每当Bucket中有新增内容，将自动触发扫描。存量扫描对OSS Bucket中的已有图片、视频和语音进行一次性违规检测。在控制台上配置即可。该功能...

ALIYUN:Aligreen:OssStockTask

AudioAntispamFreezeConfig Map 否否 语音自动冻结配置。根据语音检测结果中的建议冻结结果。示例：{"Type":"suggestion","Value":"block"} AudioOpened Boolean 否否 OSS存量扫描任务是否扫描音频。取值：true：扫描 false：不扫描 ...

语音播报最佳实践

本文是支付确认、实时活动通知等 语音播报 场景的最佳实践。前提条件请先确保已在EMAS控制台完成项目和应用的创建，若尚未完成，请详见快速入门。已阅读接入对应SDK，具体请参见 Android SDK接入、iOS SDK配置、HarmonyOS SDK接入。各...

物模型通信说明

千里传音语音播报服务与播报设备之间使用阿里云物联网平台的物模型进行消息通信。通过服务调用、属性上报、事件上报等方式，实现千里传音与播报设备之间的交互，完成智能语音播报。背景信息物模型是物联网平台为产品定义的数据模型，主要...

交互流程

实时语音识别-通义千问服务通过 WebSocket 协议，接收实时音频流并实时转写。支持 VAD 模式和 Manual 模式交互流程。用户指南：模型介绍、功能特性和示例代码请参见实时语音识别-通义千问 URL 编码时，将 model_name 替换为实际的模型...

基于自定义方式创建应用

客户：xxx 客服：xxx 客户：xxx 客服：xxx 选择语音时：自定义上传一个不超过40MB、WAV、MP3格式的文件，可以选择添加/新建热词组，提升语音转译效果上传完成后将自动识别语音内容，并可以设置客户/客服先发言顺序。选择图片识别后：可...

实时多模态交互协议（WebSocket）

语音合成支持的模型包括：语音合成CosyVoice-v2大模型（cosyvoice-v2），语音合成CosyVoice-v3-plus大模型（cosyvoice-v3-plus），语音合成CosyVoice-v3-Flash大模型（cosyvoice-v3-flash），Sambert语音合成（sambert），通义千问3-TTS...

语音&智能VUI

按键/语音可打断收号前置的话术播报。开启打断后截断播报内容，在语音调试、通话详情、导出通话记录中查看打断前的通话内容。关闭打断配置后：挂机话术播报不可打断，指定延迟后执行挂机；延迟期间可打断，不执行挂机，模型继续回复。按键...

大模型应用管理

3 智能接听识别默认为开启状态，开启后自动识别语音助手/信箱，并通过 LlmSmartCallReport-呼叫记录消息返回智能状态码。是否立即挂断当智能接听识别到语音助手/信箱时，选择是否需要中断通话，默认为否，可根据自身业务需求选择开启...

Java SDK

我们提供了三种调用方式的示例代码：音频对话示例：麦克风采集实时音频输入，开启 VAD 模式（自动检测语音起止），支持语音打断。enableTurnDetection 参数需设为 true。推荐您使用耳机播放音频，避免回声触发语音打断。音视频对话示例：...