庭审智能语音识别系统-庭审智能语音识别系统文档介绍内容-移动阿里云

管理热词

管理热词在 智能语音控制台左侧导航栏的自学习平台热词页面，您可以对已创建的热词进行如下操作。关联项目查看哪些项目正在使用该热词表，一个热词表可以被多个项目使用。预览热词单击预览，即可查看热词表的热词数量和具体热词。...

计费方式

智能语音交互支持资源包（预付费）和按量计费（后付费）两种计费方式。本文为您介绍智能语音交互的计费规则以及如何升级为商用版。注意事项本文中所有的价格信息仅供参考，实际价格请以出账账单为准。计费规则 智能语音交互开通服务后才能...

启动通话及个性参数配置

工作流覆盖参数 enableIntelligentSegment Bool 智能断句开关 asrConfig ARTCAICallAgentAsrConfig 语音识别配置 ttsConfig ARTCAICallAgentTtsConfig 语音合成配置 llmConfig ARTCAICallAgentLlmConfig 大语言模型配置 avatarConfig ...

StartRobotTask-启动任务或定时启动任务

启动智能语音任务或者定时启动智能语音任务。接口说明 智能语音机器人功能升级，老功能将于 2023.12.31 停止服务，新功能请登录智能联络中心控制台，在智能外呼机器人页面开通使用。老客户（语音服务已开通该功能的客户）目前可继续使用...

语音识别热词

当语音识别系统运行时，它会优先处理这些热词，提高其在识别过程中的权重。如果您的业务领域有部分词汇识别效果不佳，可以考虑使用热词功能，从而提高识别效果。使用限制支持语言：仅支持中文和英文词语。文件格式：通过控制台上传时，热...

探索（模板市场）

AI应用模板模板实践文档文档内容洞察助手基于LangStudio&搜索MCP服务搭建文档智能问答Agent应用音频总结助手基于LangStudio&语音识别服务搭建音频内容智能总结助手智能数据Agent 基于LangStudio&Hologres构建ChatBI数据分析Agent...

快速开始

示例代码以下示例展示了调用Paraformer语音识别文件转写API，对一个通过URL给出的音频文件进行语音识别的代码。说明需要使用您的API-KEY替换示例中的 your-dashscope-api-key，代码才能正常运行。通过URL指定进行语音转写的文件，其大小...

热词模型

语音识别模型如果90天内没有真实在线上使用，系统会自动回收，请妥善使用和维护。视频讲解操作流程新建热词组进入智能工具选择“语音模型训练工具”中的热词模型，点击列表右上方的新建热词组按钮，需要注意的是，当前每个用户最多可...

启动通话及个性参数配置

工作流覆盖参数 enableIntelligentSegment Bool 智能断句开关 asrConfig ARTCAICallAgentAsrConfig 语音识别配置 ttsConfig ARTCAICallAgentTtsConfig 语音合成配置 llmConfig ARTCAICallAgentLlmConfig 大语言模型配置 avatarConfig ...

语音数据集

ASR泛热词表在语音识别服务中，如果您的业务领域有部分词汇默认识别效果不够好，可以考虑使用热词功能，将这些词添加到词表从而改善识别结果。如地名、人名、特定品牌名等。这些热词表可以加载到场景和任务里生效，以提高识别效果。热词不...

产品业务架构

产品业务架构即是从业务开展的角度描述产品的框架构成。本篇文档旨在对智能外呼的业务架构进行描述，以便更加快速清晰地...电话接通后，智能语音中间件负责“听（ASR识别）-理解（云小蜜）-说（TTS播报）-继续听.”这一人机对话过程的控制。

StopRobotTask-暂停智能语音任务

暂停开始执行后的智能语音任务。接口说明 智能语音机器人功能升级，老功能将于 2023.12.31 停止服务，新功能请登录智能联络中心控制台，在智能外呼机器人页面开通使用。老客户（语音服务已开通该功能的客户）目前可继续使用该功能，为...

号码申请/开通

已开通智能语音交互功能。您可以登录语音服务控制台，在左侧导航栏进入通用设置页面开通。申请号码您可以在语音服务控制台申请号码，详情请参见真实号申请。查看号码您可以登录语音服务控制台，在真实号管理页面查看号码。

CancelOrderRobotTask-取消智能语音任务

取消还未启动的定时智能语音任务。接口说明 智能语音机器人功能升级，老功能将于 2023.12.31 停止服务，新功能请登录智能联络中心控制台，在智能外呼机器人页面开通使用。老客户（语音服务已开通该功能的客户）目前可继续使用该功能，为...

CancelRobotTask-终止智能语音任务

终止智能语音任务。接口说明 智能语音机器人功能升级，老功能将于 2023.12.31 停止服务，新功能请登录智能联络中心控制台，在智能外呼机器人页面开通使用。老客户（语音服务已开通该功能的客户）目前可继续使用该功能，为避免给您带来...

开通授权

登录 智能语音交互控制台。单击左侧导航栏服务管理与开通，切换到设备端解决方案页签，选择要购买的商业版SDK，单击右侧购买资源包。在购买页面，再次选择商业版SDK 规格类型，并设置规格数量，确认费用后，单击右下角立即购买。重要...

DeleteRobotTask-删除智能语音任务

删除智能语音任务。接口说明 智能语音机器人功能升级，老功能将于 2023.12.31 停止服务，新功能请登录智能联络中心控制台，在智能外呼机器人页面开通使用。老客户（语音服务已开通该功能的客户）目前可继续使用该功能，为避免给您带来...

自学习平台FAQ

语音识别类常见问题主要分为以下几类：功能类自学习模型的调用限制是什么？控制台与POP API设置自学习模型的区别是什么？如何通过控制台添加热词？如何通过控制台设置泛热词的权重？如何通过POP API创建热词词表？热词有数量限制吗？除了...

使用录音文件识别时如何设置OSS内网地址

您在使用智能语音交互产品中的录音文件识别服务时，在提交录音文件识别任务的同时，您还需要提供一个音频文件下载地址。如果您使用了阿里云OSS服务作为音频文件下载服务，可以使用内网域名以避免产生流量费用。本文为您介绍如何设置OSS内网...

使用SDK设置业务专属热词

本文为您介绍在一句话识别、实时语音识别和录音文件识别SDK示例中如何设置业务专属热词。概况通过管控台配置的业务专属热词表与项目标识（Appkey）绑定，无需自行设置。通过POP API训练获取的业务专属热词表，需要在SDK中设置其词表ID。...

使用SDK 2.0设置自学习模型

实时语音识别 在实时语音识别中，需要通过设置高级参数 customization_id 设置自学习模型ID。Java SDK 说明请首先阅读 Java SDK，了解Java SDK的基本用法。由于SDK中没有 customization_id 参数对应的set方法，需要通过SpeechTranscriber...

智能语音交互呼出回调HTTP接口

在左侧导航栏中，选择通用设置回调地址，开启 智能语音交互回调地址开关。根据页面提示设置响应信息和接收地址。说明接收地址用于接收语音实时转文本结果并返回下一步执行动作。单击保存。您也可以单击右侧测试按钮，对配置信息进行...

智能擦除

图标擦除通过系统内置图标库智能识别视频中的图标，例如：电视台台标、互联网平台Logo标志等，对图标进行擦除处理并对画面进行智能填充，恢复视频未添加图标的原始状态，辅助视频内容的后期制作及再生产。说明智能擦除功能仅支持MP4格式...

智能对话分析

智能对话分析(Smart Conversation Analysis)依托于阿里云语音识别和自然语言分析技术，为企业用户提供智能的对话分析服务，支持语音和文本数据的接入。可用于电话/在线客服坐席服务质量检测、风险监控识别、服务策略优化等场景。

HarmonyOS Next SDK

本文介绍了如何使用阿里云智能语音服务提供的HarmonyOS Next NUI SDK，包括SDK下载安装、关键接口及代码示例。前提条件使用SDK前，首先阅读接口说明，详情请参见接口说明。已获取项目Appkey，详情请参见创建项目。已获取Access Token，...

音视频通话快速入门

系统预置模板：选择预置模板时，您需要配置语音音色，各类型智能语音效果示例请参见 智能语音效果示例。自研模板：您可以通过规范协议将您的自研大模型加入到工作流当中。详情请参见 TTS标准接口。三方插件：当前仅支持选择 MiniMax语音...

通用票证抽取

通用票证智能抽取系统能够自动识别保单上的关键信息，如被保险人、保险金额、保险期限等，并自动录入系统，大大提高了工作效率。API快捷入口云市场API快捷入口（旧）官网API快捷入口（新）RecognizeGeneralStructure-通用票证抽取

SDK和API概览

阿里云智能语音交互SDK提供RESTful API、移动端、服务端、微信小程序以及WebSocket等多种接入方式，可帮助您更方便、快捷、灵活地将语音识别或语音合成功能集成到您的服务当中。SDK接入类型接入方式服务能力 RESTful API RESTful API ...

产品计费

以上费用包括智能外呼控制台、语音识别、语音合成及基础自然语言处理（NLP）对话能力（仅当使用外呼画布时）。另外，支持对接智能对话机器人（云小蜜），以使用更多高级NLP能力，详情请垂询钉钉群：29130028336。提供预付费并发计算器，在...

电话呼出&呼入快速入门

系统预置模板：选择预置模板时，您需要配置语音音色，各类型智能语音效果示例请参见 智能语音效果示例。自研模板：您可以通过规范协议将您的自研大模型加入到工作流当中。详情请参见 TTS标准接口。三方插件：当前仅支持选择 MiniMax语音...

国内语音服务定价

智能语音机器人呼入规格语音分钟数阶梯（分钟数/月）分钟数≤5万 5万分钟数≤10万 10万分钟数≤50万 50万分钟数≤100万价格（元/分钟）￥0.11￥0.108￥0.104￥0.10 智能语音机器人呼出规格语音分钟数阶梯（分钟数/月）分钟数≤5万 5万...

在控制台创建热词

通过智能语音交互控制台中的添加热词功能，开发者可以上传自定义的热词列表，提升其识别准确率。本文为您介绍如何在控制台创建热词。背景信息热词包括名称类和业务类，具体说明如下：名称类（人名/地名）目前名称类热词只支持人名和...

RESTful API

支持多种语言识别，语种和方言模型无法在编码时指定，需要在智能语音交互控制台的全部项目中对相关项目执行项目功能配置操作，选择对应的模型。详情请参见管理项目。重要不支持纯JavaScript直接调用RESTful接口：使用纯JavaScript...

基于LangStudio&语音识别服务搭建音频内容智能总结...

基于 LangStudio 的“音频总结助手”模板，开发者可快速构建集成语音识别和智能总结功能的 AI 应用，自动将音频/视频文件转录为文本并根据用户需求生成结构化总结报告。开发者可以基于该模板进行灵活扩展和二次开发，以满足会议纪要、学习...

接口说明

语音合成提供将输入文本合成为语音二进制数据的功能。功能介绍 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求，NUI SDK既能够提供全链路的语音能力，同时可做原子能力SDK进行使用，并保持接口的统一。语音合成功能支持...

模型上架与更新

视觉理解 语音识别 2025-12-19 qwen3-asr-flash-filetrans、qwen3-asr-flash-filetrans-2025-11-17、qwen3-asr-flash、qwen3-asr-flash-2025-09-08 新增捷克语、丹麦语等共 9 种语言的语音识别支持。录音文件识别-通义千问 语音识别 2025-...

CreateSearchIndex-创建搜索索引

通过文本和语音识别技术，可以自动提取视频中的字幕、对话等语言信息进行标记和搜索。帮助用户快速搜索和定位视频中涉及特定话题或关键字的内容。mm IndexStatus string 否索引状态。默认值 Active。取值：Active：激活。Deactive：失效。...

语音识别参数设置

功能入口在智能对话分析控制台中，点击智能工具，选择语音模型训练工具，进入语音识别参数设置界面功能说明编辑选择编辑按钮可以对语音识别的重要参数进行设置，以优化语音识别的效果。参数编辑保存后，先在数据集质检中进行测试。非...

计费定价FAQ

本文汇总了您在使用智能语音交互产品中关于计费相关的常见问题。录音文件识别所有的调用都会计费，还是只有识别成功的才会计费？只有服务调用成功才会计费。智能语音如何区分不同项目的计费？不同项目可以对应不同的Appkey，可以根据Appkey...

接口说明

支持设置多语言识别：语种和方言模型无法在编码时指定，需要在智能语音交互控制台的全部项目中对相关项目执行项目功能配置操作，选择对应的模型。详情请参见管理项目。目前支持的语种和方言模型如下：语种语言模型名称采样率标点 ...