开启语音识别功能-开启语音识别功能文档介绍内容-移动阿里云

OCR识别

本文汇总了OCR识别功能的常见问题。如何调用内容安全图片OCR识别？如何配置内容安全自定义OCR模板？内容安全OCR图文识别收费标准？内容安全OCR识别证件，是否支持国际或者港澳的身份证核实？如何调用内容安全图片OCR识别？内容安全API通用...

票证核验

作为读光OCR票据凭证识别、企业资质识别的能力补充，票证核验不提供内容识别功能，仅支持输入要求字段后返回真伪核验结果。说明开通可享50次免费额度：https://ocr.console.aliyun.com/overview 购买地址：...

业务流程

系统基于已学习的指令集进行实时语音识别，支持高并发、低延迟的工业级语音交互响应。③ 结果呈现：设备端首先接收原始语音转写结果，Agent 随即进行语义理解与上下文纠错，输出修正后指令。转写结果可实时刷新并推送至您的业务系统，确保...

用户指南

默认开启图片主体识别功能。说明若开启主体识别，则由系统自动进行主体识别或自定义主体区域，并以主体区域进行搜索，主体识别结果可在Response中获取。若选择不开启主体识别，则不进行主体识别，并以整张图进行搜索。系统提供自动主体...

二维码识别

您可以使用二维码识别功能检测图片中的二维码以及二维码的位置和内容，通常用于二维码读取、图片审核等场景。重要此文档已不再维护，建议您使用新版智能媒体管理。关于智能媒体管理新版与旧版的对比，请参见新旧版本使用指引。关于新版...

音频采集和播放说明

音频格式说明类型可选参数设置语音格式说明 语音识别 upstream.audio_format 支持的输入格式："pcm"：PCM编码（无压缩的PCM或WAV），16bit 采样深度，单通道。raw-opus"：裸 OPUS 数据，以定长发送音频采样率：默认16000 Hz。语音合成...

设备风险SDK Web/H5接入

本文档介绍了设备风险SDK（Web/H5）的接入流程，在需要保护的页面嵌入JS SDK，注意：一个网页（包括单页应用）嵌入一次即可。...init接口嵌入JS SDK之后...营销风险识别功能及参数说明登录风险识别功能及参数说明流量推广反作弊功能及参数说明

地域和域名

多地域产品能力对比产品能力子项华东2（上海）（当前地域）华北2（北京）（新增地域）华南1（深圳）（新增地域）管控台管控台统一管控台统一管控台统一管控台 语音识别 一句话识别支持支持支持实时语音识别 支持支持支持录音...

管理项目

项目类型包括：语音识别+语音合成+语音分析、仅语音识别、仅语音合成、设备端解决方案项目类型仅用于简化控制台配置，不会限制 API 功能。例如，选择“仅语音识别”时，API仍可调用语音合成服务。创建完成后，可以在我的所有项目页面...

用量统计

本文将为您介绍如何在语音服务控制台以自然月维度分类查看各功能的用量数据，并下载报表。操作步骤登录语音服务控制台。在左侧导航栏，选择业务统计用量统计。在用量统计页面，选择需要查询的 语音功能 和查询月份，即可查看对应...

设备风险SDK 微信小程序接入

本文档详细介绍了设备风险SDK（微信小程序版）的接入流程，帮助开发者在需要保护的页面中快速集成小程序SDK，实现设备风险识别功能。背景信息微信小程序SDK是专为小程序环境设计的设备风险识别工具，通过嵌入SDK，开发者可以快速集成设备...

应用身份识别

如果您需要在审计日志中查看具体访问源的信息，您可以使用应用身份识别功能。本文介绍如何使用应用身份识别功能。前提条件已在服务器中安装Agent。具体操作，请参见安装Agent。功能介绍应用身份识别又称为三层关联。通过在您的数据库...

公共参数

以下是具体字段和参数值格式的链接列表：社交反欺诈大模型方案功能及参数说明注册风险识别功能及参数说明营销风险识别功能及参数说明登录风险识别功能及参数说明设备风险识别事件参数及技术链路说明业务风险情报事件及返回参数邮箱...

Python SDK

本文介绍Gummy实时语音识别和翻译Python SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译-Gummy。在线体验：模型体验前提条件已开通服务并获得API-KEY：获取API ...

Python SDK

本文介绍Gummy实时语音识别和翻译Python SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音识别-Fun-ASR/Gummy/Paraformer 和实时语音翻译-Gummy。在线体验：模型体验前提条件已开通服务并获得API-KEY：获取与配置...

设备风险SDK 抖音小程序接入

调用风险识别API接口将deviceToken与其他参数，根据如下相应的风险识别服务事件参数文档说明，请求风险识别API接口进行识别：设备风险识别事件及返回参数注册风险识别功能及参数说明营销风险识别功能及参数说明登录风险识别功能及参数...

设备风险SDK 支付宝小程序接入

本文档详细介绍了阿里云风险识别产品中设备风控SDK（支付宝小程序版）的接入...详情请参见：设备风险识别事件及返回参数注册风险识别功能及参数说明营销风险识别功能及参数说明登录风险识别功能及参数说明流量推广反作弊功能及参数说明

paraformer-realtime-v2、paraformer-realtime-v1、paraformer-realtime-8k-v2、paraformer-realtime-8k-v1 实时语音识别（Fun-ASR）：fun-asr-realtime、fun-asr-realtime-2025-11-07、fun-asr-realtime-2025-09-15 实时语音识别（Qwen-...

WebSocket API

1、发送run-task指令：开启语音识别任务（支持定制热词）该指令用于开启语音识别、翻译任务。task_id 在后续发送 finish-task 指令时也需要使用，必须保持一致。示例：{"header":{"streaming":"duplex","task_id":"e34730287cf643a6b0f1c...

WebSocket API

1、发送run-task指令：开启语音识别任务（支持定制热词）该指令用于开启语音识别、翻译任务。task_id 在后续发送 finish-task 指令时也需要使用，必须保持一致。示例：{"header":{"streaming":"duplex","task_id":"e34730287cf643a6b0f1c...

从这里开始

也可以通过 SDK和API概览详细了解在各类平台如何将 语音识别 或语音合成功能集成到您的服务当中。集成运行说明运行示例基于使用阿里云主账号且从控制台获取测试Token来体验产品。主要通过控制台、curl命令行、postman、以及Java SDK...

设备风险SDK Harmony接入

}).margin({ top:10 })}.width('100%')}.height('100%')} } 调用风险识别API接口请参考以下文档来构建请求并调用风险识别API接口：设备风险识别事件及返回参数注册风险识别功能及参数说明营销风险识别功能及参数说明登录风险识别功能及...

资产识别

Web应用防火墙（WAF）的资产识别功能帮助您检测发现云上与云下的所有域名资产，并对域名资产的安全状态评分，使您掌握业务的整体防护状态。您可以为安全评分较低的域名资产开启防护，提升整体安全防护水位线。前提条件已购买中国内地地域...

套餐包资费

语音功能计费时优先抵用套餐包中条数，您购买套餐包后可以在语音服务控制台查看套餐包资费和套餐包余量。操作步骤登录语音服务控制台。在左侧导航栏，选择业务统计套餐包资费。在套餐包资费页面，选择月份，即可查看当前暂未过期的...

设备风险SDK Android接入

营销风险识别功能及参数说明。登录风险识别功能及参数说明。设备风险识别事件及返回参数。常见问题答疑设备风险识别SDK支付哪些架构？目前支持arm、armv7和arm64三个架构。SDK的大小是多少？单架构的SO文件在1.8M左右。设备风险识别SDK...

SmartCall-发起智能语音交互通话

abcdefgh EarlyMediaAsr boolean 否早媒体语音识别标识。取值：false（默认）：关闭。true：开启。说明设为 true 会记录通话未接听的原因。true VoiceCodeParam string 否 TTS 参数传递字符串，格式为 JSON。必须与 VoiceCode 的 TTS ...

Java SDK

在测试实时语音识别和语音合成功能时，对应JAR包在哪里？xml version="1.0"encoding="UTF-8?project xmlns=...

Java SDK

本文介绍Gummy实时语音识别/翻译Java SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译。在线体验：模型体验前提条件已开通服务并获得API-KEY：获取API Key。建议您...

Java SDK

本文介绍Gummy实时语音识别/翻译Java SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译-Gummy。在线体验：模型体验前提条件已开通服务并获得API-KEY：获取API Key。...

语音地址输入识别

在语音场景下，针对语音识别转写后的地址相关信息，通过语音顺滑、地址抽取、地址纠错、地址补齐后，给用户输出标准化地址信息，解决语音对话场景下的地址识别应用，例如语音导航等。测试您可以在地址标准化产品控制台进行 API测试。请求...

设备风险SDK iOS接入

调用风险识别API接口将 deviceToken 与其他参数，根据如下相应的风险识别服务事件参数文档说明，请求风险识别API接口进行识别：注册风险识别功能及参数说明营销风险识别-增强版事件及返回参数登录风险识别功能及参数说明设备风险识别...

Python SDK

用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译。在线体验：模型体验说明一句话识别/翻译能够直接对一分钟内的音频流（无论是从外部设备如麦克风获取的音频流，还是从本地文件读取的...

Python SDK

用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译-Gummy。在线体验：模型体验说明一句话识别/翻译能够直接对一分钟内的音频流（无论是从外部设备如麦克风获取的音频流，还是从本地文件...

接口说明

对一分钟内的短语音进行识别，适用于对话聊天、控制口令、语音输入法、语音搜索等较短的语音识别场景。功能简介 NUI SDK提供更小的工具包和更完善的状态管理。为满足不同用户需求，NUI SDK既能提供全链路的语音能力，同时可做原子能力SDK...

iOS

如果需要对接 YUV 数据人脸识别功能，在调用本地预览开启接口 startPreview 之后，再调用 registerVideoSampleObserver 订阅采集前处理 YUV 数据（通常是对采集图像做人脸识别）。如果需要对接 YUV 数据人脸识别功能，在 ...

语音计费FAQ

语音服务套餐包不是一个号码对应一个套餐包，套餐包的抵扣和使用的语音功能有关，例如：语音通知计费时优先抵用语音通知套餐包中分钟数，语音验证码计费时优先抵用语音验证码套餐包中条数。更多计费相关，请参见国内语音服务定价。语音...

API概览

RecognizeChinesePassport 中国护照识别支持中国人民共和国护照的结构化内容检测识别功能，支持中国内地、中国香港、中国澳门和中国台湾地区的护照识别，识别内容包括出生地、出生日期、国籍、性别、护照号码、有效期至、签发国、签发地等...

云市场API参考

护照识别护照识别支持中国大陆护照的结构内容检测识别功能，其中字段包括出生地、出生日期、国籍、性别、护照号码、有效期至、签发国、签发地等；关键字段准确率高于95%以上。户口本户主页识别户口本识别可结构化识别户口常住人口登记卡...

验证码和风险识别联合部署方案

本示例参数说明，请参见营销风险识别功能及参数说明和公共参数。在应用服务端配置不同评分区间的请求对应的处置方案。在应用客户端和服务端集成验证码2.0。具体操作，请参见接入指引。完成如上配置后，当用户向应用客户端发起请求时，...