在线识别-在线识别文档介绍内容-移动阿里云

产品功能相关

印刷文字识别OCR支持离线SDK售卖，当前已有离线识别SDK包括：身份证识别、银行卡、物流面单识别、扫读识别、指尖点读离线SDK等，售卖地址可见 OCR云市场服务中心；如您有更多需求，也可联系我们；重要离线sdk现暂不提供支持，如有变动，...

产品简介

离线视频分割SDK（iOS）文字离线识别 证件识别SDK（Android）支持身份证、驾驶证、行驶证正反面离线识别，可识别常用多个关键字段内容，识别精准度超过95%。证件识别SDK（iOS）车辆类识别SDK（Android）支持扫描识别中国内地所有单行车牌及...

通用文字识别SDK

在离线环境下，支持在Android或iOS设备端实现通用文字的离线识别，包体小，可达到秒级识别速度。说明阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等，请通过钉钉群（23109592）加入阿里云视觉智能开放平台咨询群...

概述

用户回答检测：离线识别用户的回答内容。离线 AI 能力：支持在离线无网状态下对本地双录进行交互式检测，扩展展业场景。检测能力本地双录 SDK 提供如下检测能力：人脸检测和信息采集检测和采集视频中的所有人脸及人脸信息。支持采集 4 张...

应用场景

安全事件感知：红线区域清空与锥桶摆放识别、飞机泊位识别预警、机场围界入侵检测、人员着装识别、车辆越界与停止线识别、施工辅助盯防、站台安全监控、海上动态感知。运行时刻推测：飞机滑行路径规划、可变滑行时间预测、保障节点时间预测...

功能概览

用户回答检测：离线识别用户的回答内容。离线 AI 能力：支持在离线无网状态下对本地双录进行交互式检测，扩展展业场景。本地双录 SDK 检测能力本地双录 SDK 提供如下检测能力：人脸检测和信息采集检测和采集视频中的所有人脸及人脸信息。...

2021年

2021-06-30 Android、iOS 车辆类识别SDK 通用文字识别SDK 在离线环境下，支持在Android或iOS设备端实现通用文字的离线识别，包体小，可达到秒级识别速度。2021-06-30 Android、iOS 通用文字识别SDK 2021年05月类目名称接口名称功能描述 ...

功能发布记录

2022年01月21日功能分类功能名称功能描述更新类型文档链接语音识别录音文件识别闲时版录音文件识别闲时版是针对已经录制完成的录音文件，进行离线识别的服务。与录音文件识别区别在于返回时间不同，闲时版为24小时内返回结果。新增...

接口说明

录音文件识别是针对已经录制完成的录音文件，进行离线识别的服务。录音文件识别是非实时的，识别的文件需要提交基于HTTP可访问的URL地址，不支持提交本地文件。计费和并发限制录音文件识别提供试用版和商用版两种计费模式，详情请参见 ...

接口说明

录音文件识别闲时版是针对已经录制完成的录音文件，进行离线识别的服务。录音文件识别闲时版是非实时的，识别的文件需要提交基于HTTP可访问的URL地址，不支持提交本地文件。与录音文件识别区别在于返回时间不同，闲时版为24小时内返回结果...

录音文件识别（SenseVoice）-即将下线

重要 SenseVoice 服务即将下线：SenseVoice 录音文件识别服务即将下线，为避免影响业务，请尽快迁移至其他语音识别服务（录音文件识别-Paraformer/Fun-ASR、录音文件识别-通义千问）。

通义晓蜜CCAI-对话分析AIO计费项变更通知

调整内容新增计费类型：本次调整后，语音识别能力通过API接入方式实现离线语音转译服务将进行收费：离线语音识别：0.33元/小时新增图片识别能力，通过通义晓蜜-VLMax模型实现图片文字识别、总结、推理，该服务的API接入将进行收费。...

计费说明（通义晓蜜-CCAI对话分析AIO）

功能模型规格单次调用价格语音识别实时语音识别限时免费离线语音识别 0.33元/小时图片识别通义晓蜜-VLMax 0.01元/次调用大模型分析通义晓蜜-Plus 0.01元/次调用通义晓蜜-Turbo 0.001元/次调用常见问题如何开通通义晓蜜-CCAI...

证件识别SDK

应用场景离线证件识别：银行卡、身份证、驾驶证等离线证件识别场景，基于手机或安卓类硬件集成该功能，实现证件的高效识别。前提条件使用SDK前需完成激活授权，具体请参见激活并授权离线SDK。计费说明关于证件识别SDK的报价，请参见 ...

添加及管理识别结果

重复记录处理：针对本次上传字段的识别结果与线上已有字段的识别结果重复时的处理策略，支持覆盖线上所有识别结果、覆盖线上所有未被锁定识别结果和保留线上已有识别结果，跳过不更新。覆盖线上所有识别结果：当新增字段与线上字段一致时，...

添加及管理识别结果

重复记录处理：针对本次上传字段的识别结果与线上已有字段的识别结果重复时的处理策略，支持覆盖线上所有识别结果、覆盖线上所有未被锁定识别结果和保留线上已有识别结果，跳过不更新。覆盖线上所有识别结果：当新增字段与线上字段一致时，...

安全与合规

调用结果实时返回风险识别通过线上实时请求、实时流量进行实时的指标计算、模型计算和策略规则计算，直接为您返回计算结果。整体响应时间根据事件和场景不超过200 ms，最短可以在20 ms 内返回。操作审计风险识别已接入操作审计，帮助您...

DataWorks产品安全能力介绍

说明仅DataWorks企业版支持配置实时及离线风险识别规则，并对检测到的风险事件进行响应。DataWorks提供离线、实时风险响应的基础能力，帮助您感知、处理风险事件。离线风险响应：支持对MaxCompute数据访问/操作配置异常行为相关的离线风险...

服务端人脸识别SDK

服务端人脸识别离线SDK，包括人脸检测、人脸跟踪、人脸关键点定位、人脸质量、角度模型、活体检测和人脸识别等能力，可以直接部署服务器上。人脸识别SDK具有授权功能，一旦授权成功，可以在无网的条件下使用，用户可根据自己的业务需求进行...

监控与日志

监控能力风险识别通过线上实时请求、实时流量进行实时的指标计算、模型计算和策略规则计算，实时返回计算结果。这种实时监控能力确保了用户能够及时发现和应对潜在的安全威胁。产品提供了全面的系统运行状态和性能指标监控，帮助用户实时...

云效安全能力概述

Golang安全检测基于gosec静态分析工具对Go代码进行检测与识别，以发现潜在的安全漏洞和问题，并提供实时反馈和建议，从而帮助开发人员在上线前识别和解决相关问题。Python Python开发规范分析Python代码中的错误，识别不符合代码风格标准...

2022年

2022年12月类目名称能力名称功能描述发布时间支持终端相关文档离线SDK 服务端人脸识别离线SDK 人脸检测、人脸跟踪、人脸关键点定位、人脸质量、角度模型、活体检测和人脸识别等能力，可以直接部署服务器上。人脸识别SDK具有授权功能...

阿里云云通信短信服务安全白皮书V1.0

阿里云云通信在以下场景进行产品发布变更安全评审：当业务新建应用，或新增业务场景时，会进行线上及线下安全评审，对代码及业务流程进行审核。当老应用进行日常迭代优化需求评审时，对diff内容进行安全审核。当涉及敏感信息、会员登录管理...

自定义表格模板

数据版式固定：版式固定的列表型有框线表格和KV型有框线表格，样式&元素&表头保持不变，但可以有单元格高度的调整或行数增加，例如医疗票据、体检报告识别等保险理赔、银行转账、年报审计、业务数据结构化等场景。说明表格模板同时支持Key...

语音识别FAQ

语音识别服务支持离线功能吗？语音识别支持哪些模型？语音识别是否可以混合识别极少量英文单词和字母？开启ITN（逆文本规整）后，中文数字混合时为什么并不是全部转为阿拉伯数字？录音文件识别的enable_sample_rate_adaptive和极速版本里的...

PAI端到端文字识别预测

本文为您介绍如何通过PAI-EasyVision使用已有的训练模型完成端到端文字识别的离线预测任务。数据格式请参见输入数据格式。端到端文字识别预测基于已有的文件列表，您可以通过PAI命令启动端到端文字识别的离线预测任务，示例如下。您可以...

功能发布记录

2020-08-13/脏话识别服务预训练模型针对一句话识别是否是脏话，以及抽取脏话关键词，详见右侧文档 2020-08-26 脏话识别服务使用教程情绪识别服务预训练模型针对一句话识别情绪，当前支持8种情绪识别，详见右侧文档 2020-08-26 情绪...

错误码查询

移动端SDK错误码一句话识别/实时语音识别/录音文件识别极速版配置或参数错误状态码状态消息原因解决方案 240999 DEFAULT_ERROR 内部默认错误。内部未明确错误。240001 NUI_CONFIG_INVALID 配置文件错误。配置文件错误，请确认传入的...

功能发布记录

方便小语种内容的中文理解 2025年5月30日功能名称功能说明实时支持切换源语种实时记录过程中，Multilingual支持语种切换汽车模型优化离线汽车领域模型提高437个车型的识别准确率新增实时16K汽车领域模型丰富离线文件处理格式离线...

功能发布记录

服务端 2025-05-16 语音识别热词离线视频分析支持离线视频重新分析。服务端 2025-05-31 记忆轮数工作流支持记忆对话轮数配置。控制台 2025-05-31 消息对话富消息输入和输出 Web端支持输出代码/表格的 Markdown格式。Web 2025-05-31 ...

激活并授权离线SDK

能力使用方式实时视频分割实时视频分割SDK 离线图片分割离线图片分割SDK 实时无损分割实时无损分割SDK 离线视频分割离线视频分割SDK 证件识别证件识别SDK 车辆类识别车辆类识别SDK 通用文字识别通用文字识别SDK 肢体关键点肢体...

10.2.3 系列

H5 容器和离线包修复修复离线包首次 fallback 时，无网络多次打开离线包导致的 ANR 问题。10.2.3.39（2023-12-14）Mriver 小程序新增支持 Camera 组件。新增支持对接百度地图。更新升级 appx 基础库到 2.8.9 版本。更新地图支持通过...

功能更新动态（2024年）

离线集成任务运行性能诊断配置Oracle输入组件配置PostgreSQL输入组件配置SAP HANA输入组件配置Hologres输入组件配置Microsoft SQL Server输入组件配置过滤转换组件配置StarRocks输出组件配置SelectDB输出组件配置Doris输出组件离...

音视频文件离线转写

音视频文件转写是针对已经录制完成的录音文件或视频文件，进行离线处理（包含语音识别、翻译、要点提炼、摘要总结、PPT提取及摘要等功能）的服务。离线转写是非实时业务场景，且提交待处理的文件是提交基于HTTP或HTTPS可访问的文件URL地址...

车辆类识别SDK

车辆相关业务机构对车牌或VIN码通过离线手持设备等实现车牌和VIN码的高效识别。前提条件使用SDK前需完成激活授权，具体请参见激活并授权离线SDK。计费说明关于车辆类识别SDK的报价，请参见计费介绍。支持终端 Android、iOS 约束与限制 ...

并发和QPS说明

QPS概念适用于智能语音交互产品中的录音文件识别、录音文件识别闲时版等离线类产品。例如，以录音文件识别（含闲时版）为例，QPS限制是指您每秒最多调用的请求数，如果超过QPS限制，可能会出现 Throttling.User:Request was denied due ...

HarmonyOS Next SDK

是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/libs/neonui.har 是SDK生成的HAR包文件，在用户工程项目中导入调用即可。如果需要HarmonyOS Next CPP接入...

HarmonyOS Next SDK

是离线语音合成否录音文件识别极速版是唤醒及命令词否听悟实时推流是以arkts HAR包的形式进行集成。解压压缩包，其中entry/libs/neonui.har 是SDK生成的HAR包文件，在用户工程项目中导入调用即可。如果需要HarmonyOS Next CPP接入...

移动端应用如何安全访问智能语音交互服务

背景信息方案适用接口方案一：通过App服务端创建Token并下发到移动端使用一句话识别实时语音识别录音文件识别极速版语音合成实长文本时语音合成语音分析等方案二：使用STS临时访问凭证调用语音服务离线语音合成方案一：通过App...

表格识别

适用于边框线条为黑色、横竖框线齐全的表格中内容识别。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力进行更直观试用以及在线购买。阿里云视觉智能开放...