在线语言识别-在线语言识别文档介绍内容-移动阿里云

小语种识别

产品介绍读光OCR小语种识别类产品支持通用多语言识别，英语、日语、俄语、韩语、泰语、拉丁语等语言专项识别，适用于国际化所需的各类图文识别与信息翻译场景。说明功能体验地址：https://duguang.aliyun.com/experience?type=i18n 开通...

文件格式说明

车辆物流识别行驶证识别驾驶证识别电子面单识别车牌识别车辆vin码识别机动车注册登记证识别车辆合格证识别小语种识别通用多语言识别 英语专项识别日语识别俄语识别韩语识别泰语识别拉丁语识别教育场景识别口算判题题目...

新功能发布记录

医疗场景识别资源包多语言识别资源包教育场景识别资源包车辆物流识别资源包企业资质识别资源包票据凭证识别资源包个人证照识别资源包通用文字识别资源包商品定价调整低价档10w次、50w次、100w次三个规格价格下调，高价档全规格...

产品概述

支持电话、手机、智能工牌及车载设备等录音输入，通过多语言识别与分析，助力企业提升生产效率和操作精准度。产品优势专为工业场景打造，高噪环境下精准识别基于深度降噪算法与工业声学模型，有效过滤车间噪音，精准捕捉关键语音指令。...

资源包

10 车牌识别 10 车辆vin码识别 10 机动车注册登记证识别 10 车辆合格证识别 10 小语种识别通用多语言识别 20 英语专项识别 10 日语识别 10 俄语识别 10 韩语识别 10 泰语识别 10 拉丁语识别 10 医疗场景识别核酸检测报告识别 20 教育场景...

免费额度

驾驶证识别 200次/月电子面单识别 200次/月车牌识别 200次/月车辆vin码识别 200次/月机动车注册登记证识别 200次/月车辆合格证识别 200次/月小语种识别通用多语言识别 200次/月以单个API为统计维度，当月生效，过期作废。...

产品概述

支持电话、手机、智能工牌及车载设备等录音输入，通过多语言识别与分析，助力企业实现精细管理和精准营销，提升业务增长与客户满意度。产品优势全面覆盖汽车销售环节采用汽车行业专用智能语音识别与数据分析技术，自动捕捉关键销售行为与...

产品概述

支持电话、手机、智能工牌及车载设备等录音输入，通过多语言识别与分析，助力企业实现精细管理和精准营销，提升业务增长与客户满意度。产品优势全场景服务质检，保障高标准客户体验融合智能语音识别与多维度行为分析技术，全面覆盖客服与...

印刷文字识别的审计事件

RecognizeMultiLanguage 通用多语言识别。RecognizeNonTaxInvoice 非税收入票据识别。RecognizePassport 护照识别。RecognizePaymentRecord 支付详情页识别。RecognizePurchaseRecord 电商订单页识别。RecognizeQuotaInvoice 定额发票识别...

定制语言模型

在语音识别ASR 下，单击修改配置，选择语言识别模型，单击确认使用。在项目配置页面的自学习区域，选中您已定制好的模型场景，单击应用。说明语言模型定制时选的基础模型需要和当前项目配置的语音识别模型一致，才会在下拉框中显示...

云市场资源包计费

手写数字识别支持-本API未上架云官网板书/笔记识别支持-本API未上架云官网小语种识别通用多语言识别 支持官网支持云官网支持资源包及按量付费英文专项识别支持官网支持云官网支持资源包及按量付费日语识别支持官网支持云...

产品功能相关

印刷文字识别OCR支持离线SDK售卖，当前已有离线识别SDK包括：身份证识别、银行卡、物流面单识别、扫读识别、指尖点读离线SDK等，售卖地址可见 OCR云市场服务中心；如您有更多需求，也可联系我们；重要离线sdk现暂不提供支持，如有变动，...

产品简介

阿里云视觉智能开放平台提供通用文字识别、证件识别、图片分割等离线SDK，可在无网络环境下离线使用，不同能力支持Android、iOS、Windows和macOS不同的使用终端。本文为您介绍阿里云视觉智能开放平台当前支持的离线SDK能力。说明阿里云...

云市场API参考

小语种文字识别 API 描述通用多语言识别 通用多语言识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。语言检测覆盖十余个国家地区语种，适用于国际化所需的各类图文识别与信息翻译场景。英语专项识别英文专项...

关于云市场域名更换通知

本章节说明阿里云文字识别（OCR)...机动车发票识别 https://market.aliyun.com/products/57124001/cmapi029811.html?#sku=yuncode2381100001 ocrapi-car-invoice.taobao.com carinvoice.market.alicloudapi.com 印刷文字识别-通用多语言识别 ...

通用文字识别SDK

在离线环境下，支持在Android或iOS设备端实现通用文字的离线识别，包体小，可达到秒级识别速度。说明阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等，请通过钉钉群（23109592）加入阿里云视觉智能开放平台咨询群...

API概览

小语种文字识别 API 标题 API概述 RecognizeMultiLanguage 通用多语言识别 支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。RecognizeEnglish 英语作文识别针对全英文图片文档场景下英文印刷体字符高效检测和识别，具备...

按量付费

0.0825 0.0495 0.0415 0.0248 0.009 机动车注册登记证识别 0.0825 0.0495 0.0415 0.0248 0.009 车辆合格证识别 0.0825 0.0495 0.0415 0.0248 0.009 小语种识别通用多语言识别 0.225 0.09 0.054 0.045 0.036 开通小语种识别后付费英语专项...

从文本中识别语种

此组件可以尝试识别消息的语言，并将其转化为变量，以便后续可以重复使用。组件信息组件图标组件名称从文本中识别语种。前提条件您可以通过已存在的流程或者创建新的流程进入流程的画布编排页面。进入已存在的流程画布编排页面在 ...

概述

用户回答检测：离线识别用户的回答内容。离线 AI 能力：支持在离线无网状态下对本地双录进行交互式检测，扩展展业场景。检测能力本地双录 SDK 提供如下检测能力：人脸检测和信息采集检测和采集视频中的所有人脸及人脸信息。支持采集 4 张...

WebSocket协议说明

支持设置多语言识别：语种和方言模型无法在编码时指定，需要在智能语音交互控制台的全部项目中对相关项目执行项目功能配置操作，选择对应的模型。详情请参见管理项目。鉴权服务端通过临时Token进行鉴权，请求时需要在URL中携带Token...

移动端SDK说明

设置多语言识别：在管控台编辑项目中进行模型选择，详情请参见管理项目。服务地址访问类型说明 URL Host 外网访问所有服务器均可使用外网访问URL。上海：https://nls-gateway-cn-shanghai.aliyuncs.com/stream/v1/FlashRecognizer 北京...

应用场景

安全事件感知：红线区域清空与锥桶摆放识别、飞机泊位识别预警、机场围界入侵检测、人员着装识别、车辆越界与停止线识别、施工辅助盯防、站台安全监控、海上动态感知。运行时刻推测：飞机滑行路径规划、可变滑行时间预测、保障节点时间预测...

接口说明

设置多语言识别：语种和方言模型无法在编码时指定，需要在智能语音交互控制台的全部项目中对相关项目执行项目功能配置操作，选择对应的模型。详情请参见管理项目。服务地址访问类型说明 URL 外网访问（默认上海地域）所有服务器均可...

2021年

2021-06-30 Android、iOS 车辆类识别SDK 通用文字识别SDK 在离线环境下，支持在Android或iOS设备端实现通用文字的离线识别，包体小，可达到秒级识别速度。2021-06-30 Android、iOS 通用文字识别SDK 2021年05月类目名称接口名称功能描述 ...

接口说明

设置多语言识别：语种和方言模型无法在编码时指定，需要在智能语音交互控制台的全部项目中对相关项目执行项目功能配置操作，选择对应的模型。详情请参见管理项目。服务地址访问类型说明 URL 外网访问（默认上海地域）所有服务器均可...

功能概览

用户回答检测：离线识别用户的回答内容。离线 AI 能力：支持在离线无网状态下对本地双录进行交互式检测，扩展展业场景。本地双录 SDK 检测能力本地双录 SDK 提供如下检测能力：人脸检测和信息采集检测和采集视频中的所有人脸及人脸信息。...

Android SDK

nls_config.language_hints array[string]否设置待识别语言代码。如果无法提前确定语种，可不设置，模型会自动识别语种。支持的语言代码：zh:中文 en:英文 ja:日语 yue:粤语 ko:韩语 de：德语 fr：法语 ru：俄语该参数仅对支持多语言的 ...

iOS SDK

nls_config.language_hints array[string]否设置待识别语言代码。如果无法提前确定语种，可不设置，模型会自动识别语种。支持的语言代码：zh:中文 en:英文 ja:日语 yue:粤语 ko:韩语 de：德语 fr：法语 ru：俄语该参数仅对支持多语言的 ...

Python SDK

disfluency_removal_enabled bool False 否设置是否过滤语气词：true：过滤语气词 false（默认）：不过滤语气词 language_hints list[str]["zh","en"]否设置待识别语言代码。如果无法提前确定语种，可不设置，模型会自动识别语种。目前...

Java SDK

本文介绍Paraformer实时语音识别Java SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音识别-Fun-ASR/Gummy/Paraformer。在线体验：仅paraformer-realtime-v2、paraformer-realtime-8k-v2和paraformer-realtime-v1...

Java SDK

可识别语言 因模型而异：paraformer-v2：中文，包含中文普通话和各种方言：上海话、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、江西话、宁夏话、山西话、陕西话、山东话、四川话、天津话、云南话、粤语英文日语 ...

RESTful API

可识别语言 因模型而异：paraformer-v2：中文，包含中文普通话和各种方言：上海话、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、江西话、宁夏话、山西话、陕西话、山东话、四川话、天津话、云南话、粤语英文日语 ...

Python SDK

可识别语言 因模型而异：paraformer-v2：中文，包含中文普通话和各种方言：上海话、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、江西话、宁夏话、山西话、陕西话、山东话、四川话、天津话、云南话、粤语英文日语 ...

Java SDK

可识别语言：fun-asr 支持中文、英文；fun-asr-mtl-2025-08-25 支持中文，粤语、英文、日语、泰语、越南语、印尼语。快速开始核心类（Transcription）提供了异步提交任务、同步等待任务结束和异步查询任务执行结果的接口。可通过如下两种...

RESTful API

可识别语言：fun-asr 支持中文、英文；fun-asr-mtl-2025-08-25 支持中文，粤语、英文、日语、泰语、越南语、印尼语。接口调用方式限制不支持前端直接调用API，需通过后端中转。提交任务接口基本信息接口描述提交语音识别任务。URL ...

RunVideoDetectShot-智能拆条-在线任务

v3.1 intelliSimpPrompt string 否简化输入给 llm 的数据的 prompt（用户自定义）xxx vlPrompt string 否用户自定义的 vl 识别 prompt xxx language string 否语音识别语言：chinese：中文（默认）french：法语 english：英语 japanese...

Python SDK

可识别语言：fun-asr 支持中文、英文；fun-asr-mtl-2025-08-25 支持中文，粤语、英文、日语、泰语、越南语、印尼语。快速开始核心类（Transcription）提供了异步提交任务、同步等待任务结束和异步查询任务执行结果的接口。可通过如下两种...

通义晓蜜CCAI-对话分析AIO计费项变更通知

调整内容新增计费类型：本次调整后，语音识别能力通过API接入方式实现离线语音转译服务将进行收费：离线语音识别：0.33元/小时新增图片识别能力，通过通义晓蜜-VLMax模型实现图片文字识别、总结、推理，该服务的API接入将进行收费。...

计费说明（通义晓蜜-CCAI对话分析AIO）

功能模型规格单次调用价格语音识别实时语音识别限时免费离线语音识别 0.33元/小时图片识别通义晓蜜-VLMax 0.01元/次调用大模型分析通义晓蜜-Plus 0.01元/次调用通义晓蜜-Turbo 0.001元/次调用常见问题如何开通通义晓蜜-CCAI...