图片文字识别sdk-图片文字识别sdk文档介绍内容-移动阿里云

2021年

2021-06-30 Android、iOS 通用文字识别SDK 2021年05月类目名称接口名称功能描述发布时间发布地域相关文档 3D视觉单目视频深度估计可以基于一段输入彩色图像视频帧，估计视频每帧图像相对应的深度图，并可合成输出点云。2021-05-31 ...

产品公告

具体支持的识别能力类型如下：场景识别能力类型通用文字识别（共8类）通用文字识别高精版通用文字识别基础版手写文字电商图片文字 多语言文字表格二维码条形码个人证照识别（共13类）身份证银行卡社保卡户口本首页户口本常住...

证件识别SDK

计费说明关于证件识别SDK的报价，请参见计费介绍。支持终端 Android、iOS 约束与限制 Android系统：Android 5.0以上，设备包含相机模块和陀螺仪模块。iOS系统：iOS 10以上，支持iPhone 5s以上系列机型，设备包含相机模块。推荐相机分辨率...

API/SDK

本章节介绍阿里云文字识别（OCR）关于API/SDK相关的常见问题与解答。接口调用报错的常见原因有哪些？接口调用报错时，您可以尝试以下步骤进行排查：检查参数格式：确保传入的参数格式正确。如果使用 url 参数，需确保URL为公网可访问地址；...

查看消费明细

本文介绍查询阿里云文字识别OCR账单的操作步骤。操作步骤登录费用与成本系统。在左侧导航栏，选择账单账单详情。在统计项中，选择计费项，统计周期选择天选择你需要查询的账单月份，产品名称选择 文字识别，查看按账号，账单...

使用RAM进行访问控制

推荐使用RAM身份（即RAM用户和RAM角色）来访问文字识别。RAM用户 RAM用户需要由阿里云账号（即主账号）或拥有管理员权限的RAM用户、RAM角色来创建，且必须在获得授权后才能登录控制台或使用API访问阿里云账号下的资源。对于RAM用户的使用，...

文字识别系统权限策略参考

本文描述文字识别支持的所有系统权限策略及其对应的权限描述，供您授权 RAM 身份时参考。什么是系统权限策略权限策略是用语法结构描述的一组权限的集合，可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制（RAM）产品...

OCR统一识别

产品功能 OCR统一识别一个接口覆盖现有六大类场景：通用文字识别、个人证照识别、车辆物流识别、票据凭证识别、企业资质识别和混贴。通用票证抽取联合OCR+LLM的文档理解多模态应用，针对OCR不支持的长尾票据、卡证，无需训练配置，即可...

授权信息

本文为您介绍 文字识别（ocr-api）为RAM权限策略定义的操作（Action）、资源（Resource）和条件（Condition）。文字识别（ocr-api）的RAM代码（RamCode）为 ocr，支持的授权粒度为操作级。权限策略通用结构权限策略支持JSON格式，其通用...

退费说明

本章节介绍阿里云文字识别（OCR）的退费说明。阿里云读光OCR退费政策说明 1、后付费费用后付费已发生的费用不予退款。2、预付费费用（资源包）如果资源包（除QPS叠加包外）未使用过：未使用过，是指资源包购买后未产生实际抵扣。新购5天内...

欠费说明

本章节介绍阿里云文字识别（OCR）的欠费说明。为了不影响您的正常使用，请务必保证账户余额充裕，避免因为停机给您造成的不便，谢谢配合！欠费处理欠费停机如您的账户因欠费扣款失败，则将触发停机，并发起停机通知；并且我们会在您的...

离线SDK计费介绍

具体价格如下：适用终端时长价格（Android/iOS系统）Android或iOS 1个月（单账户前10次0.1元试用）8,333元 6个月 49,998元 1年 99,996元 2年 199,992元 3年 299,988元通用文字识别SDK 您可根据实际情况按需购买离线SDK。具体价格如下：...

云市场资源包计费

表格识别支持官网支持云官网支持资源包及按量付费电商图片文字识别 支持官网支持云官网支持资源包及按量付费通用手写体识别支持官网支持云官网支持资源包及按量付费文档小说图片文字识别 支持-本API未上架云官网社区贴吧图片...

API概览

RecognizeBasic 电商图片文字识别 针对电商商品宣传图片、社区贴吧图片、网络UGC图片等网络场景下图片字符快速精准识别。RecognizeGeneral 通用文字识别适用于非结构化文字识别，支持返回文字内容和位置坐标信息。RecognizeTableOcr 表格...

RecognizeBasic-电商图片文字识别

接口说明本接口适用场景阿里云电商图片文字识别，是阿里云官方自研 OCR 文字识别产品，支持电商商品宣传图片、社区贴吧图片、网络 UGC 图片识别，针对电商海量图片内容核查就场景进行特定优化，只输出文字块内容及坐标，极大提升识别效率...

票证核验

本文介绍阿里云文字识别-票证核验系列相关产品的功能、特色优势及应用场景，并为您提供产品的API快捷入口。产品介绍读光OCR票证核验产品提供针对发票及企业执照等各类票证单据的真伪核验能力。作为读光OCR票据凭证识别、企业资质识别的...

使用SDK设置业务专属热词

本文为您介绍在一句话识别、实时语音识别和录音文件识别SDK示例中如何设置业务专属热词。概况通过管控台配置的业务专属热词表与项目标识（Appkey）绑定，无需自行设置。通过POP API训练获取的业务专属热词表，需要在SDK中设置其词表ID。...

2022年

2022-04-30 华东2（上海）视频拆条 2022年3月类目名称能力名称功能描述发布时间发布地域相关文档 文字识别 视频文字识别 视频文字识别能力可以实现对输入视频的结构化处理，返回对应的文字内容、文字区域坐标及时间等信息。...

Android SDK

关键接口 NativeNui initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 release 前禁止重复初始化。此接口会引起阻塞，应在非UI线程调用。方法签名 public synchronized int initialize(final INativeNuiCallback callback,String ...

RecognizeGeneral-通用文字识别

接口说明本接口适用场景阿里云通用文字识别，是阿里云官方自研 OCR 文字识别产品，适用于各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式智能识别文字并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...

视频图文水印

本文提供了Python SDK视频水印相关的API调用示例，包含添加图片或文字水印、修改水印、删除水印、查询水印等。接口调用说明本文提供的接口调用示例均通过AccessKey初始化客户端实例。接口的参数解释和返回字段的详细说明请访问阿里云Open...

iOS SDK

关键接口 NeoNui nui_initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 nui_release 前禁止重复初始化。方法签名-(NuiResultCode)nui_initialize:(const char*)parameters logLevel:(NuiSdkLogLevel)level saveLog:(BOOL)save_log...

Java SDK

本文介绍如何使用阿里云智能语音服务提供的Java SDK，包括SDK的安装方法及SDK代码示例。前提条件在使用SDK之前，请先阅读接口说明，详情请参见接口说明。从2.1.0版本开始原有nls-sdk-long-asr更名为nls-sdk-transcriber。升级时需确认已...

Android SDK

关键接口 NativeNui initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 release 前禁止重复初始化。此接口会引起阻塞，应在非UI线程调用。方法签名 public synchronized int initialize(final INativeFileTransCallback callback,...

计费方式

预付费QPS 车牌识别 文字识别计费介绍 文字识别计费介绍不支持不支持驾驶证识别 文字识别计费介绍 文字识别计费介绍不支持不支持行驶证识别 文字识别计费介绍 文字识别计费介绍不支持不支持通用文字识别 文字识别计费介绍文字...

Android SDK

关键接口 NativeNui initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 release 前禁止重复初始化。此接口会引起阻塞，应在非UI线程调用。方法签名 public synchronized int initialize(final INativeNuiCallback callback,String ...

iOS SDK

关键接口 NeoNui nui_initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 nui_release 前禁止重复初始化。方法签名-(NuiResultCode)nui_initialize:(const char*)parameters logLevel:(NuiSdkLogLevel)level saveLog:(BOOL)save_log...

iOS SDK

关键接口 NeoNui nui_initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 nui_release 前禁止重复初始化。方法签名-(NuiResultCode)nui_initialize:(const char*)parameters logLevel:(NuiSdkLogLevel)level saveLog:(BOOL)save_log...

银行卡识别

取值如下：CC：贷记卡 SCC：准贷记卡 DCC：存贷合一卡 DC：储蓄卡 PC：预付卡 SDK参考阿里云视觉AI文字识别类目下的银行卡识别能力推荐使用SDK调用，支持多种编程语言，调用时请选择AI类目为文字识别（ocr）的SDK包，文件参数通过SDK调用...

通用文字识别

SDK参考阿里云视觉AI文字识别类目下的通用文字识别能力推荐使用SDK调用，支持多种编程语言，调用时请选择AI类目为文字识别（ocr）的SDK包，文件参数通过SDK调用可支持本地文件及任意URL，具体可参见 SDK总览。示例代码该能力常用语言的...

Android SDK

关键接口 NativeNui initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 release 前禁止重复初始化。此接口会引起阻塞，应在非UI线程调用。方法签名 public synchronized int initialize(final INativeFileTransCallback callback,...

SDK总览

阿里云视觉智能开发平台目前支持人脸人体、文字识别、商品理解等10+类别的视觉AI技术，其中包括的上百种能力均可通过SDK方式调用。说明阿里云视觉智能开放平台各类目视觉AI能力SDK接入、接口使用或问题咨询等，请通过钉钉群（23109592）...

通用文字识别

阿里云通用文字识别是高精度智能服务，可从图片中快速提取多语言文字。本文系统阐述其核心能力、应用场景与接入方法，助您自动提取图片文字，深度挖掘非结构化数据价值。

iOS SDK

关键接口 NeoNui nui_initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 nui_release 前禁止重复初始化。方法签名-(NuiResultCode)nui_initialize:(const char*)parameters logLevel:(NuiSdkLogLevel)level saveLog:(BOOL)save_log...

iOS SDK

建议尝试TRTC的音视频流，然后使用 localStream.getAudioTrack 获取 MediaStreamTrack 对象，并转换为符合ASR标准的音频流，然后通过语音识别SDK发起请求。使用App集成iOS SDK，提交到App store失败，提示“Unsupported Architectures.The ...

火车票识别

SDK参考阿里云视觉AI文字识别类目下的火车票识别能力推荐使用SDK调用，支持多种编程语言，调用时请选择AI类目为文字识别（ocr）的SDK包，文件参数通过SDK调用可支持本地文件及任意URL，具体可参见 SDK总览。示例请求示例 http(s):/ocr....

Android SDK

关键接口 NativeNui initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 release 前禁止重复初始化。此接口会引起阻塞，应在非UI线程调用。方法签名 public synchronized int initialize(final INativeNuiCallback callback,String ...

Android SDK

关键接口 NativeNui initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 release 前禁止重复初始化。此接口会引起阻塞，应在非UI线程调用。方法签名 public synchronized int initialize(final INativeNuiCallback callback,String ...

iOS SDK

关键接口 NeoNui nui_initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 nui_release 前禁止重复初始化。方法签名-(NuiResultCode)nui_initialize:(const char*)parameters logLevel:(NuiSdkLogLevel)level saveLog:(BOOL)save_log...

iOS SDK

关键接口 NeoNui nui_initialize 初始化语音识别SDK实例。SDK为单例模式，在调用 nui_release 前禁止重复初始化。方法签名-(NuiResultCode)nui_initialize:(const char*)parameters logLevel:(NuiSdkLogLevel)level saveLog:(BOOL)save_log...