接口说明 本接口适用场景 阿里云支付详情页识别,是阿里云官方自研 OCR 文字识别产品,适用于识别支付详情页所包含的收款方名称、合计金额、付款方式、商品说明、支付时间等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...
接口说明 本接口适用场景 阿里云银行开户许可证识别,是阿里云官方自研 OCR 文字识别产品,适用于识别银行开户许可证所包含的账号、核准号、企业名称、法人姓名以及开户行等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...
接口说明 本接口适用场景 阿里云社保卡识别,是阿里云官方自研 OCR 文字识别产品,适用于识别社会保障卡中所包含的标题、姓名、社保卡号码、卡号、发卡日期等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,...
RecognizeBasic 电商图片文字识别。RecognizeBatchRecognize 图片批量识别。RecognizeBirthCertification 出生证明识别。RecognizeBusinessLicense 营业执照识别。RecognizeBusShipTicket 客运车船票识别。RecognizeCarInvoice 机动车销售...
接口说明 本接口适用场景 阿里云户口本识别,是阿里云官方自研 OCR 文字识别产品,可用于识别户口本户主页的户主姓名、住址、户号等字段。也适用于识别户口本常住人口页的出生日期、出生地、姓名、民族等信息的场景。阿里云 OCR 产品基于...
本章节介绍阿里云文字识别的服务等级协议(简称“SLA”)。OCR服务协议请参看 阿里云服务协议(通用)版本生效日期:2021年12月1日 本服务等级协议(Service Level Agreement,简称“SLA”)规定了阿里云向客户提供的文字识别的服务可用性...
接口说明 本接口适用场景 阿里云国际身份证识别,是阿里云官方自研 OCR 文字识别产品,适用于出入境审查、国内外身份核验等各种需要提取身份证信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,...
接口说明 本接口适用场景 阿里云税收完税证明识别,是阿里云官方自研 OCR 文字识别产品,适用于识别非税收入证明所包含的税务机关、纳税人识别号、纳税人名称、合计金额、填票人、完税详单等关键信息的场景。阿里云 OCR 产品基于阿里巴巴...
文字识别系统权限策略参考 文字识别自定义权限策略参考
参照字段:为图片中文字及位置固定不变的字段区域,用于相同版式待识别图片的自动矫正与锚定匹配。如联合分类器使用,也会对其产生影响。提示建议 如何框选参照字段?框选4个以上参照字段,并尽量分散在四角。保证框选的文字内容、位置固定...
组件配置示例 在 AI引擎 中,选择“阿里云文字识别(OCR)”在 待识别图片文件路径中 中,填写您希望识别图片的文件路径(本例中以下图为例)高级选项保持默认值 4.2.示例执行结果 5.流程示例 5.1.搭建流程 利用 OCR全文高精识别 组件,...
接口说明 本接口适用场景 阿里云火车票识别,是阿里云官方自研 OCR 文字识别产品,适用于识别火车票上车次、座位号、旅客信息、座位类型、票价等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀...
组件配置示例 在“AI引擎”中,选择“阿里云文字识别(OCR)”在“待识别图片文件路径”中,填写您希望识别图片的文件路径(本例中以下图为例)高级选项保持默认值 4.2.示例执行结果 5.流程示例 5.1.搭建流程 利用 OCR表格识别 组件,选取...
离线SDK 视觉智能开放平台支持按月或按年购买离线SDK,包括:肢体关键点SDK、肢体动作识别与计数SDK、肢体动作反馈SDK、滤镜SDK、美颜SDK、图片增强SDK、离线图片分割SDK、离线视频分割SDK、实时视频分割SDK、车辆识别SDK、通用文字识别SDK...
接口说明 本接口适用场景 阿里云第二类医疗器械经营备案凭证识别,是阿里云官方自研 OCR 文字识别产品。适用于识别第二类医疗器械经营备案凭证备案编号、企业名称、经营方式、法定代表人、经营范围等信息的场景。阿里云 OCR 产品基于阿里...
接口说明 本接口适用场景 阿里云试卷切题识别,是阿里云官方自研 OCR 文字识别产品,适用于识别整页练习册、试卷或教辅中的题目的场景,适用于教育材料内容的数字化生产与题库录入。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量...
接口说明 本接口适用场景 阿里云行驶证识别,是阿里云官方自研 OCR 文字识别产品,精准定位和识别行驶证正、副页所包含的关键信息,支持正副页在同一张图片的场景进行自动分割与结构化识别。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...
接口说明 本接口适用场景 阿里云食品生产许可证识别,是阿里云官方自研 OCR 文字识别产品。适用于识别食品生产许可证社会信用代码、发证机关、生产地址、签发日期等信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据...
接口说明 本接口适用场景 阿里云驾驶证识别,是阿里云官方自研 OCR 文字识别产品,适用于获取驾驶证上的姓名、证号、国籍、住址、准驾类型、初次领证日期、有效期等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量...
组件配置示例 在“AI引擎”中,选择“阿里云文字识别(OCR)”在“待识别图片文件路径”中,填写您希望识别图片的文件路径(本例中以下图为例)高级选项保持默认值 4.2.示例执行结果 5.流程示例 5.1.搭建流程 利用 OCR文档结构化识别 组件...
接口说明 本接口适用场景 阿里云非税收入发票识别,是阿里云官方自研 OCR 文字识别产品,适用于识别非税收入发票所包含的票据号码、标题、开票日期、合计金额、收款人等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及...
DetectImageTexts 图片文本识别 图片文本识别,将图片上的文字内容智能识别成为可编辑的文本。媒体处理 API 标题 API概述 CreateMediaConvertTask 创建媒体转码任务 创建一个异步的媒体转码任务,提供媒体转码、媒体拼接、视频截帧、视频...
文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见 在用户页面为 RAM 用户授权。重要提示 类型 概述 图片格式 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸 图片长宽...
本文主要介绍文字识别收费能力的计费方式及费用详情。其余未收费能力当前还处于公测阶段,可免费使用。咨询服务 如果您有任何购买问题需要咨询阿里云视觉智能开放平台,欢迎各位企业用户、开发商、服务商或者开发者通过钉钉搜索群号 ...
接口说明 本接口适用场景 阿里云航空行程单识别,是阿里云官方自研 OCR 文字识别产品,适用于识别航空行程单所包含的乘机人姓名、身份证号、电子客票号码、验证码、填开日期、销售单位代号、承运人、填开单位、票价、税费、燃油附加费等...
功能简介 自定义表格模板 是针对固定版式的单页有框线表格表单数据提供的一款定制化产品。用户仅需通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域,字段属性等,无需进行数据标注和模型训练,即可实现相同...
接口说明 本接口适用场景 阿里云国际护照识别,是阿里云官方自研 OCR 文字识别产品,适用于出入境审查、国内外身份核验等各种需要提取护照信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有...
默认:空)General 通用文字识别基础版 OutputStamp(默认:false)Commerce 电商图片文字 OutputStamp(默认:false)HandWriting 手写文字 OutputFigure(默认:false)OutputStamp(默认:false)OutputCoordinate(默认:空)...
文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见 在用户页面为 RAM 用户授权。重要提示 类型 概述 图片格式 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸 图片长宽...
接口说明 本接口适用场景 阿里云银行承兑汇票识别,是阿里云官方自研 OCR 文字识别产品,适用于识别银行承兑汇票上的出票日期、到期日期、票据状态、票据号码、出票人信息、售票人信息、承兑人信息等关键信息的场景。阿里云 OCR 产品基于...
接口说明 本接口适用场景 阿里云食品经营许可证识别,是阿里云官方自研 OCR 文字识别产品,适用于识别食品经营许可证上的经营者名称、法定代表人名称、社会信用代码等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及...
接口说明 本接口适用场景 阿里云营业执照识别,是阿里云官方自研 OCR 文字识别产品,适用于识别营业执照上的公司名称、地址、主体类型、法定代表人、注册资金、组成形式、成立日期等关键信息的场景。泛营业执照包含民办非企业登记证书、...
接口说明 本接口适用场景 阿里云增值税发票识别,是阿里云官方自研 OCR 文字识别产品,适用于识别增值税发票上所包含的价税合计、发票代码、发票号码等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经...
商品名称 API功能 通用文件类型 特殊文件类型 通用文字识别 电商图片文字识别.png/.jpg/.jpeg/.jpe/.bmp/.gif/.tiff/.tif/.webp 说明 单张图片大小不超过10M,且图片最长边不超过8192像素,最短边不小于15像素。当长边超过1024像素时,长宽...
示例值 描述 Code Integer 200 状态码,正常请求返回200 Message String ok 错误的时候返回错误信息 RequestId String DC2DCCC9-C3DF-4F59-8D8E-78185729F16D 请求唯一串 Data Object 返回的结果 Language String zh 图片中的文字识别后的...
文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见 在用户页面为 RAM 用户授权。重要提示 类型 概述 图片格式 本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸 图片长宽...
本文介绍了如何使用Go SDK图片OCR接口,识别图片中的文字 或卡证 信息。功能描述 通用OCR除了能够识别普通图片中的文字,还能识别结构化的卡证上的文字。关于参数的详细说明,请参见 图片OCR检测API文档。前提条件 已安装Go依赖。关于安装...
接口说明 本接口适用场景 阿里云精细版结构化切题,是阿里云官方自研 OCR 文字识别产品,适用于整页练习册、试卷或教辅种的题目场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作...
接口说明 本接口适用场景 阿里云车辆合格证识别,是阿里云官方自研 OCR 文字识别产品,适用于识别车辆合格证所包含的车辆型号、车辆识别代号、地盘型号、发动机型号等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及...
ok RequestId string 请求唯一串 DC2DCCC9-C3DF-4F59-8D8E-78185729F16D Data object 返回的结果 Language string 图片中的文字识别后的语种 zh 示例 正常返回示例 JSON 格式 {"Code":200,"Message":"ok","RequestId":"DC2DCCC9-C3DF-4F59-...