线上文字识别-线上文字识别文档介绍内容-移动阿里云

添加及管理识别结果

重复记录处理：针对本次上传字段的识别结果与线上已有字段的识别结果重复时的处理策略，支持覆盖线上所有识别结果、覆盖线上所有未被锁定识别结果和保留线上已有识别结果，跳过不更新。覆盖线上所有识别结果：当新增字段与线上字段一致时，...

添加及管理识别结果

重复记录处理：针对本次上传字段的识别结果与线上已有字段的识别结果重复时的处理策略，支持覆盖线上所有识别结果、覆盖线上所有未被锁定识别结果和保留线上已有识别结果，跳过不更新。覆盖线上所有识别结果：当新增字段与线上字段一致时，...

安全与合规

调用结果实时返回风险识别通过线上实时请求、实时流量进行实时的指标计算、模型计算和策略规则计算，直接为您返回计算结果。整体响应时间根据事件和场景不超过200 ms，最短可以在20 ms 内返回。操作审计风险识别已接入操作审计，帮助您...

监控与日志

监控能力风险识别通过线上实时请求、实时流量进行实时的指标计算、模型计算和策略规则计算，实时返回计算结果。这种实时监控能力确保了用户能够及时发现和应对潜在的安全威胁。产品提供了全面的系统运行状态和性能指标监控，帮助用户实时...

什么是地址标准化

对话上下文地址推理在上下文语音对话场景，针对用户所输入的多轮对话，通过对话文字识别、上下文推理，识别出地址关联片段，通过对语音地址的顺滑、抽取、纠错、补齐等，及上下文推理补全，返回相关性top3的排序结果。主要用于人人对话...

文字识别

阿里云文字识别（Optical Character Recognition，OCR）可以将图片中的文字信息转换为可编辑文本，根据客户的业务场景和需求，将产品分为了通用文字识别、个人证照识别、票据凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种...

RecognizeIdcard-身份证识别

接口说明本接口适用场景阿里云身份证文字识别，是阿里云官方自研 OCR 文字识别产品，用于对中国大陆身份证（含临时身份证）正反面图片进行智能文字识别并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据...

PAI端到端文字识别预测

本文为您介绍如何通过PAI-EasyVision使用已有的训练模型完成端到端文字识别的离线预测任务。数据格式请参见输入数据格式。端到端文字识别预测基于已有的文件列表，您可以通过PAI命令启动端到端文字识别的离线预测任务，示例如下。您可以...

通用文字识别

通用手写体识别读光OCR通用手写体识别模型可以支持中文手写体、英文手写体、数字手写体等各种复杂场景的手写文字识别，同时具备印刷文字识别能力，适用于识别各类手写笔记、板书等。表格识别读光OCR表格识别可支持对有线表格、条纹表格、...

RecognizeEduPaperCut-试卷切题识别

接口说明本接口适用场景阿里云试卷切题识别，是阿里云官方自研 OCR 文字识别产品，适用于识别整页练习册、试卷或教辅中的题目的场景，适用于教育材料内容的数字化生产与题库录入。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量...

通用文字识别SDK

应用场景通用文字识别：支持图书、杂志等各类文字识别场景。身份证识别：支持中国内地二代身份证正反面识别。驾驶证识别：支持机动车驾驶证主页、副页全部字段识别。车辆信息识别：支持车牌、车辆VIN码识别。前提条件使用SDK前需完成激活...

RecognizeInternationalIdcard-国际身份证识别

接口说明本接口适用场景阿里云国际身份证识别，是阿里云官方自研 OCR 文字识别产品，适用于出入境审查、国内外身份核验等各种需要提取身份证信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨，...

文字识别介绍

文字识别技术基于阿里云深度学习技术，为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。服务开通请单击立即...

RecognizeTaxClearanceCertificate-税收完税证明识别

接口说明本接口适用场景阿里云税收完税证明识别，是阿里云官方自研 OCR 文字识别产品，适用于识别非税收入证明所包含的税务机关、纳税人识别号、纳税人名称、合计金额、填票人、完税详单等关键信息的场景。阿里云 OCR 产品基于阿里巴巴...

RecognizeVehicleLicense-行驶证识别

接口说明本接口适用场景阿里云行驶证识别，是阿里云官方自研 OCR 文字识别产品，精准定位和识别行驶证正、副页所包含的关键信息，支持正副页在同一张图片的场景进行自动分割与结构化识别。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...

第二类医疗器械经营备案凭证识别

接口说明本接口适用场景阿里云第二类医疗器械经营备案凭证识别，是阿里云官方自研 OCR 文字识别产品。适用于识别第二类医疗器械经营备案凭证备案编号、企业名称、经营方式、法定代表人、经营范围等信息的场景。阿里云 OCR 产品基于阿里...

RecognizeFoodProduceLicense-食品生产许可证识别

接口说明本接口适用场景阿里云食品生产许可证识别，是阿里云官方自研 OCR 文字识别产品。适用于识别食品生产许可证社会信用代码、发证机关、生产地址、签发日期等信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据...

RecognizeNonTaxInvoice-非税收入发票识别

接口说明本接口适用场景阿里云非税收入发票识别，是阿里云官方自研 OCR 文字识别产品，适用于识别非税收入发票所包含的票据号码、标题、开票日期、合计金额、收款人等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及...

本章节说明阿里云文字识别（OCR)关于域名...https://market.aliyun.com/products/57124001/cmapi00048033.html?#sku=yuncode4203300001 ocrapi-paper-cut.taobao.com subject12.market.alicloudapi.com 印刷文字识别-名片识别/OCR文字识别 ...

RecognizeAirItinerary-航空行程单识别

接口说明本接口适用场景阿里云航空行程单识别，是阿里云官方自研 OCR 文字识别产品，适用于识别航空行程单所包含的乘机人姓名、身份证号、电子客票号码、验证码、填开日期、销售单位代号、承运人、填开单位、票价、税费、燃油附加费等...

来往大陆（内地）通行证识别

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持：PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸图片长宽...

RecognizePassport-国际护照识别

接口说明本接口适用场景阿里云国际护照识别，是阿里云官方自研 OCR 文字识别产品，适用于出入境审查、国内外身份核验等各种需要提取护照信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨，具有...

RecognizeHKIdcard-中国香港身份证识别

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持：PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸图片长宽...

基于身份的策略

文字识别系统权限策略参考 文字识别自定义权限策略参考

产品简介

阿里云文字识别（OCR）具备图片文字定位、文字识别到文字理解的全流程技术体系，可在图片角度偏移、文本位置偏移、印章重叠、水印干扰等复杂场景下有效识别文字信息。支持通用文字识别（涵盖手写体、电商图片、表格等）、个人/企业证照识别...

RecognizeVehicleRegistration-机动车注册登记证识别

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持：PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸图片长宽...

RecognizeVehicleCertification-车辆合格证识别

接口说明本接口适用场景阿里云车辆合格证识别，是阿里云官方自研 OCR 文字识别产品，适用于识别车辆合格证所包含的车辆型号、车辆识别代号、地盘型号、发动机型号等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及...

新功能发布记录

本章节介绍了阿里云文字识别（OCR）产品功能和对应的产品动态。2024年7月产品功能 OCR文字识别新增商品能力，如下表所示。商品名称商品功能能力表现 OCR统一识别通用票证抽取结合OCR（文字识别）以及LLM（大语言模型）相关技术，针对...

RecognizeBirthCertification-出生证明识别

接口说明本接口适用场景阿里云出生证明识别，是阿里云官方自研 OCR 文字识别产品，适用于识别出生证明所包含的新生儿姓名、性别、出生日期、出生地点等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经...

使用OpenAPI

调用方式支持情况调用方式支持情况备注阿里云SDK（推荐）支持文字识别（OCR）支持语言及依赖安装方法请参考 印刷文字识别 SDK，也可以参考以下文档：Java SDK快速开始 Python SDK快速开始阿里云SDK集成方式说明请参见阿里云SDK。...

功能发布记录

预训练模型针对电话销售场景，识别用户回复客服内容的意图，详见右侧文档 2020-09-18 电销场景用户意图识别服务使用教程直播ASR乱码识别服务预训练模型适用于直播场景，通过ASR语音转文字，识别由于多人同时说话导致的文字可读性不佳的...

文件格式说明

本文介绍阿里云文字识别各个接口所支持的文件类型。商品名称 API功能通用文件类型特殊文件类型通用文字识别 电商图片文字识别.png/.jpg/.jpeg/.jpe/.bmp/.gif/.tiff/.tif/.webp 说明单张图片大小不超过10M,且图片最长边不超过8192像素...

OCR统一识别

具体支持的识别能力类型见下图：场景识别能力类型通用文字识别（共8类）通用文字识别高精版通用文字识别基础版手写文字电商图片文字多语言文字表格二维码条形码个人证照识别（共13类）身份证银行卡社保卡户口本首页户口本...

通用文字识别

阿里云通用文字识别是高精度智能服务，可从图片中快速提取多语言文字。本文系统阐述其核心能力、应用场景与接入方法，助您自动提取图片文字，深度挖掘非结构化数据价值。

API/SDK

本章节介绍阿里云文字识别（OCR）关于API/SDK相关的常见问题与解答。接口调用报错的常见原因有哪些？接口调用报错时，您可以尝试以下步骤进行排查：检查参数格式：确保传入的参数格式正确。如果使用 url 参数，需确保URL为公网可访问地址；...

QPS叠加包

计费信息开通OCR文字识别API服务后，默认10QPS的并发，同时您也可购买QPS叠加包来提升API并发量。当前支持QPS叠加包的API包括：身份证识别、通用文字识别、全文识别高精版。您可根据业务需求按天、按月、按年购买。购买限制：叠加包10QPS...

授权信息

本文为您介绍 印刷文字识别（DocumentAutoml）为RAM权限策略定义的操作（Action）、资源（Resource）和条件（Condition）。印刷文字识别（DocumentAutoml）的RAM代码（RamCode）为 documentautoml，支持的授权粒度为 OPERATION。权限策略...

免费额度

本章节介绍阿里云文字识别（OCR）的免费额度及其使用。开通OCR文字识别对应的商品服务后，即赠送该账户免费调用额度。可在额度范围内免费调用OCR服务接口；免费额度消耗完后，将以按量后付费或资源包抵扣方式计费。文字识别API服务免费额度...

资源包

本章节介绍阿里云文字识别（OCR）资源包的计费方式。资源包概述您开通OCR文字识别服务后，可选择采购“预付费资源包”。当发生API调用后，系统会自动从已购买的资源包中，抵扣对应调用次数或点数。预付费资源包，区分为如下2类，计费抵扣...

产品计费

阿里云文字识别OCR支持按照调用次数付费（按量后付费）、购买专用或者共享资源包抵扣（预付费）两种付费模式。如果默认并发数无法满足业务需求时，您还可以通过购买QPS叠加包进行扩容，本文向您介绍付费的具体规则。售卖渠道您可以通过 ...