在线ocr文字识别-在线ocr文字识别文档介绍内容-移动阿里云

单据票证信息抽取

OCR预标注」支持印刷体文字识别，暂不支持手写体识别。预标注自动识别的文字内容需仔细核对检查，保证标注正确性。卡证类型如何选择？目标区域：单据票证所在区域，对应单据票证的外边框，用于定位。KV区域：单据票证中所需识别的Key-Value...

教育场景识别

本文介绍阿里云文字识别-教育场景识别系列相关产品的功能、特色优势及应用场景，并为您提供产品的API快捷入口。产品介绍读光教育场景OCR识别产品能力，主要针对教育应用场景中对试题题目、数学公式、速算题目等信息的智能化识别需求，通过...

文字识别系统权限策略参考

本文描述文字识别支持的所有系统权限策略及其对应的权限描述，供您授权 RAM 身份时参考。什么是系统权限策略权限策略是用语法结构描述的一组权限的集合，可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制（RAM）产品...

长文档信息抽取

OCR预标注」支持印刷体文字识别，暂不支持手写体识别。预标注自动识别的文字内容需仔细核对检查，保证标注正确性。如何实现跨行标注？分别标注跨行对应的部分，并给予他们正确的题目。按住「shift键」，点击此前的两个标注框的边。松开...

RecognizeGeneralStructure-通用票证抽取

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持：PNG、JPG、JPEG、PDF、BMP、GIF、TIFF、WebP。图片尺寸图片长宽需要大于 15 像素...

使用RAM进行访问控制

推荐使用RAM身份（即RAM用户和RAM角色）来访问文字识别。RAM用户 RAM用户需要由阿里云账号（即主账号）或拥有管理员权限的RAM用户、RAM角色来创建，且必须在获得授权后才能登录控制台或使用API访问阿里云账号下的资源。对于RAM用户的使用，...

公共错误码

当前正在调用的服务尚未开通，请登录文字识别控制台，单击服务管理与开通，检查并开通相应服务。诊断 400 unmatchedImageType The image type does not match the API operation.图像类型与API接口不匹配诊断 400 ...

API概览

本产品（文字识别/2021-07-07）的OpenAPI采用 RPC 签名风格，签名细节参见签名机制说明。我们已经为开发者封装了常见编程语言的SDK，开发者可通过下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求，可通过...

VerifyBusinessLicense-营业执照核验

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码...

云市场API参考

文档小说图片文字识别 文档小说图片文字识别适用于处理网络上海量的用户原生UGC图片中的文字识别 社区贴吧图片文字识别 社区贴吧图片文字识别适用于各类社区社交新闻媒体里用户发帖，贴吧，以及游戏实时交互图片等的识别。网络UGC图片文字...

OCR统一识别

OCR统一识别是阿里云的全场景识别产品，通过单一接口自动解析多种票据与卡证。本文深度解析其功能优势、支持类型与API集成方法，助您构建高效的文档自动化处理流程。

algorithm runtime exception OCR识别异常 464 Invalid Result-xxx OCR识别失败 469 Invalid Service-parse result error 内部异常 469 Invalid Service-error code missing 内部异常 502 Bad Gateway 识别程序超时并断开连接 503 Service ...

来往大陆（内地）通行证识别

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持：PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸图片长宽...

RecognizeHKIdcard-中国香港身份证识别

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持：PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸图片长宽...

小语种识别

本文介绍阿里云文字识别-小语种识别系列相关产品的功能、特色优势及应用场景，并为您提供产品的API快捷入口。产品介绍读光OCR小语种识别类产品支持通用多语言识别，英语、日语、俄语、韩语、泰语、拉丁语等语言专项识别，适用于国际化所需...

VerifyVATInvoice-发票核验

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码...

账号与安全相关

本章节介绍阿里云文字识别（OCR）关于账号与安全相关的常见问题与解答。是否可以设置IP白名单呢？OCR是API服务，暂不支持白名单设置，您可以在自己的服务器上调用我们的服务。如果担心AccessKey泄露，可以考虑通过创建RAM角色并使用STS临时...

PredictModel-模型服务预测API

orgWidth 原图的宽度 prism_wnum 识别的文字块的数量，prism_wordsInfo 数组的大小 prism-wordsInfo 文字块数组内的字段说明 angle 文字块的角度，这个角度只影响 width 和 height，当角度为-90、90、-270、270，width 和 height 的值需要...

PredictTemplateModel-模板服务预测API

模板服务预测目前包括两种类型：自定义KV模板和自定义表格模板。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权信息当前API暂无授权信息透出。...

云市场常见问题

OCR传输的数据是否经过加密呢阿里云文字识别采用云市场标准网关，数据传输过程有全链路安全保障，通过云市场标准网关后数据仅在内部网络中传输，不会暴露在公网。请您通过HTTPS接口而不是HTTP的方式调用我们的接口，确保您的服务器和云...

个人证照识别

本文介绍阿里云文字识别-个人证照识别系列相关产品的功能、特色优势及应用场景，并为您提供产品的API快捷入口。产品介绍基于读光OCR的深度学习算法，个人证照识别提供身份证、国际护照、护照、户口本、银行卡、不动产权证、社保卡等证件的...

PredictClassifierModel-分类器服务预测API

文档自学习分类器预测接口。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权信息下表是API对应的授权信息，可以在RAM权限策略语句的 Action 元素...

欠费说明

本章节介绍阿里云文字识别（OCR）的欠费说明。为了不影响您的正常使用，请务必保证账户余额充裕，避免因为停机给您造成的不便，谢谢配合！欠费处理欠费停机如您的账户因欠费扣款失败，则将触发停机，并发起停机通知；并且我们会在您的...

自定义KV模板

识别字段框尽量覆盖该字段文字可能出现的最大范围，可以避免字段识别不完整。如何提升识别字段准确率？选择合适的字段类型以提升字段识别效果，支持选择通用字段或用户自行添加自定义字段。无需后处理选择[常规]字段类型即可。如需内容替换...

RecognizeDocumentStructure-文档结构化识别

对文档信息进行结构化识别，并提供元素平铺和层级树两种视角的版面信息输出。能够将文档中的文字元素（单字、文字块、行等）和相应的版面格式（标题、段落、表格）抽离并按顺序输出。调试您可以在OpenAPI Explorer中直接运行该接口，免去...

轻应用

阿里云OCR轻应用是一款依托于OCR技术实现的可视化、轻量化SaaS工具应用，旨在通过简单操作帮助用户快速解决业务场景问题，无需开发介入即可使用。优势特点有应用服务需求的企业开发者/终端用户，无需额外研发投入即可快速使用；相较于有...

SDK概述

SDK简介 OCR文档自学习SDK封装了2022-12-29版本下的所有API，以访问密钥（AccessKey）识别调用者身份，提供自动签名等功能，方便您通过API调用不同的定制模型。阿里云开发者中心汇聚了高频使用的编程语言SDK，提供了项目地址、安装命令、...

自定义表格模板

功能简介自定义表格模板是针对固定版式的单页有框线表格表单数据提供的一款定制化产品。用户仅需通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域，字段属性等，无需进行数据标注和模型训练，即可实现相同...

票证批量导出轻应用

阿里云OCR轻应用是一款依托于OCR技术实现的可视化、轻量化SaaS工具应用，旨在通过简单操作帮助用户快速解决业务场景问题，无需开发介入即可使用。操作指南票证批量导出轻应用主要功能为可批量上传并识别票证类图片、并支持分类导出Excel。...

通用票证抽取

产品介绍联合OCR+LLM的文档理解多模态应用，针对OCR不支持的长尾票据、卡证，无需训练配置，即可提供通用的票证抽取服务，提高企业自动化效率。说明功能体验地址：通用票证抽取当前开通免费调用：...

RecognizeJanpanese-日语识别

针对全日文图片文档场景下日文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

RecognizeThai-泰语识别

针对泰语图片文档场景下泰文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

云市场OCR快速入门

欢迎使用OCR服务，这里主要为您介绍如何使用OCR的各种服务，如何快速找到需要的帮助信息。下文主要通过身份证识别服务的例子来介绍各个流程。参考示例—身份证识别 AppKey&AppCode管理：在此处可以查看您的AppKey、AppSecret、AppCode 购买...

RecognizeRussian-俄语识别

针对图片文档场景下俄文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权信息下...

RecognizeKorean-韩语识别

针对韩语图片文档场景下韩文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

RecognizeLatin-拉丁语识别

针对拉丁语系的图片文档场景下印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

OCR文档自学习概述

高精度模型效果内置超大规模多模态预训练模型、多场景高精度文字识别模型，和统一的信息抽取模型，满足不同场景零代码建模的精度需求。高效模型生产效率内置智能化预标注和方便易用的一站式标注套件极大提升标注效率，内置基础预训练模型...

RecognizeChinesePassport-中国护照识别

支持中国人民共和国护照的结构化内容检测识别功能，支持中国内地、中国香港、中国澳门和中国台湾地区的护照识别，识别内容包括出生地、出生日期、国籍、性别、护照号码、有效期至、签发国、签发地等字段。调试您可以在OpenAPI Explorer中...

工具箱

工具箱是OCR文档自学习所提供的用于模型、模板路由分类及提升识别准确率的小工具集合，当前主要提供了分类器与字段类型两大类工具。分类器管理分类器：是一个支持多模板、多模型分类路由的工具。用户通过设定分类器中的关键词或训练样本...

RecognizeShoppingReceipt-购物小票识别

支持包括开票方名称、开票日期、联系电话、地址、合计（实际）金额等关键字段结构化识别输出。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...