离线ocr文字识别软件pc版-离线ocr文字识别软件pc版文档介绍内容-移动阿里云

RecognizeVehicleCertification-车辆合格证识别

接口说明本接口适用场景阿里云车辆合格证识别，是阿里云官方自研 OCR 文字识别产品，适用于识别车辆合格证所包含的车辆型号、车辆识别代号、地盘型号、发动机型号等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及...

RecognizeCarInvoice-机动车销售统一发票识别

接口说明本接口适用场景阿里云机动车销售发票识别，是阿里云官方自研 OCR 文字识别产品，适用于识别购车发票上的发票金额、购买方名称、车辆类型、厂牌型号、销售方名称等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...

RecognizeEduPaperStructed-精细版结构化切题

接口说明本接口适用场景阿里云精细版结构化切题，是阿里云官方自研 OCR 文字识别产品，适用于整页练习册、试卷或教辅种的题目场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨，具有服务稳定、操作...

RecognizeBirthCertification-出生证明识别

接口说明本接口适用场景阿里云出生证明识别，是阿里云官方自研 OCR 文字识别产品，适用于识别出生证明所包含的新生儿姓名、性别、出生日期、出生地点等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经...

OCR文档自学习概述

高精度模型效果内置超大规模多模态预训练模型、多场景高精度文字识别模型，和统一的信息抽取模型，满足不同场景零代码建模的精度需求。高效模型生产效率内置智能化预标注和方便易用的一站式标注套件极大提升标注效率，内置基础预训练模型...

公共错误码

当前正在调用的服务尚未开通，请登录文字识别控制台，单击服务管理与开通，检查并开通相应服务。诊断 400 unmatchedImageType The image type does not match the API operation.图像类型与API接口不匹配诊断 400 ...

自定义表格模板

功能简介自定义表格模板是针对固定版式的单页有框线表格表单数据提供的一款定制化产品。用户仅需通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域，字段属性等，无需进行数据标注和模型训练，即可实现相同...

RecognizeEduPaperCut-试卷切题识别

接口说明本接口适用场景阿里云试卷切题识别，是阿里云官方自研 OCR 文字识别产品，适用于识别整页练习册、试卷或教辅中的题目的场景，适用于教育材料内容的数字化生产与题库录入。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量...

RecognizeBankCard-银行卡识别

接口说明本接口适用场景阿里云银行卡识别，是阿里云官方自研 OCR 文字识别产品，适用于获取银行卡上的卡号、日期、银行名称等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨，具有服务...

VerifyBusinessLicense-营业执照核验

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码...

文字识别自定义权限策略参考

本文介绍文字识别使用自定义权限策略的场景和策略示例。什么是自定义权限策略在基于RAM的访问控制体系中，自定义权限策略是指在系统权限策略之外，您可以自主创建、更新和删除的权限策略。自定义权限策略的版本更新需由您来维护。创建...

长文档信息抽取

OCR预标注」支持印刷体文字识别，暂不支持手写体识别。预标注自动识别的文字内容需仔细核对检查，保证标注正确性。如何实现跨行标注？分别标注跨行对应的部分，并给予他们正确的题目。按住「shift键」，点击此前的两个标注框的边。松开...

RecognizeIdcard-身份证识别

接口说明本接口适用场景阿里云身份证文字识别，是阿里云官方自研 OCR 文字识别产品，用于对中国大陆身份证（含临时身份证）正反面图片进行智能文字识别并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据...

文字识别系统权限策略参考

本文描述文字识别支持的所有系统权限策略及其对应的权限描述，供您授权 RAM 身份时参考。什么是系统权限策略权限策略是用语法结构描述的一组权限的集合，可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制（RAM）产品...

PredictModel-模型服务预测API

height 文字块的高度 width 文字块的宽度 pos 文字块的外矩形四个点的坐标按顺时针排列，左上、右上、右下、左下，当 NeedRotate 为 true 时，如果最外层的 angle 不为 0，需要按照 angle 矫正图片后，坐标才准确 word 文字块的文字 ...

来往大陆（内地）通行证识别

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持：PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸图片长宽...

RecognizeAllText-OCR统一识别

图片类型（Type）支持的请求参数补充说明 Type 类型描述支持的参数 Advanced 通用文字识别高精版 OutputFigure（默认：false）OutputStamp（默认：false）OutputCoordinate（默认：空）OutputOricoord（默认：false）AdvancedConfig（通用...

使用RAM进行访问控制

推荐使用RAM身份（即RAM用户和RAM角色）来访问文字识别。RAM用户 RAM用户需要由阿里云账号（即主账号）或拥有管理员权限的RAM用户、RAM角色来创建，且必须在获得授权后才能登录控制台或使用API访问阿里云账号下的资源。对于RAM用户的使用，...

RecognizeHKIdcard-中国香港身份证识别

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持：PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸图片长宽...

RecognizeInvoice-增值税发票识别

接口说明本接口适用场景阿里云增值税发票识别，是阿里云官方自研 OCR 文字识别产品，适用于识别增值税发票上所包含的价税合计、发票代码、发票号码等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经...

RecognizeJanpanese-日语识别

针对全日文图片文档场景下日文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

VerifyVATInvoice-发票核验

文字识别服务提供一种系统授权策略，即 AliyunOCRFullAccess。具体授权操作，请参见在用户页面为 RAM 用户授权。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码...

OCR统一识别

OCR统一识别是阿里云的全场景识别产品，通过单一接口自动解析多种票据与卡证。本文深度解析其功能优势、支持类型与API集成方法，助您构建高效的文档自动化处理流程。

RecognizeThai-泰语识别

针对泰语图片文档场景下泰文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

RecognizeRussian-俄语识别

针对图片文档场景下俄文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权信息下...

RecognizeKorean-韩语识别

针对韩语图片文档场景下韩文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

RecognizeLatin-拉丁语识别

针对拉丁语系的图片文档场景下印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

RecognizeTableOcr-表格识别

接口说明本接口适用场景阿里云表格识别，是阿里云官方自研 OCR 文字识别产品，支持对多种表格格式（有线表格、条纹表格、无线表格）进行智能文字识别并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，...

RecognizeMixedInvoices-混贴发票识别

接口说明本接口适用场景阿里云混贴发票识别，是阿里云官方自研 OCR 文字识别产品，适用于获取多种发票集合在一个页面的场景，需要获取多种发票上的关键信息。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀...

自定义KV模板

识别字段：识别字段是图片中需要被识别的区域，即业务中所期望使用的信息，用于输出结构化识别结果。每个识别字段包含字段名、Value值、字段类型等必选项，以及高级配置作为可选项。字段名：识别字段对外透出的名称，即API接口中对应的名称...

RecognizeDocumentStructure-文档结构化识别

对文档信息进行结构化识别，并提供元素平铺和层级树两种视角的版面信息输出。能够将文档中的文字元素（单字、文字块、行等）和相应的版面格式（标题、段落、表格）抽离并按顺序输出。调试您可以在OpenAPI Explorer中直接运行该接口，免去...

工具箱

工具箱是OCR文档自学习所提供的用于模型、模板路由分类及提升识别准确率的小工具集合，当前主要提供了分类器与字段类型两大类工具。分类器管理分类器：是一个支持多模板、多模型分类路由的工具。用户通过设定分类器中的关键词或训练样本...

云市场API错误码

本章节介绍阿里云OCR在云市场官方店铺（“阿里云计算有限公司”）的API返回错误码说明。API请求body中有inputs字段的表示旧格式，否则为新格式。如果您检查对应的错误码说明后，仍然无法解决问题，请在钉钉搜索技术支持群21734896进入答疑...

SDK概述

SDK简介 OCR文档自学习SDK封装了2022-12-29版本下的所有API，以访问密钥（AccessKey）识别调用者身份，提供自动签名等功能，方便您通过API调用不同的定制模型。阿里云开发者中心汇聚了高频使用的编程语言SDK，提供了项目地址、安装命令、...

RecognizeChinesePassport-中国护照识别

支持中国人民共和国护照的结构化内容检测识别功能，支持中国内地、中国香港、中国澳门和中国台湾地区的护照识别，识别内容包括出生地、出生日期、国籍、性别、护照号码、有效期至、签发国、签发地等字段。调试您可以在OpenAPI Explorer中...

RecognizeRideHailingItinerary-网约车行程单识别

支持网约车行程单全部字段的识别，包括：服务商、申请日期、行程开始时间、行程结束时间、行程人手机号、总金额等字段。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成...

RecognizeExitEntryPermitToHK-往来港澳台通行证识别

支持通行证中的各项关键信息，姓名、出生日期、证件号码等字段的准确识别。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权信息下表是API对应的...

轻应用

阿里云OCR轻应用是一款依托于OCR技术实现的可视化、轻量化SaaS工具应用，旨在通过简单操作帮助用户快速解决业务场景问题，无需开发介入即可使用。优势特点有应用服务需求的企业开发者/终端用户，无需额外研发投入即可快速使用；相较于有...

RecognizeUsedCarInvoice-二手车统一销售发票识别

支持包括发票代码、发票号码、开票日期、发票金额、购买方名称、购买方身份证号等关键字段结构化识别输出。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。...

通用票证抽取

产品介绍联合OCR+LLM的文档理解多模态应用，针对OCR不支持的长尾票据、卡证，无需训练配置，即可提供通用的票证抽取服务，提高企业自动化效率。说明功能体验地址：通用票证抽取当前开通免费调用：...