好用的文字识别-好用的文字识别文档介绍内容-移动阿里云

服务协议

OCR服务协议请参看阿里云服务协议（通用）版本生效日期：2021年12月1日本服务等级协议（Service Level Agreement，简称“SLA”）规定了阿里云向客户提供的文字识别的服务可用性等级指标及赔偿方案。1.定义服务周期：一个服务周期为一个...

产品公告

客户可通过文字识别的 产品详情页或产品控制台开通按量付费的产品服务，OCR新增7个商品（包含45个API接口），可选择所需的商品，商品开通一次即可永久使用。点此查看快速接入服务端API 进行快速服务接入。2021年12月7日前，在阿里云...

云市场API参考

文档小说图片文字识别文档小说图片文字识别适用于处理网络上海量的用户原生UGC图片中的文字识别 社区贴吧图片文字识别社区贴吧图片文字识别适用于各类社区社交新闻媒体里用户发帖，贴吧，以及游戏实时交互图片等的识别。网络UGC图片文字...

文字识别自定义权限策略参考

操作文档创建自定义权限策略修改自定义权限策略内容和备注删除自定义权限策略管理权限策略授权管理自定义权限策略版本授权信息参考使用自定义权限策略，您需要了解业务的权限管控需求，并了解文字识别的授权信息。详细内容，请参见 ...

RecognizeGeneral-通用文字识别

接口说明本接口适用场景阿里云通用文字识别，是阿里云官方自研 OCR 文字识别产品，适用于各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式智能识别文字并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI ...

RecognizeBasic-电商图片文字识别

接口说明本接口适用场景阿里云电商图片文字识别，是阿里云官方自研 OCR 文字识别产品，支持电商商品宣传图片、社区贴吧图片、网络 UGC 图片识别，针对电商海量图片内容核查就场景进行特定优化，只输出文字块内容及坐标，极大提升识别效率...

PAI端到端文字识别预测

PAI-EasyVision提供端到端文字识别的训练及预测功能，支持多机分布式训练和预测。本文为您介绍如何通过PAI-EasyVision使用已有的训练模型完成端到端文字识别的离线预测任务。数据格式请参见输入数据格式。端到端文字识别预测基于已有的...

视频文字识别

本文介绍文字识别（ocr）类目下的RecognizeVideoCharacter视频文字识别的语法及示例。服务说明由于产品业务调整，视频文字识别服务于即日起停止新用户开通调用，历史开通过该服务的老用户可继续调用，2026年04月20日后该服务将下架，不再...

RecognizeAdvanced-全文识别高精版

接口说明本接口适用场景阿里云全文识别高精版，是阿里云官方自研 OCR 文字识别产品，智能识别图片所包含的全部字段，集表格识别、旋转识别、生僻字识别等多功能为一体，提供高性价比的多场景文字识别体验。阿里云 OCR 产品基于阿里巴巴...

RecognizeMultiLanguage-通用多语言识别

接口说明本接口适用场景阿里云通用多语言证识别，是阿里云官方自研 OCR 文字识别产品，适用于国际化所需的各类图文识别与信息翻译场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨，具有服务稳定、...

RecognizeEduPaperOcr-整页试卷识别

接口说明本接口适用场景阿里云整页试卷识别，是阿里云官方自研 OCR 文字识别产品，适用于对练习册、教辅、教材等内容进行整页识别与题目检索场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨，具有...

后付费模式

本文介绍了采用后付费模式时智能投放、音视频通话和文字识别的价格。产品计费项规格价格（公有云）价格（金融云）价格（政务云）智能投放展位接口调用次数 0-1 万次免费暂不支持暂不支持 1 万次-50 万次 10 元/万次 50 万-100 万次 ...

RecognizeEduOralCalculation-口算判题

接口说明本接口适用场景阿里云口算判题识别，是阿里云官方自研 OCR 文字识别产品，适用于整数的加减乘除四则运算、整数的混合运算、大小比较、最大数最小数等的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经...

RecognizeEnglish-英语作文识别

接口说明本接口适用场景阿里云英语专项识别，是阿里云官方自研 OCR 文字识别产品，适用于全英文图片、文档场景下的英文印刷体字符的高效检测和识别。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨，具有...

表格信息抽取

OCR预标注」支持印刷体文字识别，暂不支持手写体识别。如何创建表格？创建表格适合 LIST型表格表头值和识别列框选。若意向创建表格则相应在题目设置部分应选择添加表格。创建表格操作细节：进入添加表格标签页后，需要点击创建...

RecognizeEduQuestionOcr-题目识别

接口说明本接口适用场景阿里云题目识别，是阿里云官方自研 OCR 文字识别产品，适用于扫描、拍照场景的单题题目识别，适用于智能批改等场景的题目内容识别。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨...

单据票证信息抽取

OCR预标注」支持印刷体文字识别，暂不支持手写体识别。预标注自动识别的文字内容需仔细核对检查，保证标注正确性。卡证类型如何选择？目标区域：单据票证所在区域，对应单据票证的外边框，用于定位。KV区域：单据票证中所需识别的Key-Value...

长文档信息抽取

OCR预标注」支持印刷体文字识别，暂不支持手写体识别。预标注自动识别的文字内容需仔细核对检查，保证标注正确性。如何实现跨行标注？分别标注跨行对应的部分，并给予他们正确的题目。按住「shift键」，点击此前的两个标注框的边。松开...

模型效果评测

视频讲解说明识别准确率：指使用指定的语言模型进行语音转文字识别出的”文本内容”，经过人工校验后，正确的文本内容所占的比例即为识别准确率，即：正确文本内容/全部文本内容*100%，所以准确率通常指的是一个语言模型在某次语音转文字...

集成概览

例如文字识别的华东2（上海）的公网接入地址为 ocr.cn-shanghai.aliyuncs.com ，VPC接入地址为 ocr-vpc.cn-shanghai.aliyuncs.com 。公网接入地址全球都可访问。VPC接入地址只有在阿里云对应的地域内，且是VPC网络类型才可访问。VPC地址的...

图片语种诊断调用指南

示例值描述 Code Integer 200 状态码，正常请求返回200 Message String ok 错误的时候返回错误信息 RequestId String DC2DCCC9-C3DF-4F59-8D8E-78185729F16D 请求唯一串 Data Object 返回的结果 Language String zh 图片中的文字识别后的...

GetImageDiagnose-图片诊断

ok RequestId string 请求唯一串 DC2DCCC9-C3DF-4F59-8D8E-78185729F16D Data object 返回的结果 Language string 图片中的文字识别后的语种 zh 示例正常返回示例 JSON 格式 {"Code":200,"Message":"ok","RequestId":"DC2DCCC9-C3DF-4F59-...

RecognizeJanpanese-日语识别

针对全日文图片文档场景下日文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

RecognizeThai-泰语识别

针对泰语图片文档场景下泰文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

RecognizeRussian-俄语识别

针对图片文档场景下俄文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权信息下...

RecognizeKorean-韩语识别

针对韩语图片文档场景下韩文印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

OCR

方法描述 文字识别 参数说明 image_path str 图片的路径 engine str 引擎可选项：google:谷歌 aliyun:阿里云 paddle:飞桨 app_code str OCR文字识别appcode detail str 是否需要识别文字的详细信息 eliminate_spaces bool 是否去掉文字...

RecognizeLatin-拉丁语识别

针对拉丁语系的图片文档场景下印刷体高效检测和识别，支持旋转、表格、文字坐标等多项基础功能。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权...

PredictModel-模型服务预测API

orgWidth 原图的宽度 prism_wnum 识别的文字块的数量，prism_wordsInfo 数组的大小 prism-wordsInfo 文字块数组内的字段说明 angle 文字块的角度，这个角度只影响 width 和 height，当角度为-90、90、-270、270，width 和 height 的值需要...

RecognizeTableOcr-表格识别

接口说明本接口适用场景阿里云表格识别，是阿里云官方自研 OCR 文字识别产品，支持对多种表格格式（有线表格、条纹表格、无线表格）进行智能文字识别并结构化输出识别结果。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，...

通用图文OCR增强版

一、功能介绍通用图文OCR识别用于识别图片中的文字，返回识别的文字内容、文字位置。服务（Service）检测说明服务名：通用图文OCR Service：generalOcr 支持识别语种为中文、英文。支持返回文字行内容、文字行位置。二、计费说明通用...

商标信息填写FAQ

商标名称：按照直观可以识别的文字及图的规则命名。中文、英文及图形组合。商标名称：阿里云ALIYUNCOM及图中文、英文及特殊字符组合。商标名称：阿里云TECH 中文与日文组合。商标名称：阿里云英文与特殊字符组合。商标名称：ALIYUN 数字...

RecognizeDocumentStructure-文档结构化识别

能够将文档中的文字元素（单字、文字块、行等）和相应的版面格式（标题、段落、表格）抽离并按顺序输出。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。...

通用文字识别

通用手写体识别读光OCR通用手写体识别模型可以支持中文手写体、英文手写体、数字手写体等各种复杂场景的手写文字识别，同时具备印刷文字识别能力，适用于识别各类手写笔记、板书等。表格识别读光OCR表格识别可支持对有线表格、条纹表格、...

产品简介

阿里云文字识别（OCR）具备图片文字定位、文字识别到文字理解的全流程技术体系，可在图片角度偏移、文本位置偏移、印章重叠、水印干扰等复杂场景下有效识别文字信息。支持通用文字识别（涵盖手写体、电商图片、表格等）、个人/企业证照识别...

产品功能相关

印刷文字识别OCR支持离线SDK售卖，当前已有离线识别SDK包括：身份证识别、银行卡、物流面单识别、扫读识别、指尖点读离线SDK等，售卖地址可见 OCR云市场服务中心；如您有更多需求，也可联系我们；重要离线sdk现暂不提供支持，如有变动，...

免费额度

本章节介绍阿里云文字识别（OCR）的免费额度及其使用。开通OCR文字识别对应的商品服务后，即赠送该账户免费调用额度。可在额度范围内免费调用OCR服务接口；免费额度消耗完后，将以按量后付费或资源包抵扣方式计费。文字识别API服务免费额度...

文字识别介绍

文字识别技术基于阿里云深度学习技术，为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景，满足认证、鉴权、票据流转审核等业务需求。服务开通请单击立即...

API概览

本产品（文字识别/2021-07-07）的OpenAPI采用 RPC 签名风格，签名细节参见签名机制说明。我们已经为开发者封装了常见编程语言的SDK，开发者可通过下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求，可通过...

文字识别系统权限策略参考

本文描述文字识别支持的所有系统权限策略及其对应的权限描述，供您授权 RAM 身份时参考。什么是系统权限策略权限策略是用语法结构描述的一组权限的集合，可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制（RAM）产品...