图像视觉识别公司-图像视觉识别公司文档介绍内容-移动阿里云

RecognizeEnglish-英语作文识别

针对全英文图片文档场景下英文印刷体字符高效检测和识别，具备英文专项识别和英文分词功能，支持旋转、表格、文字坐标等多项基础功能。接口说明本接口适用场景阿里云英语专项识别，是阿里云官方自研 OCR 文字识别产品，适用于全英文图片...

RecognizeSocialSecurityCardVersionII-社保卡识别

接口说明本接口适用场景阿里云社保卡识别，是阿里云官方自研 OCR 文字识别产品，适用于识别社会保障卡中所包含的标题、姓名、社保卡号码、卡号、发卡日期等关键信息的场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，...

RecognizeHousehold-户口本识别

可结构化识别户口常住人口登记卡页面及户主页的内容，有效识别户口本上的相关户籍证明信息。接口说明本接口适用场景阿里云户口本识别，是阿里云官方自研 OCR 文字识别产品，可用于识别户口本户主页的户主姓名、住址、户号等字段。也适用...

RecognizeIdcard-身份证识别

本接口图片示例本接口核心能力分类概述多类型覆盖支持自动区分正反面、支持少数民族版式识别、临时身份证识别、生僻字识别、反光实拍、劣质图像识别。风险检测支持证件风险检测预警能力，包括智能判断图片完整度、复印件检测、翻拍...

RecognizeEduQuestionOcr-题目识别

接口说明本接口适用场景阿里云题目识别，是阿里云官方自研 OCR 文字识别产品，适用于扫描、拍照场景的单题题目识别，适用于智能批改等场景的题目内容识别。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨...

RecognizeTaxClearanceCertificate-税收完税证明识别

支持包括税务机关、纳税人识别号、纳税人名称、合计金额、填票人、完税详单等关键字段的结构化识别输出。接口说明本接口适用场景阿里云税收完税证明识别，是阿里云官方自研 OCR 文字识别产品，适用于识别非税收入证明所包含的税务机关、...

RecognizeEduPaperCut-试卷切题识别

接口说明本接口适用场景阿里云试卷切题识别，是阿里云官方自研 OCR 文字识别产品，适用于识别整页练习册、试卷或教辅中的题目的场景，适用于教育材料内容的数字化生产与题库录入。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量...

来往大陆（内地）通行证识别

本接口图片示例（仅支持正面识别）本接口核心能力分类概述图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体...

RecognizeDrivingLicense-驾驶证识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体准确率和召回率达 95%以上。如何使用本接口步骤概述 1 开通车辆物流识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买 ...

RecognizeVehicleLicense-行驶证识别

支持对行驶证正页、副页关键字段的自动定位和识别，同时也支持对正副页在同一张图片的场景进行自动分割与结构化识别。接口说明本接口适用场景阿里云行驶证识别，是阿里云官方自研 OCR 文字识别产品，精准定位和识别行驶证正、副页所包含...

RecognizeTrainInvoice-火车票识别

支持包括票号、出发站、到达站、开车时间、票价、座位类型、旅客信息、座位号、车次等字段结构化识别输出。2024.12.31更新后，支持电子火车票，增加返回以下新字段：电子客票号、购买方名称、购买方统一信用代码、标题、开票日期、备注。...

文字识别介绍

二维码识别 识别图像中是否含有二维码信息，输出图像中二维码包含的文本信息（每个二维码对应的URL或文本），可支持图像中含有多个二维码识别。资产类证件识别营业执照识别识别营业执照关键字段内容，包括：公司地址、营业范围、注册资本...

AliyunOCR

path str 待识别图像路径，支持本地路径或url路径 output_char_info bool 是否输出单字识别结果 need_rotate bool 是否需要自动旋转功能 output_table bool 是否输出表格识别结果，包含单元格信息 need_sort_page bool 是否按顺序输出文字...

RecognizeFoodManageLicense-食品经营许可证识别

可快速精准的识别食品经营许可证所包含生产者名称、社会信用代码、法定代表人姓名、地址、生产场所、食品类别、有效期、许可证编号等关键字段信息。接口说明本接口适用场景阿里云食品经营许可证识别，是阿里云官方自研 OCR 文字识别产品...

RecognizeEduPaperStructed-精细版结构化切题

支持多学科教辅试卷的结构化识别，将整页练习册、试卷或教辅中的题目进行自动切题，并识别出其中的文字内容和坐标位置。接口说明本接口适用场景阿里云精细版结构化切题，是阿里云官方自研 OCR 文字识别产品，适用于整页练习册、试卷或...

什么是阿里云视觉智能开放平台

阿里云视觉智能开放平台（Vision Intelligent Application Programming Interface Platform）简称视觉智能平台，是基于阿里巴巴视觉智能技术实践经验，面向视觉智能技术企业和开发商（含开发者），为其提供高易用、普惠的视觉API服务，帮助...

API概览

图像识别（imagerecog）图像识别类目能力开通链接：立即开通分类能力接口名能力中文名说明图像打标 TaggingImage 通用图像打标 识别图像中的主体内容并打上类型标签，支持数千个内容标签，覆盖常见物体品类。TaggingAdImage 广告素材...

产品功能

IVPD提供以下功能。IVPD提供以下功能图像处理 ...输入图：识别出的风格标签：风格类型：视觉风格：中国风，语义风格：典雅图像元素识别识别输入图中所包含的元素，用矩形框标注出其位置，并区分其对应的基本类型（人/物、修饰、文案）。

关于视觉智能开放平台部分公测能力转商业化产品定价的...

尊敬的阿里云用户，为进一步提升用户体验和产品性价比，提高视觉智能开放平台公有云服务水平，自 2023年12月27日起，视觉智能开放平台人脸人体、图像识别、分割抠图、图像生产的部分公测能力API将转正式商业化售卖。更多详情请参见下文...

新手指南

其他类目能力详细说明及使用方法，请参见：生成专区、人脸人体、文字识别、商品理解、内容审核、图像识别、图像生产、分割抠图、视觉搜索、图像分析处理、目标检测、视频理解、视频生产、视频分割。参考案例开发代码示例为身份证识别系统...

增值税发票卷票识别

本文介绍文字识别（ocr）类目下的增值税发票卷票识别RecognizeTicketInvoice的语法及示例。功能描述增值税发票卷票识别能力支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率、购买方识别号、...

模型上架与更新

图像编辑-通义千问实时语音识别 2025-10-27 qwen3-asr-flash-realtime、qwen3-asr-flash-realtime-2025-10-27 通义千问实时语音识别大模型具备自动语种识别功能，可识别 11 种语音类型，并能在复杂音频环境下较为准确地转录。实时语音识别...

智能视觉生产（文档停止维护）

以视觉AI能力为基础，结合平台能力及业务数据积累，面向传媒娱乐、工业制造、数字营销等行业提供视频、模型、图像等视觉内容的智能化生产服务，帮助客户提升生产效率，压缩生产周期，打通生态闭环。

营业执照识别

本文介绍文字识别（ocr）类目下的营业执照识别RecognizeBusinessLicense的语法及示例。功能描述营业执照识别能力可以识别营业执照关键字段内容，包括：公司地址、营业范围、注册资本、注册日期、公司法人、公司名称、统一社会信用代码、...

视觉智能开放平台的审计事件

说明目前操作审计支持视觉智能开放平台的功能包括：人体人脸识别、图像识别、图像分割、目标检测、OCR识别、视觉智能辅助工具。事件名称事件含义 AddBodyTrace 添加Trace。AddFaceImageTemplate 增加图像人脸融合模板。BatchAddFaces ...

增值税发票识别

本文为您介绍文字识别（ocr）类目下的增值税发票识别RecognizeVATInvoice的语法及示例。功能描述增值税发票识别能力可以识别增值税发票（电子发票和纸质发票）关键字段内容，包括：校验码、复核人、开票人、发票代码、收款人等。说明增值...

简介

智能视觉生产（Intelligent Visual Production,简称IVPD），是以视觉AI能力为基础，结合平台能力及业务数据积累，面向传媒娱乐、工业制造、数字营销等行业提供视频、模型、图像等视觉内容的智能化生产服务，帮助客户提升生产效率，压缩生产...

关于视觉智能开放平台部分公测能力停止服务的公告

文字识别文档结构化还原识别（TrimDocument）、验证码识别（RecognizeVerificationcode）、外卖单识别（RecognizeTakeoutOrder）、护照MRZ码识别（RecognizePassportMRZ）、中国护照识别（RecognizeChinapassport）、门头照识别...

图像识别常见错误码

本文为您介绍图像识别API返回的错误码信息。说明阿里云视觉智能开放平台各类目视觉AI能力API接入、接口使用或问题咨询等，请通过钉钉群（23109592）加入阿里云视觉智能开放平台咨询群联系我们。问题诊断中心使用问题诊断中心可帮助...

关于视觉智能开放平台部分公测能力转商业化产品定价的...

尊敬的阿里云用户，为进一步提升用户体验和产品性价比，提高视觉智能开放平台公有云服务水平，自 2024年02月20日起，视觉智能开放平台人脸人体、图像生产、目标检测、图像识别、分割抠图的部分公测能力API将转正式商业化售卖。...

计费项

文字识别车牌识别、驾驶证识别、行驶证识别、通用文字识别、身份证识别、增值税发票识别、银行卡识别、营业执照识别、二维码识别、VIN码识别、PDF识别、定额发票识别、增值税发票卷票识别、视频文字识别、火车票识别、表格识别、出租车...

计费方式

分割抠图头像分割、食品分割、通用分割、商品分割、人体分割、高清人体分割、通用高清分割、天空高清分割、Mask精细化分割、服饰分割、头发分割、皮肤分割、五官分割图像生产图像超分、图像裁剪、字幕擦除、风格迁移、照图修图、色彩...

通用文字识别

功能描述通用文字识别能力可以识别图像中文字内容和文字区域坐标，适用于多场景图像文字识别。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力进行更直观...

API版本

类目中文名类目英文名 API版本人脸人体 facebody 2019-12-30 文字识别 ocr 2019-12-30 商品理解 goodstech 2019-12-30 内容审核 imageaudit 2019-12-30 图像识别 imagerecog 2019-09-30 图像生产 imageenhan 2019-09-30 分割抠图 ...

功能特性

文本色情识别识别文本中的色情和低俗内容文本同步检测文本涉政识别识别文本内容中的涉政风险，包括人物、事件等-文本暴恐识别识别文本中的暴恐内容-文本广告识别识别文本内容中的垃圾广告-文本辱骂识别识别文本中的辱骂内容-文本...

关于视觉智能开放平台部分公测能力停止服务的公告

本次下线的公测API能力详情如下：类目能力 图像识别 车型识别（RecognizeVehicleType）。文字识别名片识别（RecognizeBusinessCard）、公章识别（RecognizeStamp）。视频分割视频半身人像分割（SegmentHalfBody）、绿幕视频分割...

关于视觉智能开放平台官网改版升级公告

图像识别 菜品识别、通用图像打标目标检测猫鼠识别、车辆拥堵检测、IPC图像目标检测、IPC视频目标检测视频分割视频人像分割视频生产视频降噪、视频人像增强、视频人像卡通化感谢您长期以来对视觉智能开放平台的支持，您如果对官网...

关于视觉智能开放平台部分付费能力停止服务的公告

将下架的付费能力详情如下：类目能力文字识别视频文字识别RecognizeVideoCharacter 图像识别 菜品识别RecognizeFood 图像生产高清色彩迁移RecolorHDImage 风格迁移ExtendImageStyle 色彩迁移RecolorImage 视频理解视频内容理解...

关于视觉智能开放部分公测能力停止服务的公告

本次下线的公测API能力详情如下：类目能力人脸人体口罩人脸比对（VerifyFaceMask）、厨师帽检测（DetectChefCap）、人体特征属性提取（ExtractPedestrianFeatureAttr）图像识别 Logo识别（RecognizeLogo）目标检测车辆维修方案生成...

云市场API参考

包括姓名、公司、部门、职位、手机、座机、邮箱等身份证混贴识别身份证混贴识别：支持身份证正反面同时识别，一次扫描识别页面所有字段，包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限等卡证合集识别卡证...