图像识别市场-图像识别市场文档介绍内容-移动阿里云

多主体识别最佳实践

背景介绍多主体识别介绍：图像搜索的多主体识别是指在图像搜索任务中，系统能够识别并理解图像中存在的多个主体（物体、人物、场景等）。多主体识别技术使得搜索引擎不仅能够找到包含单一物体的图像，还能够识别和检索出包含多个相关物体...

RecognizeEduPaperOcr-整页试卷识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 97%。如何使用本接口步骤概述 1 开通教育场景识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买教育...

RecognizeEnglish-英语作文识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。多卡面类型支持各种位数、凸字卡面、平面卡面的识别。如何使用本接口步骤概述 1 开通小语种识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果...

RecognizePaymentRecord-支付详情页识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通票据凭证识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买票据...

RecognizeCovidTestReport-核酸检测报告识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通医疗场景识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买核酸...

录制脚本

说明为提高图像识别度，建议：截取屏幕图像时选择颜色对比鲜明的区域。OCR（Optical Character Recognition）识别时选择字迹清晰的文字。若识别图像失败，建议尝试自定义脚本步骤，也可联系技术支持处理。自定义用于添加自定义的代码块...

RecognizeSocialSecurityCardVersionII-社保卡识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 97%。如何使用本接口步骤概述 1 开通个人证照识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买个人...

RecognizeHousehold-户口本识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通个人证照识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买个人...

OCR

使用图像识别节点，可调用云市场购买的API进行驾驶证、车牌、身份证等图像文字识别。节点配置配置项说明节点名称设置节点名称。支持中文汉字、英文字母、数字和下划线（_），长度不超过30个字符。选择能力从下拉框中选择您需要使用的...

RecognizeIdcard-身份证识别

本接口图片示例本接口核心能力分类概述多类型覆盖支持自动区分正反面、支持少数民族版式识别、临时身份证识别、生僻字识别、反光实拍、劣质图像识别。风险检测支持证件风险检测预警能力，包括智能判断图片完整度、复印件检测、翻拍...

RecognizeTaxClearanceCertificate-税收完税证明识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通票据凭证识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买票据...

来往大陆（内地）通行证识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通个人证照识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买个人...

RecognizeVehicleLicense-行驶证识别

本接口图片示例本接口核心能力分类概述多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。行驶证混贴支持对正副页在同一张...

第二类医疗器械经营备案凭证识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通企业资质识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买企业...

捕捉控件

考虑到匹配的准确性与效率，我们一般推荐您使用基于自动匹配的模式，若您希望捕捉的控件或其所在的界面无法被该模式识别，您也可以通过CV图像录制的模式，来截取目标操作区域，RPA会通过图像识别的方式对其进行匹配。2.1.自动匹配模式/win...

RecognizeFoodProduceLicense-食品生产许可证识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通企业资质识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买企业...

RecognizeNonTaxInvoice-非税收入发票识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 97%。如何使用本接口步骤概述 1 开通票据凭证识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买车辆...

AliyunOCR

url)#获取OCR识别混贴发票的内容#Data=json.loads(output_result_dict["Data"])#print(Data)recognize_invoices recognize_invoices(image_path)方法描述 OCR增值税发票识别参数说明 image_path str 待识别图像路径，支持本地路径或url...

人脸人体介绍

阿里云视觉智能开放平台基于达摩院自研的人脸人体分析技术，提供人脸检测与五官定位、人脸属性识别、人脸比对、人脸搜索、人体检测、人体属性、行为分析等多种功能，为开发者和企业用户提供高性能高可用的人脸人体识别服务。广泛应用于数字...

RecognizeEduPaperStructed-精细版结构化切题

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通教育场景识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买精细版...

图像识别计费介绍

本文主要介绍图像识别收费能力的计费方式及费用详情。其余未收费能力当前还处于公测阶段，可免费使用。咨询服务如果您有任何购买问题需要咨询阿里云视觉智能开放平台，欢迎各位企业用户、开发商、服务商或者开发者通过钉钉搜索群号 ...

通用文字识别

功能描述通用文字识别能力可以识别图像中文字内容和文字区域坐标，适用于多场景图像文字识别。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力进行更直观...

商品理解介绍

商品理解技术是基于阿里云深度学习算法，结合图像或视频的商品检测、分析/比对技术，为您提供对商品类目、标签、属性的识别以及置信度信息等能力。可广泛应用于电子商务、零售、生产等行业，实现货架商品识别、商品二维码识别、商品属性...

智能视觉生产的审计事件

智能视觉生产已与操作审计服务集成，您可以在...SegmentBody 识别图像中人体轮廓。SegmentCloth 服饰图像像素级抠图。SegmentCommodity 商品分割。SegmentHair 识别图片中人物头像。SegmentHead 头像分割。SegmentImage 图像分割（抠图）。

模型上架与更新

中国大陆（北京）模型类型时间模型规格功能说明图像编辑 2025-12-23 qwen-image-edit-plus-2025-12-15 通义千问图像编辑发布的最新快照模型，相较于上一版本提升了角色一致性、工业设计能力和几何推理能力，并优化了编辑后的图片与原图...

版本-开发者版

全球加速网盘数据处理功能集功能功能描述参考文档数据处理图像处理支持在网盘中进行图片处理相关操作，如进行图像人脸聚类、识别图像标签、时空聚类等操作。图像处理媒体处理支持在网盘中对媒体数据进行处理，如视频转码、视频...

明星识别

功能描述明星识别能力可以识别图像中的明星人物。可以识别超过2.7万个明星人物。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力进行更直观试用以及在线...

二维码识别

功能描述二维码识别能力可以识别图像中是否含有二维码信息，输出图像中二维码包含的文本信息（每个二维码对应的URL或文本），可支持图像中含有多个二维码识别。说明在同时检测多个Task的情况下，将按照Task的个数进行累计计费。您可以...

文字提取

效果示例输入图像识别结果识别多种语言 INTERNATIONAL MOTHER LANGUAGE DAY Привет!你好!Bonjour!Merhaba!Ciao!Hello!Ola!בר מולד Salam!识别倾斜图像产品介绍本品采用韩国进口纤维丝制造，不缩水、不变形、不发霉、不生...

进阶指南

MPImageGrayListener（废弃）/*获取识别图像的平均灰度值*正常范围大约在 50-140 之间，*当灰度值低于或高于正常范围时，通常意味着环境亮度过低或过高，可以提示用户打开或关闭手电筒*注意：该方法在识别过程中会不断被调用*@param gray ...

多媒体分析

背景信息多媒体分析支持的算法服务如下：基础模型服务：提供图像领域内开箱即用的算法服务能力，包括图像多标签、图像质量分评定、人脸属性分析（颜值、脸型、发型、发色等信息）、年龄分析、人像身材修改（瘦身/大码）、图像去水印等模型...

商品分类

功能描述商品分类能力可以识别图像中的商品分类，返回商品类目、置信度等信息。目前已经支持服饰鞋包、3C数码、家居用品等超过六千种类目分类。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品...

图像擦除补全

flag":true } } 原图（image_url）人物实例分割掩码图像待擦除区域（mask_url）保留区域（foreground_url）输出图像忽略图像细节（fast_mode=true）调用示例 {"model":"image-erase-completion","input":{"image_url":...

头发分割

功能描述头发分割能力用于识别图像中的人物头像，然后对人物头像区域进行抠图解析，最后输出PNG格式的人物头发矩形透明图。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击 ...

RecognizeAllText-OCR统一识别

OCR统一识别接口支持识别多种图片类型，包括通用文字、个人卡证、发票等。您只需要通过Type参数指定图片类型，无须更换接口。接口说明如何使用本接口步骤概述 1 开通 OCR 统一识别服务。开通此 API 后会赠送免费额度，可使用免费额度...

访问域名

访问域名允许应用程序通过HTTP/HTTPS协议向特定的、与各类目能力关联的域名发送请求，从而实现对人脸人体识别、文字识别、图像识别等多种视觉AI能力的调用。其中，Region表示服务所在的地域，Endpoint表示视觉智能开放平台对外服务的访问...

2021年

2021-09-31 华东2（上海）智能美肤 2021年08月类目名称接口名称功能描述发布时间发布地域相关文档 图像识别 广告素材分析可以对素材图片中的人物（明星、素人、CG人物）、场景等打上标签信息，可支持数千个内容标签，覆盖范围广。...

视觉智能开放平台的审计事件

说明目前操作审计支持视觉智能开放平台的功能包括：人体人脸识别、图像识别、图像分割、目标检测、OCR识别、视觉智能辅助工具。事件名称事件含义 AddBodyTrace 添加Trace。AddFaceImageTemplate 增加图像人脸融合模板。BatchAddFaces ...

产品功能

IVPD提供以下功能。IVPD提供以下功能图像处理 ...输入图：识别出的风格标签：风格类型：视觉风格：中国风，语义风格：典雅图像元素识别识别输入图中所包含的元素，用矩形框标注出其位置，并区分其对应的基本类型（人/物、修饰、文案）。

什么是智能双录质检

产品优势基于达摩院 AI 能力阿里巴巴达摩院团队人工智能（Artificial Intelligence，简称 AI）实验室在语音识别、图像识别、视觉理解、语言理解等方面开展大量研究，并沉淀出 AI 相关的大量技术成果。智能双录质检产品基于达摩院 AI 技术...