图像目标识别-图像目标识别文档介绍内容-移动阿里云

RecognizeFoodManageLicense-食品经营许可证识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通企业资质识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买食品...

风险识别管理

表示仅识别目标用户信息，即配置的风险识别规则仅识别所选用户信息中的风险数据。操作时间用于筛选识别风险数据的操作时间范围。参数描述选择时间范围单击目标星期及小时，即可选择所需的时间范围。用户可以选择周一至周日的任意时间，...

RecognizeEduPaperStructed-精细版结构化切题

支持多学科教辅试卷的结构化识别，将整页练习册、试卷或教辅中的题目进行自动切题，并识别出其中的文字内容和坐标位置。接口说明本接口适用场景阿里云精细版结构化切题，是阿里云官方自研 OCR 文字识别产品，适用于整页练习册、试卷或...

RecognizeBusinessLicense-营业执照识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别企事业名称、法人代表等文字信息准确率超过 95%，营业执照注册号等数字信息准确率超过 98%。如何使用本接口步骤概述 1 开通企业资质识别服务。开通...

RecognizeInvoice-增值税发票识别

支持增值税专用发票、增值税普通发票、增值税电子发票识别，支持包括发票代码、发票号码、开票日期、发票金额、发票税额、检验码、购买方税号、销售方税号、发票详情等关键字段结构化识别输出。接口说明本接口适用场景阿里云增值税发票...

图像识别计费介绍

本文主要介绍图像识别收费能力的计费方式及费用详情。其余未收费能力当前还处于公测阶段，可免费使用。咨询服务如果您有任何购买问题需要咨询阿里云视觉智能开放平台，欢迎各位企业用户、开发商、服务商或者开发者通过钉钉搜索群号 ...

明星识别

功能描述明星识别能力可以识别图像中的明星人物。可以识别超过2.7万个明星人物。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力进行更直观试用以及在线...

模型上架与更新

图像编辑-通义千问实时语音识别 2025-10-27 qwen3-asr-flash-realtime、qwen3-asr-flash-realtime-2025-10-27 通义千问实时语音识别大模型具备自动语种识别功能，可识别 11 种语音类型，并能在复杂音频环境下较为准确地转录。实时语音识别...

RecognizeVehicleRegistration-机动车注册登记证识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通车辆物流识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买车辆...

二维码识别

功能描述二维码识别能力可以识别图像中是否含有二维码信息，输出图像中二维码包含的文本信息（每个二维码对应的URL或文本），可支持图像中含有多个二维码识别。说明在同时检测多个Task的情况下，将按照Task的个数进行累计计费。您可以...

模型下载指南

下载步骤：登录控制台：首先登录Function AI控制台，在左侧导航栏，单击项目，然后在项目列表单击目标图像生成项目。访问模型广场：在图像生成项目详情页面，单击模型广场页签。浏览与选择：模型广场会展示一个清晰的模型列表。您可以...

RecognizeVehicleCertification-车辆合格证识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 97%。如何使用本接口步骤概述 1 开通车辆物流识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买车辆...

RecognizeCarInvoice-机动车销售统一发票识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通票据凭证识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买机动车...

AI写真：Python SDK使用说明

Image decode error 2 无法下载或解码图像。Number of face is not 1 3 人脸数量不为1。Image detect error 4 人脸检测异常。Image encoding error 5 将人脸编码为特征向量时出错，表示无法检测到人脸。This photo is not the same person ...

文字提取

通义千问OCR 是专用于文字提取的视觉理解模型，可从各类图像（如扫描文档、表格、票据等）中提取文本或解析结构化数据，支持识别多种语言，并能通过特定任务指令实现信息抽取、表格解析、公式识别等高级功能。您可以在阿里云百炼平台...

RecognizeMixedInvoices-混贴发票识别

支持各类票据的发票代码、价税合计、合计金额、购买方识别号、开票日期等关键字段结构化识别输出。接口说明本接口适用场景阿里云混贴发票识别，是阿里云官方自研 OCR 文字识别产品，适用于获取多种发票集合在一个页面的场景，需要获取...

进阶指南

MPImageGrayListener（废弃）/*获取识别图像的平均灰度值*正常范围大约在 50-140 之间，*当灰度值低于或高于正常范围时，通常意味着环境亮度过低或过高，可以提示用户打开或关闭手电筒*注意：该方法在识别过程中会不断被调用*@param gray ...

多媒体分析

年龄分析 1次基础模型服务 识别图像中主体人脸（唯一）的年龄区间。如果图像中有多个人脸，则只会返回区域最大的主体人脸的结果。如果图像中没有检测到人脸，将返回错误提示。年龄区间包含：'0-2'、'3-9'、'10-19'、'20-29'、'30-39'、'40-...

图像擦除补全

AI擦除补全功能能够自动识别和移除图像中的多种图像格式和尺寸元素的对象，精确识别图像中的对象，确保擦除对象的准确性和补全对象的一致性&自然性。企业级平台服务提供在高并发、大流量下的稳定写真图片生成响应和99.9%的可靠性保障，可...

RecognizeBirthCertification-出生证明识别

多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通个人证照识别服务。开通服务前后，您可以通过体验馆免费体验本功能识别效果。2 购买出生...

商品分类

功能描述商品分类能力可以识别图像中的商品分类，返回商品类目、置信度等信息。目前已经支持服饰鞋包、3C数码、家居用品等超过六千种类目分类。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品...

天空替换

功能描述输入两种图像，天空替换能力可以将参考图B的天空样式替换到目标图A中，从而改变目标图A的天空样式，实现换天功能。关于该接口功能的示例图如下：目标图A 参考图B 替换后的目标图A 说明您可以进入在线咨询获取在线人工帮助。...

头发分割

功能描述头发分割能力用于识别图像中的人物头像，然后对人物头像区域进行抠图解析，最后输出PNG格式的人物头发矩形透明图。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击 ...

iTAG概述

支持的标注任务 iTAG预置了标注模板，可支持以下类型的标注任务：图像类：图像分类、目标检测、图像OCR、表格识别、图像语义分割。文本类：文本分类、命名实体识别、实体关系识别。视频类：视频分类、视频打点、视频OCR。音频类：音频分类...

计费项

目标检测物体检测、车辆违停检测、车辆拥堵检测、白底图检测、IPC视频目标检测、IPC图像目标检测、着装检测、猫鼠识别、主体检测图像分析处理新冠病毒肺炎辅助诊断、胸部CT肺结节检测、胸部CT平扫筛查视觉搜索同图检测视频理解视频...

图像内容风控解决方案

部署及调用模型服务通过EAS，您可以将训练好的图像分类模型或图像目标检测模型部署为在线服务，并在实际的生产环境中调用，从而进行推理实践。进入模型在线服务（EAS）页面。登录 PAI控制台。在左侧导航栏单击工作空间列表，在工作空间...

普通集成

图像搜索地址标准化文档自学习产品智能视觉生产虚拟数字人开放平台视觉智能开放平台-人脸人体视觉智能开放平台-分割抠图视觉智能开放平台-商品理解视觉智能开放平台-图像生产视觉智能开放平台-图像识别 视觉智能开放平台-文字识别...

捕捉控件

考虑到匹配的准确性与效率，我们一般推荐您使用基于自动匹配的模式，若您希望捕捉的控件或其所在的界面无法被该模式识别，您也可以通过CV图像录制的模式，来截取目标操作区域，RPA会通过图像识别的方式对其进行匹配。2.1.自动匹配模式/win...

产品功能

IVPD提供以下功能。IVPD提供以下功能图像处理 ...输入图：识别出的风格标签：风格类型：视觉风格：中国风，语义风格：典雅图像元素识别识别输入图中所包含的元素，用矩形框标注出其位置，并区分其对应的基本类型（人/物、修饰、文案）。

体验中心

主体识别从图像或视频中自动定位并识别主要目标或对象，支持单个及多个主体的识别，适用于智能监控、自动驾驶、图像检索等应用。文本稀疏向量提供将文本数据转化为稀疏向量形式表达的服务，稀疏向量存储空间更小，常用于表达关键词和词频...

管理识别模型

识别模型是 DMS 敏感数据识别能力的升级，在敏感数据识别能力的基础上，扩充了内置的模型数量，同时，也支持自定义识别模型，您可以通过使用内置和自定义模型构建专属的敏感数据识别能力。本文介绍如何查看识别模型、添加、编辑和删除...

主体识别

AI搜索开放平台，支持从图像中自动检测并识别一个或多个主要目标。适用于智能监控、自动驾驶、图像检索等典型计算机视觉应用场景。准备工作为确保 SDK 能正常调用服务，请在使用前完成必要的准备工作，包括配置运行环境及获取服务访问所...

主体识别

支持从图像中自动检测并识别一个或多个主要目标，适用于智能监控、自动驾驶、图像检索等典型计算机视觉应用场景。服务名称服务ID 服务描述 API调用QPS限制（含主账号与RAM子账号）主体识别 ops-object-detect-001 由阿里云 OpenSearch-AI ...

新功能发布记录

2025年 12月类别功能名称功能描述发布时间相关文档新增主体识别支持从图像中自动检测并识别一个或多个主要目标，适用于智能监控、自动驾驶、图像检索等典型计算机视觉应用场景。2025-12-19 主体识别新增多模态排序提供图像的...

人像素描风格化

功能描述人像素描风格化能力可以对一张人物图像自动识别其头部区域，生成大头照下的素描画效果。返回结果的分辨率固定为512x512像素。关于该接口功能的示例图如下：输入原图输出效果图说明您可以进入在线咨询获取在线人工帮助。当前...

人物实例分割

人物实例分割可以识别出图像中的不同人物对象，并画出每个对象边界的像素级掩码。重要本文档仅适用于“中国大陆（北京）”地域，需使用“中国大陆（北京）”地域的 API Key。image-instance-segmentation 模型当前仅提供免费体验，免费...

智能标签

视频文字识别标签OCR 识别视频图像中的文字，提取图像文本内容。视频语音识别标签ASR 分析视频中的语音信息，提取语音文本内容。视频标签分析视频中节目、人物角色、物体、场景、地域等内容。图片标签分析图片中的人物角色、地域、动作...

功能特性

包括人物、事件、血腥暴恐等-语音广告识别识别语音内容中的垃圾广告-语音违禁识别识别语音中的违禁内容，包括违禁品、非法交易等-语音呻吟声识别识别语音内容中的娇喘和呻吟声-文档审核1.0版文档图像内容识别识别doc、docx、ppt、pptx...

数据溯源

背景信息通过DataWorks的数据保护伞的数据脱敏管理，开启目标数据识别规则的数据水印功能后，则在DataWorks中，对命中该规则的数据所执行的所有操作（例如查询、下载等）均会自动生成水印信息。水印信息用于记录用户的访问行为，...

RecognizeEstateCertification-不动产权证识别

图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。高精度识别总体识别准确率可达 98%。如何使用本接口步骤概述 1 开通个人...