图像检测-图像检测文档介绍内容-移动阿里云

物体检测

功能描述物体检测能力可以检测输入图像中的物体。关于该接口功能的示例图如下：说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力进行更直观试用以及在线购买...

模型上架与更新

中国大陆（北京）模型类型时间模型规格功能说明图像编辑 2025-12-23 qwen-image-edit-plus-2025-12-15 通义千问图像编辑发布的最新快照模型，相较于上一版本提升了角色一致性、工业设计能力和几何推理能力，并优化了编辑后的图片与原图...

异步检测

如果传入该参数，则在检测视频中图像的同时，对视频中语音进行检测。说明如果需要检测视频语音，则不支持通过上传视频截帧序列的方式（即在 task 中传入 frames）进行检测，您必须传入视频或视频流的URL地址（即在 task 中传入 url）进行...

自动化工业质检最佳实践

PolarDB for AI 工业质检方案集成了深度学习...步骤三：构建缺陷检测数据集利用上一步创建的工件模板，从大量工件图片中裁剪出各个孔洞的独立图像，然后对这些孔洞图像进行合格或缺陷的标注，从而构建用于训练最终分类模型的数据集。批量裁剪...

同步检测

使用该场景的前提是您知道要检测的图像包含哪种类型的证件。结构化卡证OCR目前支持识别以下卡证类型：营业执照、身份证（人像面和国徽面）、护照、银行卡、驾驶证（正反面）、行驶证（正反面）、车牌、车辆VIN码、户口簿户主页、户口簿常住...

图像检索

图片大小限制为20 MB以内（适用于同步和异步调用），高度或者宽度不能超过30,000像素（px），且图像总像素不超过2.5亿（px）。图片下载时间限制为3秒内，如果下载时间超过3秒，返回下载超时。图片像素建议不低于256*256（px），像素过低...

关于视觉智能开放平台部分公测能力停止服务的公告

图像识别水果检测识别（DetectFruits）。商品理解家居SPU识别（RecognizeFurnitureSpu）、家居属性识别（RecognizeFurnitureAttribute）。3D视觉多视角三维重建（ReconstructThreeDMultiView）、图像人体重建...

多媒体分析

如果图像中没有检测到人脸，将返回错误提示。年龄区间包含：'0-2'、'3-9'、'10-19'、'20-29'、'30-39'、'40-49'、'50-59'、'60-69'、'70+'。图像多标签 1次基础模型服务提供图像多标签打标能力，可以输出概率最高的Top K个标签以及对应的...

API概览

智能视觉生产IVPD提供以下相关API接口...在线调试 DetectImageElements 元素识别检测，别图像中包含的元素，用矩形框标注出其位置，并区分其对应的基本类型（人/物、修饰、文案）。输入单张图像，输出n个元素的坐标位置及对应的类型。在线调试

ASP协议

针对此类混合型内容，ASP协议引入自适应编码技术，只传输有变化的区域的更新内容，通过图像分析和检测进行分类编码，实现降低带宽、提高画质的目的。优质的网络传输在网络抖动、弱网环境下，实时交互质量受到影响；在音视频通话场景下，...

内容审核

面向大语言模型的文本审核PLUS服务图片合规检查图片合规检查包括以下内容：图片检测：关注图像内容本身的合规性，例如图片内容检测、敏感物体检测、版权检查、水印和品牌标志检查。文本检测：关注图像中的文字内容。图片审核增强版介绍及...

通义千问-图像翻译

示例：[{"src":"应用程序接口","tgt":"API"},{"src":"机器学习","tgt":"ML"}]config object（可选）属性 skipImgSegment bool（可选）用于控制是否跳过主体检测，翻译图像中主体（如人物、商品、Logo）上的文字。false：默认值，进行主体...

医学智能问答

AnswerImageDataList.N.AnswerImageData String 否 iVBORw0KGgoAAAANSUhEUgAAAoAAAAHJCAIAAACaEB9NAAEAAElEQVR4nNT9Wb*待检测皮肤病图像的Base64编码字符串。最多支持添加50条。文件的Base64编码处理操作，请参见文件Base64处理。说明当 ...

人脸检测

说明背景杂乱：复杂的背景可能会与面部特征混淆，影响检测结果在图像中存在多个人脸时，相互之间可能会发生遮挡，检测算法的性能可能会下降。前提条件已创建并获取AccessKey。具体操作，请参见创建AccessKey。已开通OSS服务、创建存储...

AI 检测相关 API

请求参数参数类型说明是否必须 isFaceDetect Boolean 是否开启动作主体识别否 imgSize NSInteger 手部检测输入的图像大小否 classifyThreshold float 手势识别阈值否 phoneActionIOU float 手持手机 IOU 阈值否 phoneActionTime ...

2023年

2023年05月类目名称能力名称功能描述发布时间发布地域相关文档图像分析处理胃癌检测可以根据输入扫描范围覆盖胃部的平扫CT（例如胸部或腹部平扫CT等），检测胃癌和非胃癌病变。2023-05-26 华东2（上海）胃癌检测 2023年04月类目...

智能标注预标注数据

方式二：自行准备.csv格式的离线预标注文件离线预标注文件至少包含数据/数据源和预标注信息，以图像类-目标检测任务为例，您可下载 offline_prelabel_file_name.csv，各列说明如下：source 列：填写图片的OSS地址。结果字段-目标检测...

视觉智能开放平台的审计事件

说明目前操作审计支持视觉智能开放平台的功能包括：人体人脸识别、图像识别、图像分割、目标检测、OCR识别、视觉智能辅助工具。事件名称事件含义 AddBodyTrace 添加Trace。AddFaceImageTemplate 增加图像人脸融合模板。BatchAddFaces ...

产品简介

通用文字识别SDK（iOS）肢体关键点肢体关键点SDK（Android）可识别授权人体图像的15个关键点检测信息，包括鼻子，眼睛，脖子，左肩，右肩等。肢体关键点SDK（iOS）肢体动作计数肢体动作计数SDK（Android）通过摄像头拍摄人像动作视频，...

线上监考

屏幕聊天工具检测：输入截屏图像，判断是否出现常见的聊天工具。考生状态检测：利用考生的前置摄像机获取图像，判断出现的人脸人体个数、人脸角度朝向、是否戴耳机，是否使用手机。说明您可以进入在线咨询获取在线人工帮助。当前能力可...

增值计费项

0.000076 0.00036 元/次图像-人脸聚类 0.001517 0.06 元/次图像-相似人脸搜索 0.00595 0.006 元/次图像-人脸图片基本 0.000083 0.00024 元/次图像-图片标签检测 0.000076 0.0012 元/次全球加速上传加速（AccO2MIn）1.25 1.25 元/GB ...

人体检测

使用场景行人检测：通过人体检测技术，对图像中的行人进行定位。行人跟踪：通过人体检测和跟踪技术，进行行人行为分析等。人体计数：通过人体检测技术，对图像中的人体进行计数，用于人流统计、场所安全等。如何使用前提条件已开通智能...

2022年

2022-12-30 华东2（上海）人脸比对1:1 2022年9月类目名称能力名称功能描述发布时间发布地域相关文档图像分析处理食管癌检测食管癌检测能力可以根据输入的胸部平扫CT评估食管癌风险。实际可用于扫描范围涵盖食管的平扫CT，如胸部...

什么是阿里云视觉智能开放平台

具体方向包括：人脸人体、文字识别、商品理解、内容审核、图像识别、图像生产、分割抠图、视觉搜索、图像分析处理、目标检测、视频理解、视频生产、视频分割共13个类目，上百项AI能力供您使用。平台将持续更新迭代更多视觉AI能力，所有...

功能特性

图片审核增强版介绍头像图片检测针对各种头像场景专门优化，支持对色情、性感、涉政、暴恐、违禁、宗教、广告引流、特殊标识、行为、特定物体、不良、谩骂、图像质量等内容进行检测，包括图片中画面内容和图片中文字内容。图片审核增强版...

图片审核增强版介绍及计费说明

业务场景头像图片检测（profilePhotoCheck）针对各种头像场景专门优化，支持对色情、性感、涉政、暴恐、违禁、宗教、广告引流、特殊标识、行为、特定物体、不良、谩骂、图像质量等内容进行检测，包括图片中画面内容和图片中文字内容。...

概述

支持检测和追踪四组预置人脸信息（人脸图像+角色名称）。支持设置人脸匹配相识度。支持在视频中把匹配到的人脸进行标记。提示人脸上线消息。当第一次在视频中检测到预设的人脸图像信息时，返回人脸上线消息。提示人脸离线消息。如果在指定...

概述

当第一次在视频中检测到预设的人脸图像信息时，返回人脸上线消息。提示人脸离线消息。如果在指定的时间间隔内检测不到已标记的人脸，返回人脸离线消息。支持动态设置检测频率，比如每秒钟 5 次。SDK 根据检测频率调用模型 SDK 进行检测并将...

肋骨骨折检测

本文介绍图像分析处理（imageprocess）类目下的肋骨骨折检测DetectRibFracture的语法及示例。服务说明由于产品业务调整，肋骨骨折检测服务将迁移至达摩院达医智影官网，肋骨骨折检测服务于2025年11月26日起停止新用户开通调用，历史开...

功能概览

支持检测和追踪四组预置人脸（人脸图像+角色名称）信息。支持设置人脸匹配相识度。支持在视频中把匹配到的人脸进行标记。提示人脸上线消息。当第一次在视频中检测到预设的人脸图像信息时，返回人脸上线消息。提示人脸离线消息。如果在指定...

概述

当第一次在视频中检测到预设的人脸图像信息时，返回人脸上线消息。提示人脸离线消息。如果在指定的时间间隔内检测不到已标记的人脸，返回人脸离线消息。支持动态设置检测频率，比如每秒钟 5 次。SDK 根据检测频率调用模型 SDK 进行检测并将...

审核大模型最佳实践

文档审核大模型版通用文档审核大模型版（document_detection_byvl）文档图像部分基于图片审核大模型服务，检测文档中是否包含图像或文本违规信息，包括色情、性感、涉政、暴恐、违禁等底线类内容。适用于通用类型文档的内容检测，支持 ...

错误反馈

如果待检测图片超过大小或者分辨率较高，请先进行图像压缩后再提交检测。更多信息，请参见同步检测。为什么调用内容安全视频直播流审核接口返回错误码480（Input/output error）？报错原因：表示下载失败，错误信息 Input/output error ...

文档审核增强版介绍及计费说明

通用文档检测服务_大模型版（document_detection_byvl）文档图像部分基于图片审核大模型服务，检测文档中是否包含图像或文本违规信息，包括色情、性感、涉政、暴恐、违禁等底线类内容。适用于通用类型文档的内容检测，支持 WORD、PPT、...

人证合一校验

如果返回 liveness，代表图像为翻拍照片或未检测到人脸，操作结束。调用人脸比对1:1（CompareFace）。请求参数 ImageURLA 和 ImageURLB，分别对应待比对的人脸图片URL和身份证图片URL地址，得到返回参数 Confidence，流程调用结束。根据...

SAM自动图片分割和预标注

背景信息 Grounded SAM模型是一个最强的零样本视觉应用，它可以通过文本输入，检测、分割和生成任何图像。它是由IDEA领衔的中国专业团队打造的，基于Meta的SAM模型和其他三个强大的零样本模型。Grounded SAM模型主要由Grounding DINO和SAM...

SDK总览

类目热门能力人脸人体人脸搜索1:N、图像人脸融合、人脸活体检测等能力。文字识别身份证识别、驾驶证识别、PDF识别等能力。商品理解商品分类。内容审核文本内容安全、图片内容安全。图像识别通用图像达标、元素识别、场景识别等能力...

图像生产计费介绍

例如，使用图像清晰度评分和物体检测两个能力，可共用已购买的两个通用预付费资源包。价格费用计算详情请参见计费方式。如果因业务需求更多QPS，请通过咨询服务联系我们。图像超分图像超分能力支持按量付费和通用预付费资源包方式...

集成概览

具体方向包括：人脸人体介绍、文字识别介绍、商品理解介绍、内容审核介绍、图像识别介绍、图像生产介绍、分割抠图介绍、视觉搜索介绍、图像分析处理介绍、目标检测介绍、视频理解介绍、视频生产介绍、视频分割介绍共13个类目，上百项AI...

银行卡识别

功能描述银行卡识别能力可以检测输入的主流银行卡图像，输出3个信息，包括：发卡行、银行卡号、有效日期。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力...

图像 检测

图像检测