图像检测与识别技术-图像检测与识别技术文档介绍内容-移动阿里云

模型列表

更多模型：通义千问图像翻译、通义万相涂鸦作画、通义万相图像局部重绘、人像风格重绘、图像背景生成、图像画面扩展、图像画面扩展、人物实例分割、图像擦除补全、虚拟模特、鞋靴模特、人物写真生成-FaceChain、AI试衣语音合成与识别 语音...

图像搜索

图像搜索服务（Image Search）是以深度学习和大规模机器学习技术为核心，通过图像识别和搜索功能，实现以图搜图的和以文搜图的智能...图像搜索服务在基于图像识别技术基础上，结合不同行业应用和业务场景，帮助用户实现相同或相似图片搜索。

内存马防御

内存马执行拦截：当内存马成功注入并尝试在系统内存中运行时，RASP通过结合深度学习与行为识别技术来检测程序的执行过程。该技术通过与已知恶意特征数据库进行对比，能够准确识别并阻止内存马的激活和执行，同时确保不干扰正常的业务操作。...

内存马防御

内存马执行拦截：当内存马成功注入并尝试在系统内存中运行时，RASP通过结合深度学习与行为识别技术来检测程序的执行过程。该技术通过与已知恶意特征数据库进行对比，能够准确识别并阻止内存马的激活和执行，同时确保不干扰正常的业务操作。...

功能特性

风控模型托管操作指南决策引擎一站式的业务风险管理平台，用于复杂风控策略设计与编排，满足实时风险识别与检测的规则计算需求的风险管理引擎。功能集功能功能描述参考文档租户接入模式事件管理事件用于定义复杂决策的业务场景，...

目标检测介绍

目标检测技术广泛应用于安防、交通等行业内图像场景的目标检测与跟踪。服务开通请单击立即开通在对应产品页面开通该服务，具体开通方式请参见新手指南。能力介绍目前阿里云视觉智能开放平台上线的目标检测能力包括：类别能力说明 ...

关于视觉智能开放平台部分公测能力转商业化产品定价的...

尊敬的阿里云用户，为进一步提升用户体验和产品性价比，提高视觉智能开放平台公有云服务水平，自 2024年02月20日起，视觉智能开放平台人脸人体、图像生产、目标检测、图像识别、分割抠图的部分公测能力API将转正式商业化售卖。...

图生唱演视频-悦动人像EMO

其中，包含2个独立的模型“悦动人像EMO-detect”和“悦动人像EMO”，分别提供人物图片合规检测与人物视频生成能力。重要本文档仅适用于“中国大陆（北京）”地域，需使用“中国大陆（北京）”地域的 API Key。模型概览模型简介悦动人像...

图生舞蹈视频-舞动人像AnimateAnyone

舞动人像AnimateAnyone可基于人物图片和人物动作模板，生成人物动作视频。...使用时，可结合实际需要调整图像检测模型与视频生成模型的部署比例。通常，当图像以有序的队列输入时，1路图像检测并发应可支撑5路视频生成并发任务。

应用场景

图像识别：将图像检测目标剪裁后配合图像识别提升识别精度。目标定位：对海量图片进行分类、打标签。图片分类通过识别图片信息实现分类管理，得出正确结果。EAIS在推理场景中支持更灵活的配置和丰富的网络访问。自然语言处理支持对字、词...

人脸识别迁移到新版

使用场景人脸识别：通过人脸检测和识别技术，检测人脸信息。然后将人脸与数据库中的人脸进行比对，实现身份验证、门禁控制等应用。人脸认证：通过人脸检测和认证技术，验证用户的身份，如手机解锁、支付验证等。人脸表情分析：通过人脸...

人脸检测

使用场景人脸识别：通过人脸检测和识别技术，检测人脸信息。然后将人脸与数据库中的人脸进行比对，实现身份验证、门禁控制等应用。人脸认证：通过人脸检测和认证技术，验证用户的身份，如手机解锁、支付验证等。人脸表情分析：通过人脸...

一键部署阶跃星辰 Step1X-Edit模型

通过整合多模态语言技术与扩散图像解码器，该模型在多种编辑任务中展现出卓越性能，能够满足专业图像编辑的需求。PAI已全面支持该模型，您可以在PAI-Model Gallery中轻松进行一键部署和调用。模型简介阶跃星辰正式发布并开源了图像编辑大...

人脸人体介绍

阿里云视觉智能开放平台基于达摩院自研的人脸人体分析技术，提供人脸检测与五官定位、人脸属性识别、人脸比对、人脸搜索、人体检测、人体属性、行为分析等多种功能，为开发者和企业用户提供高性能高可用的人脸人体识别服务。广泛应用于数字...

2020年

2020-06-30 华东2（上海）照图修图图像识别水果检测识别 识别60种常见的水果和16种坚果。2020-06-30 华东2（上海）已下线图像分析处理胸部CT肺炎结节检测对输入的胸部常规CT形成的DICOM影像（如5 mm的单个序列，API仅接受单序列），...

人脸检测

使用场景身份验证：可以通过人脸检测与 人脸相似度对比功能，实现用户信息认证，多用于手机面容解锁人脸表情分析：通过人脸检测和表情识别技术，分析人脸表情，用于情感分析、增强现实（AR）、虚拟角色等应用。说明背景杂乱：复杂的...

方案概述

金融级实人认证方案依托活体检测、生物识别、证件OCR识别等技术，与权威机构的身份要素验证接口组合，支持验证用户是否为真实有效用户。您也可以根据业务场景需要，设置是否留存人脸照片。金融级实人认证方案提供五种接入方式。您可以...

声纹检索

应用案例：网约车司机行为安全监控与敏感内容检测背景某出行公司希望通过语音识别技术，对网约车内录制的音频进行分析，从多人对话中准确提取司机的语音片段，识别司机语音中是否存在违规内容。通过 AnalyticDB for MySQL 提供的声纹识别...

2021年

2021-07-31 华东2（上海）主动脉瘤肺动脉高压检测 2021年06月类目名称能力名称功能描述发布时间支持终端相关文档离线SDK 实时视频分割SDK 基于深度学习框架，结合检测识别技术，实现高精视觉分割能力，可实现实时全自动主体、场景...

内容安全检测

在社交媒体平台上，文本内容检测技术可以自动识别和过滤包含欺凌、仇恨言论、不当内容或其他违反平台规则的信息，有助于保护用户免受有害信息的侵扰，还能维护线上交流环境的健康和安全，确保内容的合规性和积极性，从而提高用户体验与满意...

App（SDK）接入

金融级实人认证方案依托活体检测、生物识别、证件OCR识别等技术，与权威机构的身份要素验证接口组合，支持验证用户是否为真实有效用户。您也可以根据业务场景需要，设置是否留存人脸照片。本文介绍通过 App（SDK）接入金融级实人认证服务...

分割抠图介绍

分割抠图技术基于阿里云深度学习技术，结合检测识别技术，为您提供高精度视觉分割能力。分割抠图技术可以实现秒级全自动主体、场景像素级识别，制作4通道透明素材。不仅实现了发丝级精抠，对高度镂空主体、复杂背景等场景都有很好的效果，...

商品理解介绍

商品理解技术是基于阿里云深度学习算法，结合图像或视频的商品检测、分析/比对技术，为您提供对商品类目、标签、属性的识别以及置信度信息等能力。可广泛应用于电子商务、零售、生产等行业，实现货架商品识别、商品二维码识别、商品属性...

API概览

人脸人体（facebody）人脸人体类目能力开通链接：立即开通分类能力接口名能力中文名说明人脸检测 DetectFace 人脸检测与五官定位 识别图像中是否有人脸，进行人脸检测后返回检测到的人脸矩形框坐标。人脸属性 RecognizeExpression ...

功能特性

获取任务信息查询任务列表图片数据处理图片数据处理功能支持图片的自动识别、标签检测，格式转换，图片处理以及人脸识别技术，提供一站式的图片管理和应用需求。功能集功能功能描述参考文档图片检测识别 图片标签检测图片标签检测...

主体识别

支持从图像中自动检测并识别一个或多个主要目标，适用于智能监控、自动驾驶、图像检索等典型计算机视觉应用场景。服务名称服务ID 服务描述 API调用QPS限制（含主账号与RAM子账号）主体识别 ops-object-detect-001 由阿里云 OpenSearch-AI ...

应用场景

如今，企业使用AI图像技术，将带有产品缺陷的5万多张图片上传到云计算平台，通过深度学习与图像处理技术进行算法训练。优化的AI算法，其识别准确度可达到95%以上，碎片率（瑕疵品）下降50%。不仅如此，从图像拍摄到数据接收、处理，然后到...

换脸鉴别

准确率高：换脸鉴别结合阿里云多年人脸识别技术能力和大数据安全技术能力，能对视频图像中 AI 换脸、AI人脸生成等技术进行准确识别判断，对AI换脸攻击识别准确率高。支持单个或多个人脸判断逻辑，可直接调用的API接口，服务简单易用，易被...

服务端人脸识别SDK

检测模块和识别模块并行处理获取视频流之后，通过人脸检测识别出人脸，根据跟踪的ID进行人脸质量的判断。一个人脸的质量可以通过关键点定位是否准确、人脸质量模块分值是否比较高、人脸的角度是否在一定的范围内进行挑选，然后送入到活体...

RecognizeIdcard-身份证识别

人像检测支持图像检测功能，可定位身份证中的人像图案并返回坐标。图像增强默认支持图像增强，包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。如何使用本接口步骤概述 1 开通个人证照识别服务。开通服务前后，您可以通过 ...

什么是智能双录质检

产品介绍智能双录质检（Intelligent Dual-Recording System,简称 IDRS）是蚂蚁集团移动开发平台（mPaaS）团队与阿里巴巴达摩院基于实时音视频以及 AI 识别服务，共同研制的一款智能化的音视频内容录制、检测及审核产品。该产品通过 AI ...

新手指南

其他类目能力详细说明及使用方法，请参见：生成专区、人脸人体、文字识别、商品理解、内容审核、图像识别、图像生产、分割抠图、视觉搜索、图像分析处理、目标检测、视频理解、视频生产、视频分割。参考案例开发代码示例为身份证识别系统...

RecognizeEduPaperOcr-整页试卷识别

接口说明本接口适用场景阿里云整页试卷识别，是阿里云官方自研 OCR 文字识别产品，适用于对练习册、教辅、教材等内容进行整页识别与题目检索场景。阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据，历经多年沉淀打磨，具有...

功能特性

单击在线体验音视频增强音频增强视频云音频实验室有机结合传统信号处理与深度学习技术，提供全场景音频增强与修复方案。单击在线体验。重要以下功能需要在提交转码作业时配置相应参数使用，音频部分按照输出的音频规格和时长，...

模型上架与更新

实时语音识别-通义千问视觉理解 2025-10-21 qwen3-vl-32b-thinking、qwen3-vl-32b-instruct Qwen3-VL系列 32B 的Dense模型，文档识别与理解、空间感知与万物识别能力、视觉2D检测与空间推理能力均表现出色，适合通用场景下的复杂感知任务...

人物实例分割

基本介绍人物实例分割运用了检测和分割技术，不仅能够在图像中识别出不同的对象，而且还能准确地画出每一个对象边界的像素级掩码（mask）。推荐配合使用图像擦除补全接口来进行AI人体消除，选择完整人体mask区域来消除一个或多个人物。...

进阶指南

相比 MPScanner，使用 MPCustomScanView 的方案封装了相机管理、码识别、多码识别、画面放大与缩小、码结果解析等扫一扫服务核心流程，您在开发时无需关注相关操作，只需专注于在 MPCustomScanView 中实现您自定义的 UI。您仍然可以继续...

iTAG概述

支持的标注任务 iTAG预置了标注模板，可支持以下类型的标注任务：图像类：图像分类、目标检测、图像OCR、表格识别、图像语义分割。文本类：文本分类、命名实体识别、实体关系识别。视频类：视频分类、视频打点、视频OCR。音频类：音频分类...

2023年

融合戴口罩生成、抗遮挡关键点定位、抗遮挡特征注意力三大技术优化，实现戴口罩时的极速人脸识别。2023-02-02 华东2（上海）口罩人脸比对1:1 图像生产生成式图像卡通化输入一张图像，选择想要生成的卡通化风格，即可生成与输入图像相同...

工业质检解决方案

在基于YOLOX模型和iTAG标注数据的图像检测示例区域，单击在DSW中打开，并按照控制台操作指引构建yolox目标检测模型。如果您使用的是iTAG标注的自定义数据集，请将以下数据集目录替换为准备数据中的自定义数据集目录。将训练后得到的_...