图像识别人工智能-图像识别人工智能文档介绍内容-移动阿里云

城市视觉智能引擎

城市视觉智能引擎依托于阿里云分布式计算和存储平台，利用先进的视频图像、图形学处理技术和深度学习算法，建立城市级人工智能模型，实现对整个城市视觉数据(枪机、球机等摄像头数据以及遥感、卫星、无人机采集的图像数据)的接入、计算、...

文字识别介绍

二维码识别 识别图像中是否含有二维码信息，输出图像中二维码包含的文本信息（每个二维码对应的URL或文本），可支持图像中含有多个二维码识别。资产类证件识别营业执照识别识别营业执照关键字段内容，包括：公司地址、营业范围、注册资本...

多媒体分析

使用指导开通多媒体分析服务和购买资源包新用户首先需要在 人工智能平台PAI 的场景化解决方案的多媒体分析中开通服务，具体操作步骤如下。登录 PAI控制台。按照下图操作指引，开通多媒体分析服务。默认使用按量付费（后付费）方式...

银行卡识别

功能描述银行卡识别能力可以检测输入的主流银行卡图像，输出3个信息，包括：发卡行、银行卡号、有效日期。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验，您可以单击立即试用对该能力...

车牌识别

功能描述车牌识别能力可以准确识别出图像中车牌位置，输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度，共5个关键字段信息。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费...

API概览

本产品（智能媒体生产/2020-11-09）的OpenAPI采用 RPC 签名风格，签名细节参见签名机制说明。我们已经为开发者封装了常见编程语言的SDK，开发者可通过下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求，可...

图像色彩增强

功能描述图像色彩增强能力可以对输入图像进行智能内容分析，根据图像内容自动调整参数，对图像饱和度、亮度、对比度等多个维度进行优化，输出增强后的图像。关于该接口功能的示例图如下：输入原图：输出增强后示意图：说明您可以进入 ...

iTAG概述

支持的标注任务 iTAG预置了标注模板，可支持以下类型的标注任务：图像类：图像分类、目标检测、图像OCR、表格识别、图像语义分割。文本类：文本分类、命名实体识别、实体关系识别。视频类：视频分类、视频打点、视频OCR。音频类：音频分类...

通用分割

功能描述通用分割能力可以识别输入图像中视觉中心的物体轮廓，将物体与背景进行分离，返回分割后的前景物体图（4通道）。关于该接口功能的示例图如下：输入原图输出结果图您可以传入ReturnForm参数指定返回结果形式：指定为 crop，对...

功能特性

文本色情识别识别文本中的色情和低俗内容文本同步检测文本涉政识别识别文本内容中的涉政风险，包括人物、事件等-文本暴恐识别识别文本中的暴恐内容-文本广告识别识别文本内容中的垃圾广告-文本辱骂识别识别文本中的辱骂内容-文本...

视觉智能开放平台的审计事件

说明目前操作审计支持视觉智能开放平台的功能包括：人体人脸识别、图像识别、图像分割、目标检测、OCR识别、视觉智能辅助工具。事件名称事件含义 AddBodyTrace 添加Trace。AddFaceImageTemplate 增加图像人脸融合模板。BatchAddFaces ...

公众人物识别

本文介绍人脸人体（facebody）类目下的公众人物识别RecognizePublicFace的语法及示例。功能描述公众人物识别能力可以识别图片中的公众人物信息。公众人物是指在一定范围内具有重要影响力、拥有一定的社会地位、被大众广泛关注、且能因此从...

猫鼠识别

本文为您介绍目标检测（objectdet）类目下的猫鼠识别DetectKitchenAnimals的语法及示例。服务说明由于产品业务调整，猫鼠识别服务于即日起停止新用户开通调用，历史开通过该服务的老用户可继续调用，2026年04月20日后该服务将下架，不再...

动作行为识别

功能描述动作行为识别能力可以识别视频和图像中的人体动作行为，并返回识别后的行为类别。当前可以识别的行为类别包括：举手、吃喝、吸烟、打电话、玩手机、趴桌睡觉、跌倒、洗手、拍照。您可以根据系统提供的动作置信度判断阈值，对识别...

云市场常见问题

本章节介绍阿里云OCR在云市场官方店铺（“阿里云计算有限公司”）的常见问题。...OCR支持特定场景的SDK，包含身份证识别SDK、银行卡识别SDK、手机号提取SDK、指尖检测SDK、图像矫正SDK、扫读SDK等。若有离线SDK需求可进一步联系我们。

表情识别

本文为您介绍人脸人体（facebody）类目下的表情识别RecognizeExpression的语法及示例。功能描述表情识别能力可以检测和识别图片中人脸的表情。表情种类为：neutral（中性）、happiness（高兴）、surprise（惊讶）、sadness（伤心）、anger...

VIN码识别

本文介绍文字识别（ocr）类目下的VIN码识别RecognizeVINCode的语法及示例。功能描述 VIN码识别能力可以识别车辆VIN码，输出车辆VIN码数值。说明您可以进入在线咨询获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验...

智能媒资检索

阿里云智能媒资检索功能（简称智能检索或多模检索）是一种基于AI算法的音视频内容分析与搜索工具。支持从海量音视频中高效检索目标内容。无需人工标注，通过视觉、音频、文本等多模态特征实现秒级响应。功能说明多模态特征支持通过多种...

增值税发票卷票识别

本文介绍文字识别（ocr）类目下的增值税发票卷票识别RecognizeTicketInvoice的语法及示例。功能描述增值税发票卷票识别能力支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率、购买方识别号、...

火车票识别

本文介绍文字识别（ocr）类目下的火车票识别RecognizeTrainTicket的语法及示例。功能描述火车票识别能力可以对火车票进行结构化识别，输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号，共8个关键字段...

换脸鉴别

准确率高：换脸鉴别结合阿里云多年人脸识别技术能力和大数据安全技术能力，能对视频图像中 AI 换脸、AI人脸生成等技术进行准确识别判断，对AI换脸攻击识别准确率高。支持单个或多个人脸判断逻辑，可直接调用的API接口，服务简单易用，易被...

驾驶证识别

本文介绍文字识别（ocr）类目下的驾驶证识别RecognizeDriverLicense的语法及示例。功能描述驾驶证识别能力可以识别驾驶证首页和副页关键字段内容，包括：档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期...

图像关键点训练

如果您的业务场景涉及人体相关的关键点检测，则可以通过图像关键点训练组件构建关键点模型，从而进行模型推理。本文为您介绍图像关键点训练组件的配置方法及使用示例。前提条件已开通OSS并完成授权，详情请参见开通OSS服务和云产品依赖...

行驶证识别

本文介绍文字识别（ocr）类目下的行驶证识别RecognizeDrivingLicense的语法及示例。功能描述行驶证识别能力可以识别行驶证首页和副页关键字段内容，输出品牌型号、车辆类型、车牌号码、检验记录、核定载质量、核定载人数等21个关键字段...

身份证识别

本文介绍文字识别（ocr）类目下的身份证识别RecognizeIdentityCard的语法及示例。功能描述身份证识别可以识别二代身份证关键字段内容，关键字段包括：姓名、性别、民族、身份证号、出生日期、地址信息、有效起始时间、签发机关，同时可...

定额发票识别

本文介绍文字识别（ocr）类目下的定额发票识别RecognizeQuotaInvoice的语法及示例。功能描述定额发票识别能力可以对定额发票上的发票号码、发票代码、发票金额进行结构化识别。说明定额发票识别接口仅识别发票中的文本内容，不支持辨别...

通过OSS使用智能媒体管理

为OSS的存储空间（Bucket）绑定智能媒体管理项目后，通过OSS控制台或SDK可以使用智能媒体管理的功能，例如文档预览、人脸识别等。本文介绍通过OSS使用智能媒体管理的前提条件、注意事项和使用流程。重要此文档已不再维护，建议您使用新版...

计费方式

目标检测物体检测、猫鼠识别、着装检测、白底图检测、车辆拥堵检测、车辆违停检测、IPC图像目标检测、主体检测 图像识别 场景识别、菜品识别、通用图像打标、广告素材分析、颜色识别、元素识别、垃圾分类识别商品理解商品分类视频通用...

产品功能相关

文档智能是文字识别技术的进一步升级，除了文字识别，文档智能还综合运用自然语言处理、图像处理、电子文档解析、文档预训练模型等多种技术，实现对PDF/Word/Excel/图片等各类非结构化和半结构化文档的智能自动化处理。相较于文字识别只能...

什么是阿里云视觉智能开放平台

具体方向包括：人脸人体、文字识别、商品理解、内容审核、图像识别、图像生产、分割抠图、视觉搜索、图像分析处理、目标检测、视频理解、视频生产、视频分割共13个类目，上百项AI能力供您使用。平台将持续更新迭代更多视觉AI能力，所有...

能力开通

ScanImage 图片内容安全 图像识别（imagerecog）图像识别类目能力开通链接：立即开通分类能力接口名能力中文名图像打标 TaggingImage 通用图像打标 TaggingAdImage 广告素材分析基础识别 RecognizeImageColor 颜色识别 ...

什么是文档智能

文档智能深度融合文字识别、自然语言处理、图像处理、电子文档解析、文档预训练模型等多项技术，对非结构化和半结构化文档进行智能自动化处理，从而简化业务操作流程、提升文档处理效率，帮助企业更准确地进行大模型应用的场景建设。...

产品功能

IVPD提供以下功能。IVPD提供以下功能图像处理 ...输入图：识别出的风格标签：风格类型：视觉风格：中国风，语义风格：典雅图像元素识别识别输入图中所包含的元素，用矩形框标注出其位置，并区分其对应的基本类型（人/物、修饰、文案）。

概述

使用本产品前，您的技能要求如下：对人工智能有初步了解，清楚大致的算法逻辑。对云服务产品具有一定的知识储备，尤其在服务调用方式和云服务管理方面。读者对象本文档作为快速入门参考，适用于有以下需求的读者对象：了解如何购买图像...

风险识别模型简介

风险识别模型是基于阿里20年与黑灰产的对抗经验和先进的人工智能技术打造而成的标准化风控服务。面向互联网业务场景下：账号注册、平台登录、营销活动等场景。对各产业、行业客户提供服务，包括：电商、社交、游戏、出行、零售、媒体、金融...

访问域名

访问域名允许应用程序通过HTTP/HTTPS协议向特定的、与各类目能力关联的域名发送请求，从而实现对人脸人体识别、文字识别、图像识别等多种视觉AI能力的调用。其中，Region表示服务所在的地域，Endpoint表示视觉智能开放平台对外服务的访问...

RecognizeIdcard-身份证识别

本接口图片示例本接口核心能力分类概述多类型覆盖支持自动区分正反面、支持少数民族版式识别、临时身份证识别、生僻字识别、反光实拍、劣质图像识别。风险检测支持证件风险检测预警能力，包括智能判断图片完整度、复印件检测、翻拍...

API版本

类目中文名类目英文名 API版本人脸人体 facebody 2019-12-30 文字识别 ocr 2019-12-30 商品理解 goodstech 2019-12-30 内容审核 imageaudit 2019-12-30 图像识别 imagerecog 2019-09-30 图像生产 imageenhan 2019-09-30 分割抠图 ...

2021年

2021-09-31 华东2（上海）智能美肤 2021年08月类目名称接口名称功能描述发布时间发布地域相关文档 图像识别 广告素材分析可以对素材图片中的人物（明星、素人、CG人物）、场景等打上标签信息，可支持数千个内容标签，覆盖范围广。...

关于视觉智能开放平台官网改版升级公告

图像识别 菜品识别、通用图像打标目标检测猫鼠识别、车辆拥堵检测、IPC图像目标检测、IPC视频目标检测视频分割视频人像分割视频生产视频降噪、视频人像增强、视频人像卡通化感谢您长期以来对视觉智能开放平台的支持，您如果对官网...