城市视觉智能引擎依托于阿里云分布式计算和存储平台,利用先进的视频图像、图形学处理技术和深度学习算法,建立城市级人工智能模型,实现对整个城市视觉数据(枪机、球机等摄像头数据以及遥感、卫星、无人机采集的图像数据)的接入、计算、...
二维码识别 识别图像中是否含有二维码信息,输出图像中二维码包含的文本信息(每个二维码对应的URL或文本),可支持图像中含有多个二维码识别。资产类证件识别 营业执照识别 识别营业执照关键字段内容,包括:公司地址、营业范围、注册资本...
使用指导 开通多媒体分析服务和购买资源包 新用户首先需要在 人工智能平台PAI 的 场景化解决方案 的 多媒体分析 中开通服务,具体操作步骤如下。登录 PAI控制台。按照下图操作指引,开通 多媒体分析 服务。默认使用按量付费(后付费)方式...
功能描述 银行卡识别能力可以检测输入的主流银行卡图像,输出3个信息,包括:发卡行、银行卡号、有效日期。说明 您可以进入 在线咨询 获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验,您可以单击 立即试用 对该能力...
功能描述 车牌识别能力可以准确识别出图像中车牌位置,输出车牌位置坐标、车牌类型、车牌号码、车牌号码置信度、车牌置信度,共5个关键字段信息。说明 您可以进入 在线咨询 获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费...
本产品(智能媒体生产/2020-11-09)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可...
功能描述 图像色彩增强能力可以对输入图像进行智能内容分析,根据图像内容自动调整参数,对图像饱和度、亮度、对比度等多个维度进行优化,输出增强后的图像。关于该接口功能的示例图如下:输入原图:输出增强后示意图:说明 您可以进入 ...
支持的标注任务 iTAG预置了标注模板,可支持以下类型的标注任务:图像类:图像分类、目标检测、图像OCR、表格识别、图像语义分割。文本类:文本分类、命名实体识别、实体关系识别。视频类:视频分类、视频打点、视频OCR。音频类:音频分类...
功能描述 通用分割能力可以识别输入图像中视觉中心的物体轮廓,将物体与背景进行分离,返回分割后的前景物体图(4通道)。关于该接口功能的示例图如下:输入原图 输出结果图 您可以传入ReturnForm参数指定返回结果形式:指定为 crop,对...
文本色情识别 识别文本中的色情和低俗内容 文本同步检测 文本涉政识别 识别文本内容中的涉政风险,包括人物、事件等-文本暴恐识别 识别文本中的暴恐内容-文本广告识别 识别文本内容中的垃圾广告-文本辱骂识别 识别文本中的辱骂内容-文本...
说明 目前操作审计支持视觉智能开放平台的功能包括:人体人脸识别、图像识别、图像分割、目标检测、OCR识别、视觉智能辅助工具。事件名称 事件含义 AddBodyTrace 添加Trace。AddFaceImageTemplate 增加图像人脸融合模板。BatchAddFaces ...
本文介绍人脸人体(facebody)类目下的公众人物识别RecognizePublicFace的语法及示例。功能描述 公众人物识别能力可以识别图片中的公众人物信息。公众人物是指在一定范围内具有重要影响力、拥有一定的社会地位、被大众广泛关注、且能因此从...
本文为您介绍目标检测(objectdet)类目下的猫鼠识别DetectKitchenAnimals的语法及示例。服务说明 由于产品业务调整,猫鼠识别服务于 即日起停止新用户开通调用,历史开通过该服务的老用户可继续调用,2026年04月20日后该服务将下架,不再...
功能描述 动作行为识别能力可以识别视频和图像中的人体动作行为,并返回识别后的行为类别。当前可以识别的行为类别包括:举手、吃喝、吸烟、打电话、玩手机、趴桌睡觉、跌倒、洗手、拍照。您可以根据系统提供的动作置信度判断阈值,对识别...
本章节介绍阿里云OCR在云市场官方店铺(“阿里云计算有限公司”)的常见问题。...OCR支持特定场景的SDK,包含身份证识别SDK、银行卡识别SDK、手机号提取SDK、指尖检测SDK、图像矫正SDK、扫读SDK等。若有离线SDK需求可进一步 联系我们。
本文为您介绍人脸人体(facebody)类目下的表情识别RecognizeExpression的语法及示例。功能描述 表情识别能力可以检测和识别图片中人脸的表情。表情种类为:neutral(中性)、happiness(高兴)、surprise(惊讶)、sadness(伤心)、anger...
本文介绍文字识别(ocr)类目下的VIN码识别RecognizeVINCode的语法及示例。功能描述 VIN码识别能力可以识别车辆VIN码,输出车辆VIN码数值。说明 您可以进入 在线咨询 获取在线人工帮助。当前能力可在视觉智能开放平台有完整的免费产品体验...
阿里云智能媒资检索功能(简称智能检索或多模检索)是一种基于AI算法的音视频内容分析与搜索工具。支持从海量音视频中高效检索目标内容。无需人工标注,通过视觉、音频、文本等多模态特征实现秒级响应。功能说明 多模态特征支持 通过多种...
本文介绍文字识别(ocr)类目下的增值税发票卷票识别RecognizeTicketInvoice的语法及示例。功能描述 增值税发票卷票识别能力支持对卷票上包括价税合计、发票代码、发票号码、合计税额、合计金额、密码区、开票日期、税率、购买方识别号、...
本文介绍文字识别(ocr)类目下的火车票识别RecognizeTrainTicket的语法及示例。功能描述 火车票识别能力可以对火车票进行结构化识别,输出乘车时间、始发站、目的站、座位席别、乘车人姓名、车次号、票价、车厢及座次号,共8个关键字段...
准确率高:换脸鉴别结合阿里云多年人脸识别技术能力和大数据安全技术能力,能对视频图像中 AI 换脸、AI人脸生成等技术进行准确识别判断,对AI换脸攻击识别准确率高。支持单个或多个人脸判断逻辑,可直接调用的API接口,服务简单易用,易被...
本文介绍文字识别(ocr)类目下的驾驶证识别RecognizeDriverLicense的语法及示例。功能描述 驾驶证识别能力可以识别驾驶证首页和副页关键字段内容,包括:档案编号、姓名、有效期时长、性别、发证日期、驾驶证号、驾驶证准驾车型、有效期...
如果您的业务场景涉及人体相关的关键点检测,则可以通过图像关键点训练组件构建关键点模型,从而进行模型推理。本文为您介绍图像关键点训练组件的配置方法及使用示例。前提条件 已开通OSS并完成授权,详情请参见 开通OSS服务 和 云产品依赖...
本文介绍文字识别(ocr)类目下的行驶证识别RecognizeDrivingLicense的语法及示例。功能描述 行驶证识别能力可以识别行驶证首页和副页关键字段内容,输出品牌型号、车辆类型、车牌号码、检验记录、核定载质量、核定载人数等21个关键字段...
本文介绍文字识别(ocr)类目下的身份证识别RecognizeIdentityCard的语法及示例。功能描述 身份证识别可以识别二代身份证关键字段内容,关键字段包括:姓名、性别、民族、身份证号、出生日期、地址信息、有效起始时间、签发机关,同时可...
本文介绍文字识别(ocr)类目下的定额发票识别RecognizeQuotaInvoice的语法及示例。功能描述 定额发票识别能力可以对定额发票上的发票号码、发票代码、发票金额进行结构化识别。说明 定额发票识别接口仅识别发票中的文本内容,不支持辨别...
为OSS的存储空间(Bucket)绑定智能媒体管理项目后,通过OSS控制台或SDK可以使用智能媒体管理的功能,例如文档预览、人脸识别等。本文介绍通过OSS使用智能媒体管理的前提条件、注意事项和使用流程。重要 此文档已不再维护,建议您使用新版...
目标检测 物体检测、猫鼠识别、着装检测、白底图检测、车辆拥堵检测、车辆违停检测、IPC图像目标检测、主体检测 图像识别 场景识别、菜品识别、通用图像打标、广告素材分析、颜色识别、元素识别、垃圾分类识别 商品理解 商品分类 视频通用...
文档智能是文字识别技术的进一步升级,除了文字识别,文档智能还综合运用自然语言处理、图像处理、电子文档解析、文档预训练模型等多种技术,实现对PDF/Word/Excel/图片等各类非结构化和半结构化文档的智能自动化处理。相较于文字识别只能...
具体方向包括:人脸人体、文字识别、商品理解、内容审核、图像识别、图像生产、分割抠图、视觉搜索、图像分析处理、目标检测、视频理解、视频生产、视频分割 共13个类目,上百项AI能力供您使用。平台将持续更新迭代更多视觉AI能力,所有...
ScanImage 图片内容安全 图像识别(imagerecog)图像识别类目能力开通链接:立即开通 分类 能力接口名 能力中文名 图像打标 TaggingImage 通用图像打标 TaggingAdImage 广告素材分析 基础识别 RecognizeImageColor 颜色识别 ...
文档智能深度融合文字识别、自然语言处理、图像处理、电子文档解析、文档预训练模型等多项技术,对非结构化和半结构化文档进行智能自动化处理,从而简化业务操作流程、提升文档处理效率,帮助企业更准确地进行大模型应用的场景建设。...
IVPD提供以下功能。IVPD提供以下功能 图像处理 ...输入图:识别出的风格标签:风格类型:视觉风格:中国风,语义风格:典雅 图像元素识别 识别输入图中所包含的元素,用矩形框标注出其位置,并区分其对应的基本类型(人/物、修饰、文案)。
使用本产品前,您的技能要求如下:对人工智能有初步了解,清楚大致的算法逻辑。对云服务产品具有一定的知识储备,尤其在服务调用方式和云服务管理方面。读者对象 本文档作为快速入门参考,适用于有以下需求的读者对象:了解如何购买图像...
风险识别模型是基于阿里20年与黑灰产的对抗经验和先进的人工智能技术打造而成的标准化风控服务。面向互联网业务场景下:账号注册、平台登录、营销活动等场景。对各产业、行业客户提供服务,包括:电商、社交、游戏、出行、零售、媒体、金融...
访问域名允许应用程序通过HTTP/HTTPS协议向特定的、与各类目能力关联的域名发送请求,从而实现对人脸人体识别、文字识别、图像识别等多种视觉AI能力的调用。其中,Region表示服务所在的地域,Endpoint表示视觉智能开放平台对外服务的访问...
本接口图片示例 本接口核心能力 分类 概述 多类型覆盖 支持自动区分正反面、支持少数民族版式识别、临时身份证识别、生僻字识别、反光实拍、劣质图像识别。风险检测 支持证件风险检测预警能力,包括智能判断图片完整度、复印件检测、翻拍...
类目中文名 类目英文名 API版本 人脸人体 facebody 2019-12-30 文字识别 ocr 2019-12-30 商品理解 goodstech 2019-12-30 内容审核 imageaudit 2019-12-30 图像识别 imagerecog 2019-09-30 图像生产 imageenhan 2019-09-30 分割抠图 ...
2021-09-31 华东2(上海)智能美肤 2021年08月 类目名称 接口名称 功能描述 发布时间 发布地域 相关文档 图像识别 广告素材分析 可以对素材图片中的人物(明星、素人、CG人物)、场景等打上标签信息,可支持数千个内容标签,覆盖范围广。...
图像识别 菜品识别、通用图像打标 目标检测 猫鼠识别、车辆拥堵检测、IPC图像目标检测、IPC视频目标检测 视频分割 视频人像分割 视频生产 视频降噪、视频人像增强、视频人像卡通化 感谢您长期以来对视觉智能开放平台的支持,您如果对官网...