内容安全
阿里云内容安全基于深度学习技术,提供图片、视频、语音、文字、网页等多媒体的内容风险智能识别和审核服务,帮助用户发现色情、暴恐、政治敏感等风险内容,大幅度降低人工审核成本。
升级AIGC类文字检测,支持对模型流式输出文字进行自动拼接.视频审核增强版服务支持对直播流的审核,满足直播业务需求.内容审核新增URL检测服务,帮助用户识别URL链接是否存在风险.中央网信办部署开展2024年“清朗”系列专项行动.国家新闻出版署关于公开征求《网络游戏管理办法(草案征求意见稿)》.关于开展“清朗·网络...
来自: 云产品
云上 AI
依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代
图生:推荐Qwen VL,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片提取属性,根据习题进行解题等。图生文生:推荐通义万相,可用于生成证件照、模特、各种风格(动漫、国风、二次元等)人像,也可用于抠图、生成背景、更改图片元素等。语音和视频类 语音合成(文本转语音):...
来自: 解决方案
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
本产品具备完善的图像检测、文字识别和文字理解的能力,服务的日均访问量高达上亿次,具有优秀的识别效果与处理性能.更多产品与服务.随着交通行业的发展,车辆服务的需求不断扩大,对应人工成本不断增加,手工输入车辆相关信息,耗时耗力还容易出错.实现违章车辆信息的自动识别,实现道路违章行为检测和记录的自动化,有效...
来自: 云产品
仪器仪表识别
阿里云OCR文字识别-燃气表识别,自动识别燃气表、水表读数信息,返回读表器整数和小数部分读数
更多产品与服务.OCR文字识别大规模调价,部分商品降幅达26%,低至0.011元/次调用.OCR文字识别大规模调价,部分商品降幅达26%,低至0.011元/次调用.<查看全部文字识别产品.读表器识别支持燃气表识别、水表识别。支持图像智能旋转、畸变矫正、分辨率增强等高精度识别能力,精准识别燃气表、水表读数.使用移动设备到现场采集...
来自: 云产品
图像搜索
图像搜索是阿里云自研的一款用于图片间相似性检索的平台型产品。通过输入图片,可高精度、高效率的在图库网站中检索到与输入图片相似的图片集合,并支持定制化服务。以图搜图可广泛的应用于拍照购物、 商品推荐、版权保护、图片相似推荐等场景。
图像搜索(淘宝联盟版)以图像识别和大规模图像检索技术为基础,可快速识别图片的主体物品并返回淘宝联盟相同、相似或相关的商品信息并自动关联优惠券和佣金。可广泛应用于拍照购物、内容导购、商品推荐、精准广告投放等场景.图像搜索-淘宝联盟版.向量检索服务基于阿里云自研的向量引擎 Proxima 内核,提供具备水平拓展...
来自: 云产品
个人证照识别
个人证照识别是阿里云提供的通用型卡证OCR,可以解决通用卡证类的文字识别及识别信息结构化的问题。本类产品下包含身份证正反面识别、护照识别、银行卡识别、名片识别、户口页识别。
支持二代身份证正反面/多民族/生僻识别,具备检测篡改PS/复印件、完整度评分、翻拍检测、反光/水印识别图像智能旋转/畸变矫正/分辨率增强、人像检测等高精度识别能力.读光行驶证支持对行驶证正页、副页关键字段的自动定位和识别。其中,行驶证的总体准确率和召回率在93%以上,适应模糊、光照不均、透视畸变、任意背景等...
来自: 云产品
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
视觉智能文字识别 OCR可以将图片的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了10大类,满足各种客户的图片识别需求。视觉智能开放平台免费试用拥有阿里达摩院图像、视频、3D视觉等领域科学家和工程师沉淀的视觉 AI 能力,为用户提供具备实战价值的一站式视觉 AI 服务。人脸人体视觉智能开放...
来自: 云产品
智能媒资服务
智能媒资服务是阿里云提供的媒体内容资产管理和处理服务,提供标签、审核、检索、视频封面、智能处理等核心功能,提高海量内容的利用分发管理效率。
识别视频图像中文字,提取图像文本内容.分析视频中的语音信息,提取语音文本内容.运动行为识别.分析视频动态信息,识别运动、动作、行为事件等内容.从视觉、文字、语音、运行行为等多个维度对视频信息进行分析,识别视频中的人物、物体场景、地标、文字、语音等内容.多维度信息识别.识别多模态间不同元素的联系和对齐关系...
来自: 云产品
智能标签
智能标签,是通过对视频中视觉、文字、语音、行为等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐,助力视频智能生产。
识别视频图像中文字,提取图像文本内容.分析视频中的语音信息,提取语音文本内容.分析视频动态信息,识别运动、动作、行为事件等内容.运动行为识别.采用多模态融合对齐、跨模态映射等技术,对媒体内容进行多模态融合识别,高效、精准理解视频内容.多模态内容理解.识别多模态间不同元素的联系和对齐关系,实现视频文字、...
来自: 云产品
媒体处理MPS
阿里云媒体处理(ApsaraVideo for Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。
OCR技术识别视频图像中文字,精准识别视频画面中的字幕、标题、弹幕等关键内容.识别视频中是否有人脸,并支持五官关键点定位、人脸属性分析和快速的人脸聚类。适用于美颜、智能相册分类等场景.基于深度学习、计算机视觉技术和海量数据,对视频进行内容、文字、语音、场景等多模态分析,输出视频相关信息,提升搜索推荐...
来自: 云产品
视频审核
阿里云视频审核服务基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容,包括色情、暴恐、政治敏感、广告识别等多个功能模块,同时支持视频图像文件内容质量审核功能,应用于短视频平台、直播平台、传媒审核等场景。
视频审核服务基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别媒体文件包含的违禁内容,包括色情、暴恐、广告、不良场景识别等多个功能模块,同时支持视频图像文件内容质量审核功能,应用于短视频平台、直播平台、传媒审核等场景.使用媒体处理审核.使用直播审核.短视频解决方案.针对平台资讯内容...
来自: 云产品
跨境电商语言工具
跨境电商语言工具集成阿里云达摩院先进的NLP技术及海量电商领域双语语料,为跨境贸易平台及商家沉淀一套完整的全链路商品信息语言翻译及标题优化工具
帮助平台或商家诊断当前商品图片文字所属语种,便于在目标市场国家获得更好的商品转化效果。支持诊断是否为/英/俄语图片.图片语种诊断.结合标题诊断结果、平台搜索、点击、购买、浏览等数据,自动智能优化标题,帮助提升商品曝光及转化率,支持英文、俄语、西班牙语.标题智能优化.根据产品关键词、商品属性及详描的...
来自: 云产品
文本生成3D模型
文本生成3D模型方案是以在GPU云服务器上部署一个HRN人脸重建模型为例,演示如何借助云上的GPU算力助力您在工作中应用AIGC。
方案介绍文本生成3D模型本方案基于GPU服务和HRN人脸重建模型,HRN是一种基于深度学习的人脸识别模型,它可以对人脸图像进行高精度的识别和分析;而GPU服务具有强大的并行计算能力和浮点运算性能,在文本生成3D模型的应用场景,能够显著提升生成效率和精度。解决问题:设计效率低传统的3D建模需要手动进行贴图、纹理等复杂...
来自: 解决方案
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
覆盖文本、文档、图片、音频和视频模态,与文档解析、语音识别图像识别相结合,满足多样化应用需求.更多产品与服务.查看机器翻译的产品简介.查看机器翻译的开发指南.查看机器翻译的产品定价.查看机器翻译的常见问题.自然语言处理(NLP)实验室产品家族齐亮相,最高可享100w免费试用额度,更多内容等你来体验!自然语言...
来自: 云产品
移动研发平台EMAS
阿里云移动研发平台EMAS是国内领先的云原生应用研发平台(移动App、H5应用、小程序、Web应用等),基于广泛的云原生技术,为企业、开发者提供一站式的应用研发管理服务,涵盖应用开发、测试、运维、运营等应用全生命周期。
图像识别场景.移动DevOps.推荐搭配使用.真机兼容、功能、性能、脚本一站式服务.线上App发现严重bug需要进行紧急修复,需要付出巨大的成本进行换包和重新发布。采用移动热修复服务,可以随时发布补丁实时解决线上问题,用户全程无感知.补丁包采用差量技术,对应用无侵入,减少性能损耗.Patch本地加密,文件存储安全无忧.推荐...
来自: 云产品
智能开放搜索 OpenSearch
阿里云智能开放搜索 OpenSearch是阿里自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台,内置全链路搜索功能,提供一站式、场景化的行业大数据解决方案。
基于语言、语音、文字图像等多模态搜索技术.在物流、订单、优惠劵、保单检索等场景,面对海量数据,如何保证数据时效性、检索稳定性、业务高峰灵活性非常重要,使用传统数据库产品及开源检索服务很难满足业务需要。通过OpenSearch高性能检索版,可一键平滑扩缩容,稳定支持业务大促,同时提供高并发低延迟、高可用的检索...
来自: 云产品
通用文字识别
阿里云通用类图片文字识别适用于多场景图片文字识别并返回坐标信息。包括但不限于电商图片文字识别,网络UGC图片文字识,社区贴吧图片文字识别,文档小说图片文字识别,通用文字图片识别。
集表格识别、旋转识别、生僻识别等多功能为一体,支持多格式版面、复杂文档背景和光照环境的精准识别,提供高性价比的多场景文字识别体验。同时针对有印章、手印的文档,可实现印章擦除后识别.通用文字识别.适用于各行业场景下的非结构化文字识别,支持返回位置坐标信息.可自动区为印刷体或手写体,并采用对应的模型就行...
来自: 云产品
小语种文字识别
阿里云小语种文字识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息,适用于国际化所需的各类图文识别与信息翻译场景
读光OCR英文专项识别是针对全英文图片文档场景下英文印刷体字符高效检测和识别的原子能力产品,具备英文专项识别和英文分词功能,支持旋转、表格、文字坐标等多项基础功能.读光OCR日语识别是针对全日文图片文档场景下日文印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能.读光OCR俄语识别是...
来自: 云产品
发票凭证识别
阿里云发票凭证识别支持各类票据识别,包括但不限于增值税发票识别,机动车发票识别等。发票凭证识别基于上万亿图片样本训练模型,单张图片毫秒级别返回。广泛应用于财务报销场景,方便信息存储和审核,识别准确率可达98%以上,可有效提升工作效率,减少人工成本。
文字识别主页面.个人证照识别.通用文字识别.车辆物流识别.企业资质识别.贸易单证识别.票据凭证识别.功能介绍与体验.票据凭证识别.混贴发票识别.增值税发票识别.机动车销售发票识别.定额发票识别.航空行程单识别.出租车发票识别.增值税发票卷票识别.网约车行程单识别.过路过桥费发票识别.二手车统一销售发票识别.通用机打...
来自: 云产品
教育场景识别
阿里云教育场景识别能解决试题题目、数学公式等信息的智能化识别需求,是为智慧教学场景下的拍照搜题、板书识别、自动阅卷等应用提供关键技术能力的数据智能产品
部署至本地服务器,在私有化环境实现文字识别功能,保障数据私密性.集成到移动APP、Android、iOS)或设备端,无需网络即可实现文字识别功能.产品规格-预付费资源包.更多产品与服务.教学过程,需要录入大量试卷做为备份,OCR只需教师上传图片,即可自动识别试卷内容,大大减轻教学负担.有效提升抄录效率,节省人力成本....
来自: 云产品
< 1 2 >
共有2页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用