云上 AI
依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代
图生:推荐Qwen VL,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题进行解题等。图生文生:推荐通义万相,可用于生成证件照、模特、各种风格(动漫、国风、二次元等)人像,也可用于抠图、生成背景、更改图片元素等。语音和视频类 语音合成(文本转语音):...
来自: 解决方案
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
云数据库 RDS SQL Server 版发行最早的商用数据库产品之一,支持复杂的 SQL 查询,性能优秀,对基于 Windows 平台.NET 架构的应用程序具有完美的支持。云数据库 RDS MariaDB 版基于 MariaDB 企业版全球独家合作认证,提供 Oracle 兼容性及众多企业级数据库特性,支持包括 MySQL InnoDB 等多种存储引擎。NoSQL数据库云数据库...
来自: 云产品
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
语种识别服务提供全球222种语言的语种识别,帮助您快速判断文本所属语言。结合机器翻译服务,可通过自动的语种识别,快速定位需要翻译的内容,有效提升整体效率.基于客户具体的诉求,量身打造一套专属的个性化定制机器翻译模型。对于具备高质量双语语料的客户,可利用自有数据进行模型训练,提供数据上传、模型训练、模型...
来自: 云产品
跨境电商语言工具
跨境电商语言工具集成阿里云达摩院先进的NLP技术及海量电商领域双语语料,为跨境贸易平台及商家沉淀一套完整的全链路商品信息语言翻译及标题优化工具
集成图像识别、信息处理、机器翻译、图片合成等技术,自动的将一种语言的图片翻译另一种语言的图片。支持中/英文图片翻译其他语种.商品图片智能翻译.帮助平台或商家诊断当前商品图片中的文字所属语种,便于在目标市场国家获得更好的商品转化效果。支持诊断是否为中/英/俄语图片.图片语种诊断.结合标题诊断结果、平台...
来自: 云产品
智能媒资服务
智能媒资服务是阿里云提供的媒体内容资产管理和处理服务,提供标签、审核、检索、视频封面、智能处理等核心功能,提高海量内容的利用分发管理效率。
智能检测媒体文件中的文字、水印、二维码,有效识别粘贴广告、二维码、小程序码等多种形式的图文广告.Logo识别.采用目标检测技术,精准识别视频图片中的各种logo图标,如台标、商标、水印等,常用于版权保护等场景.不良场景识别.结合行为分析和时间序列对比技术,精准识别画中画、吸烟、车内直播、无意义画面等需要监管的...
来自: 云产品
视频审核
阿里云视频审核服务基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容,包括色情、暴恐、政治敏感、广告识别等多个功能模块,同时支持视频图像文件内容质量审核功能,应用于短视频平台、直播平台、传媒审核等场景。
智能检测媒体文件中的文字、水印、二维码,有效识别粘贴广告、二维码、小程序码等多种形式的图文广告.Logo识别.采用目标检测技术,精准识别视频图片中的各种logo图标,如台标、商标、水印等,常用于版权保护等场景.不良场景识别.结合行为分析和时间序列对比技术,精准识别画中画、吸烟、车内直播、无意义画面等需要监管的...
来自: 云产品
智能媒体服务 IMS
智能媒体服务IMS(Intelligent Media Services),是围绕直播和点播场景下的媒体采集、媒资管理、内容生产、制作和分发能力的一站式服务集,提供广播级、全智能、灵活多样、可多云接入的专业能力,并面向多云复杂业务流场景提供成熟的低代码终端SDK集成方案。
基于文字图片、视频等多维标签和物料检索素材,精准定位.支持百兆bps码率内容的云端转码和剪辑合成.高码率源生产处理.对象存储OSS.视频点播VOD.短视频服务集音视频强大拍摄、特效编辑、本地转码、高速上传、自动化转码处理、媒体资源管理、分发加速、播放于一体的完整短视频解决方案。借助视频摆脱“工具化”印象,提升...
来自: 云产品
计算机软件著作权登记
全新支持APP/小程序全程在线电子化登记,无纸化线上极速办理,助力APP便捷上架,最快3个工作日拿证。在线填写,系统纠错,全流程可视化,申请进度实时掌控,阿里云开启知识产权一站式专业服务。
阿里云计算机软件著作权登记,全新支持APP/小程序全程在线电子化登记,无纸化线上极速办理,助力APP便捷上架,最快3个工作日拿证。在线填写,系统纠错,全流程可视化,申请进度实时掌控,阿里云开启知识产权一站式专业服务。
来自: 云产品 | 相关产品:版权与专利,软件著作权申请,源代码版权申请,计算机软件著作权,软件著作权代码,APP/小程序软件著作权在线登记,APP著作权,软件著作权
通用文字识别
阿里云通用类图片文字识别适用于多场景图片文字识别并返回坐标信息。包括但不限于电商图片文字识别,网络UGC图片文字识,社区贴吧图片文字识别,文档小说图片文字识别,通用文字图片识别。
专门针对电商商品宣传图片、社区贴吧图片、网络UGC图片等网络场景下图片字符快速精准识别的原子能力产品,在违规广告识别、信息审核管理和网络安全治理等场景下具有极大应用价值.支持对有线表格、条纹表格、无线表格进行有效识别,并支持导出Excel功能,用户可进行二次编辑.文档结构化识别.可对文档信息进行结构化识别,并...
来自: 云产品
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
文字识别 OCR 用于识别图片、文档、卡证等文件所包含的文字信息。本产品具备完善的图像检测、文字识别和文字理解的能力,服务的日均访问量高达上亿次,具有优秀的识别效果与处理性能.更多产品与服务.随着交通行业的发展,车辆服务的需求不断扩大,对应人工成本不断增加,手工输入车辆相关信息,耗时耗力还容易出错.实现违章...
来自: 云产品
小语种文字识别
阿里云小语种文字识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息,适用于国际化所需的各类图文识别与信息翻译场景
读光OCR英文专项识别是针对全英文图片文档场景下英文印刷体字符高效检测和识别的原子能力产品,具备英文专项识别和英文分词功能,支持旋转、表格、文字坐标等多项基础功能.读光OCR日语识别是针对全日文图片文档场景下日文印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能.读光OCR俄语识别是...
来自: 云产品
行业文档识别
阿里云提供行业文档类识别,可以高精度识别各行业文档和表单表格,通用于各行业的通用文字识别。包含单字坐标,表格识别,图像旋转等功能,广泛应用于司法、金融、医疗等各行业,方便工作人员审核录入核对,节约人力时间成本。
通用类文字识别.图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称.不填写不展示.基于上万亿的图片样本训练模型.识别准确率高.单张图片毫秒级别返回.使用业界领先的深度学习技术,支持分布式多机多 GPU 卡训练模型.依托阿里云计算,提供高可用性的弹性服务.<全部 OCR 文字识别产品.高精度识别各...
来自: 云产品
发票凭证识别
阿里云发票凭证识别支持各类票据识别,包括但不限于增值税发票识别,机动车发票识别等。发票凭证识别基于上万亿图片样本训练模型,单张图片毫秒级别返回。广泛应用于财务报销场景,方便信息存储和审核,识别准确率可达98%以上,可有效提升工作效率,减少人工成本。
文字识别主页面.个人证照识别.通用文字识别.车辆物流识别.企业资质识别.贸易单证识别.票据凭证识别.功能介绍与体验.票据凭证识别.混贴发票识别.增值税发票识别.机动车销售发票识别.定额发票识别.航空行程单识别.出租车发票识别.增值税发票卷票识别.网约车行程单识别.过路过桥费发票识别.二手车统一销售发票识别.通用机打...
来自: 云产品
个人证照识别
个人证照识别是阿里云提供的通用型卡证OCR,可以解决通用卡证类的文字识别及识别信息结构化的问题。本类产品下包含身份证正反面识别、护照识别、银行卡识别、名片识别、户口页识别。
为缓解道路拥堵,移动支付、ETC业务如雨后春笋般涌出,印刷文字识别OCR毫秒级快速识别图片中的文字,在ETC业务办理过程中提供了相应的能力.2、\\tETC收费通道的通行能力是人工收费通道的5至10倍。使用全自动电子收费系统,可以使公路收费走向无纸化、无现金化管理,从根本上杜绝收费票款的流失现象,解决公路收费中的财务...
来自: 云产品
企业资质识别
阿里云企业资质识别支持各类资产证件的识别。企业资产如营业执照识别,可结构化识别出注册号,公司名称,公司地址,法人代表,营业期限等多个字段; 房产证识别可识别多种商品性质房源,快速准确识别房屋性质,坐落,权利人等10个字段。结构化输出业务所需的字段,方便工作人员审核录入,核对,有效节约人力时间成本。
身份证识别支持篡改检测(PS)、是否复印、是否翻拍等能力.增值税发票识别、混贴发票识别上线PDF、OFD能力.提供针对发票及企业执照等各类票证单据的真伪核验能力.可跨八大类场景下的API消耗抵扣,提升业务灵活度.近期重要功能.【点此免费开通】.【详细内容点此查看】.【通知】阿里云OCR上线按量付费的销售模式啦!先用后...
来自: 云产品
特殊场景OCR识别
阿里云特殊场景OCR识别,支持多卡证、多票据混贴等场景的文字识别服务。包括票据混贴智能分类识别、通用混贴票证识别、多卡证智能分类识别。
产品规格-预付费资源包.基于海量的图片样本训练模型,整体识别准确率可达99%.依托于阿里自建的EAS在线服务群,提供弹性伸缩的低延时服务.基于阿里机器学习平台PAI,训练出的文本检测及识别模型....图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称.不填写不展示.查看更多商品.
来自: 云产品
教育场景识别
阿里云教育场景识别能解决试题题目、数学公式等信息的智能化识别需求,是为智慧教学场景下的拍照搜题、板书识别、自动阅卷等应用提供关键技术能力的数据智能产品
【点此免费开通】.【详细内容点此查看】.【通知】阿里云OCR上线按量付费的销售模式啦!先用后付,开通即享免费额度,按量付费服务.产品规格-后付费按次调用....通过对题目的元素进行打标,提升题目的识别效果。目前主要覆盖的标签类型包含但不限于...支持用户创建模板,自定义需要提取的结构化信息,解决用户个性化图片识别需求.
来自: 云产品
实时语音识别
阿里云实时语音识别是对不限时长的音频流进行实时语音转文字处理,采用业界领先的端到端识别模型,通用字准确率90%以上,用于直播字幕、实时会议、法庭庭审记录等。
将会议中的音频实时转换成文字,用于字幕展示及实时纪要查阅;提升会议产出的效率.录音文件识别.推荐搭配使用.实时会议记录.实时会议记录.直播产生大量音视频数据,无法全量分析、识别,数据价值无法有效挖掘,内容合规难以保障.现场演讲场景、直播场景下,将视频中的音频实时转写成字幕,或进行娱乐直播内容场景识别;提升...
来自: 云产品
仪器仪表识别
阿里云OCR文字识别-燃气表识别,自动识别燃气表、水表读数信息,返回读表器整数和小数部分读数
图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称.不填写不展示.文字识别主页面.特殊场景识别.行业文档识别.海关物流场景识别.更多产品与服务.利用海量的图片样本训练模型,具有业内领先的准确率。以身份证识别为例,准确率超过99%.依托于阿里自建的 EAS 在线服务集群,精益求精优化 Inference...
来自: 云产品
语音识别
阿里云语音识别是一款高准确率、低时延的语音转文字产品,包含实时语音识别、一句话识别和录音文件识别等多款产品,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。
对不限时长的音频流做实时识别,达到“边说边出文字效果,内置智能断句,可提供每句话开始结束时间.对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等。录音文件识别极速版.支持30分钟以内的音频转写,返回时间不超过10秒.录音文件识别闲时版.单价低至0.45元/...
来自: 云产品
< 1 2 >
共有2页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用