云上 AI
依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代
图生:推荐Qwen VL,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题进行解题等。图生文生:推荐通义万相,可用于生成证件照、模特、各种风格(动漫、国风、二次元等)人像,也可用于抠图、生成背景、更改图片元素等。语音和视频类 语音合成(文本转语音):...
来自: 解决方案
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
文字识别 OCR 用于识别图片、文档、卡证等文件所包含的文字信息。本产品具备完善的图像检测、文字识别和文字理解的能力,服务的日均访问量高达上亿次,具有优秀的识别效果与处理性能.更多产品与服务.随着交通行业的发展,车辆服务的需求不断扩大,对应人工成本不断增加,手工输入车辆相关信息,耗时耗力还容易出错.实现违章...
来自: 云产品
小语种文字识别
阿里云小语种文字识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息,适用于国际化所需的各类图文识别与信息翻译场景
读光OCR英文专项识别是针对全英文图片文档场景下英文印刷体字符高效检测和识别的原子能力产品,具备英文专项识别和英文分词功能,支持旋转、表格、文字坐标等多项基础功能.读光OCR日语识别是针对全日文图片文档场景下日文印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能.读光OCR俄语识别是...
来自: 云产品
仪器仪表识别
阿里云OCR文字识别-燃气表识别,自动识别燃气表、水表读数信息,返回读表器整数和小数部分读数
图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称.不填写不展示.文字识别主页面.特殊场景识别.行业文档识别.海关物流场景识别.更多产品与服务.利用海量的图片样本训练模型,具有业内领先的准确率。以身份证识别为例,准确率超过99%.依托于阿里自建的 EAS 在线服务集群,精益求精优化 Inference...
来自: 云产品
发票凭证识别
阿里云发票凭证识别支持各类票据识别,包括但不限于增值税发票识别,机动车发票识别等。发票凭证识别基于上万亿图片样本训练模型,单张图片毫秒级别返回。广泛应用于财务报销场景,方便信息存储和审核,识别准确率可达98%以上,可有效提升工作效率,减少人工成本。
文字识别主页面.个人证照识别....部署至本地服务器,私有化环境中实现文字识别功能,保障数据私密性.集成到移动APP、Android、iOS)或设备端中,无需网络即可实现文字识别功能.混贴票据文字识别.发票文字识别.差旅出行票据文字识别.消费场景票据文字识别.银行承兑汇票文字识别.税收完税证明文字识别.查看更多商品.
来自: 云产品
个人证照识别
个人证照识别是阿里云提供的通用型卡证OCR,可以解决通用卡证类的文字识别及识别信息结构化的问题。本类产品下包含身份证正反面识别、护照识别、银行卡识别、名片识别、户口页识别。
为缓解道路拥堵,移动支付、ETC业务如雨后春笋般涌出,印刷文字识别OCR毫秒级快速识别图片中的文字ETC业务办理过程中提供了相应的能力.2、\\tETC收费通道的通行能力是人工收费通道的5至10倍。使用全自动电子收费系统,可以使公路收费走向无纸化、无现金化管理,从根本上杜绝收费票款的流失现象,解决公路收费中的财务...
来自: 云产品
教育场景识别
阿里云教育场景识别能解决试题题目、数学公式等信息的智能化识别需求,是为智慧教学场景下的拍照搜题、板书识别、自动阅卷等应用提供关键技术能力的数据智能产品
部署至本地服务器,私有化环境中实现文字识别功能,保障数据私密性.集成到移动APP、Android、iOS)或设备端中,无需网络即可实现文字识别功能.产品规格-预付费资源包.更多产品与服务.教学过程中,需要录入大量试卷做为备份,OCR只需教师上传图片,即可自动识别试卷内容,大大减轻教学负担.有效提升抄录效率,节省人力成本....
来自: 云产品
行业文档识别
阿里云提供行业文档类识别,可以高精度识别各行业文档和表单表格,通用于各行业的通用文字识别。包含单字坐标,表格识别,图像旋转等功能,广泛应用于司法、金融、医疗等各行业,方便工作人员审核录入核对,节约人力时间成本。
分别有网络 UGC 图片文字识别、电商图片文字识别、社区贴吧图片文字识别、通用文字识别.通用类文字识别.图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称.不填写不展示.基于上万亿的图片样本训练模型.识别准确率高.单张图片毫秒级别返回.使用业界领先的深度学习技术,支持分布式多机多 GPU 卡...
来自: 云产品
特殊场景OCR识别
阿里云特殊场景OCR识别,支持多卡证、多票据混贴等场景的文字识别服务。包括票据混贴智能分类识别、通用混贴票证识别、多卡证智能分类识别。
部署至本地服务器,私有化环境中实现文字识别功能,保障数据私密性.集成到移动APP、Android、iOS或设备端中,无需网络即可实现文字识别功能.图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称.不填写不展示.票据混贴智能分区识别.自动化对多混贴场景进行子图分割、子图分类和子图结构化识别...
来自: 云产品
企业资质识别
阿里云企业资质识别支持各类资产证件的识别。企业资产如营业执照识别,可结构化识别出注册号,公司名称,公司地址,法人代表,营业期限等多个字段; 房产证识别可识别多种商品性质房源,快速准确识别房屋性质,坐落,权利人等10个字段。结构化输出业务所需的字段,方便工作人员审核录入,核对,有效节约人力时间成本。
部署至本地服务器,私有化环境中实现文字识别功能,保障数据私密性.集成到移动APP、Android、iOS或设备端中,无需网络即可实现文字识别功能.<查看全部文字识别产品.开通享免费额度.读光企业资质识别向企事业单位、机构、公司业务开展过程中经常使用到的营业执照、商标注册证、食品经营许可证、食品生产许可证、银行开户...
来自: 云产品
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
视觉智能文字识别 OCR可以将图片中的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了10大类,满足各种客户的图片识别需求。视觉智能开放平台免费试用拥有阿里达摩院图像、视频、3D视觉等领域科学家和工程师沉淀的视觉 AI 能力,为用户提供具备实战价值的一站式视觉 AI 服务。人脸人体视觉智能开放...
来自: 云产品
企业上云workshop
企业上云workshop
本文模拟了如下场景: 1. 线下 IDC 环境中部署了一个业务系统,业务是利用 wordpress 系统提供网站服务。 2. 本文详细介绍了如何将以上线下系统搬迁到云上, 包括如何在云上构建以上业务系统,如何迁移线下 系统到云上,如何割接。 3. 最后介绍了迁移上云后,如何部署安全系统。 解决问题 IDC 业务系统搬迁上云 云上构建业务系统 部署安全系统
内容主要 包含文字图片及小文件附件等,是典型的读多写少场景。根据场景的业务特点,编 制如下迁移方案:应用迁移:使用服务器迁移中心 SMC将应用服务器迁移至云上 ECS镜像。文档版本:20210617 3 企业上云 workshop-IDC业务迁移上云 最佳实践概述 存储迁移:使用 ossimport工具将 NAS中的数据迁移至云上 OSS。数据库迁移...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,负载均衡 SLB,弹性公网IP,文件存储NAS,云数据库PolarDB,Web应用防火墙,云防火墙,SSL证书,云速搭
OCR文档自学习
OCR文档自学习现支持模板和模型两大类任务的自主训练。用户可以通过配置模板或少量标注数据,训练出更满足业务场景需求的AI智能模型。
配置一张样本图片,无需额外数据标注和模型训练,完成固定版式且有框线的单页表格自定义单元格抽取.单据票证信息抽取.数据驱动,通过小样本数据标注、训练,实现对版式相对固定的单据、证件、凭证的关键字段进行信息抽取.表格信息抽取.数据驱动,通过小样本数据标注、训练,实现对版式相对固定的表格、表单的关键字段进行...
来自: 云产品
智能媒资服务
智能媒资服务是阿里云提供的媒体内容资产管理和处理服务,提供标签、审核、检索、视频封面、智能处理等核心功能,提高海量内容的利用分发管理效率。
从视觉、文字、语音、运行行为等多个维度对视频信息进行分析,识别视频中的人物、物体场景、地标、文字、语音等内容.多维度信息识别.识别多模态间不同元素的联系和对齐关系,实现视频文字、语音、视觉等不同模态信息的对齐理解.整合不同模态间的模型和特征,提高理解能力和效率,实现语音文字文本纠错能力,提升识别准确率....
来自: 云产品
视频审核
阿里云视频审核服务基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容,包括色情、暴恐、政治敏感、广告识别等多个功能模块,同时支持视频图像文件内容质量审核功能,应用于短视频平台、直播平台、传媒审核等场景。
视频审核服务基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容,包括色情、暴恐、广告、不良场景识别等多个功能模块,同时支持视频图像文件内容质量审核功能,应用于短视频平台、直播平台、传媒审核等场景.使用媒体处理审核.使用直播审核.短视频解决方案.针对平台资讯内容...
来自: 云产品
智能短信解析
阿里云智能短信解析在控制台提供便捷的接入方式、统一的视觉设计和营销素材配置,在手机端实现智能化、富媒体的短信展现形式,增强用户体验,提升短信转化率
算法智能识别图片模版.统一视觉规范,图片智能合成.配置过程每一步操作,页面上都会实时展现手机端的效果.实时展示手机端效果.智能短信的效果数据,包括解析、曝光、点击兴趣点等.丰富的数据展现.产品手机端演示.活动大促,通过智能短信,视觉体验一目了然,大幅提升短信转化率,从而提升ROI.企业品牌宣传,富媒体展现,...
来自: 云产品
媒体处理MPS
阿里云媒体处理(ApsaraVideo for Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。
视频中添加可见的图片文字水印(例如,企业Logo、电视台台标),突出品牌和版权,增加产品识别度.支持主流编码及封装格式、窄带高清、倍速转码、多码率打包功能。提供高效、专业、可定制的媒体转码服务.支持将普通音频转码为杜比格式,配合阿里云播放器SDK可以杜比设备上开启杜比专属音效。支持杜比格式兼容为普通...
来自: 云产品
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
不仅仅是翻译,提供标题的质量诊断、标题智能优化、标题智能生成、图片文字语种诊断等能力.机器翻译团队阿里巴巴集团内部深耕电商场景10年,阿里巴巴集团跨境电商平台沉淀了丰富的经验和产品,为客户提供多样化的产品与服务.通用版翻译引擎.智能语音交互.推荐搭配使用.跨境电商平台商品发布.专业的译员人工翻译场景下...
来自: 云产品
云投屏
云投屏是阿里云基于内容智能开发的针对线下门店智能广告屏场景的信息发布系统。提供内容编辑、审核、增强、排版、投放、设备集成等能力。可实现内容质量算法检测、内容安全黄暴恐过滤、内容智能发布推荐、内容格式云端转码等功能。
支持文字图片、视频、链接等形式.支持屏幕端多台设备,播放联屏内容时,实现毫秒级别同步.内容排版,实现客户通过云平台快速搭建需要展示的页面,包含图文、跑马灯、视频、轮播、电梯、动态二维码等多种模块.支持图片、视频AI加工,包含视图降级、修复、插值等基础能力以及抠图、换背景能力。支持文字生成海报能力.查看...
来自: 云产品
视频云营业厅解决方案
远程实现银行柜员服务、证券开户、保险勘察等各类服务场景,建立视频云营业厅,打通金融机构用户线上经营服务能力,满足终端用户线上业务办理的需求。
支持画中画、九宫格等多画面组合模式,支持叠加图片文字水印以及时间戳.丰富的增值功能.mPaaS 移动开发平台.MRTC 音视频通话.mPaaS 小程序.MGS 移动网关.mPaaS 小程序新品发布会.移动智能营销解决方案直播讲解.智能业务在线解决方案直播讲解.蚂蚁mPaaS:有人修建高楼,有人重构城市.mPaaS 斩获2019中国金融科技创新大赛...
来自: 解决方案
< 1 2 3 >
共有3页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用