云上 AI
依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代
图生:推荐Qwen VL,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题进行解题等。图生文生:推荐通义万相,可用于生成证件照、模特、各种风格(动漫、国风、二次元等)人像,也可用于抠图、生成背景、更改图片元素等。语音和视频类 语音合成(文本转语音):...
来自: 解决方案
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
对电商商品图片识别,比如食品配料、衣服吊牌等,有助于指导电商运营活动,提高转化.实现商家商业资质图片的识别,帮助运营进行需求对比和解析,可以极大地释放人力、节省企业运营成本.通用文字识别.推荐搭配产品.医保卡、用户身份证信息的核实和录入,人工输入耗时耗力。通过卡证OCR识别服务,可大幅度提升录入效率,提升...
来自: 云产品
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
视觉智能文字识别 OCR可以将图片中的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了10大类,满足各种客户的图片识别需求。视觉智能开放平台免费试用拥有阿里达摩院图像、视频、3D视觉等领域科学家和工程师沉淀的视觉 AI 能力,用户提供具备实战价值的一站式视觉 AI 服务。人脸人体视觉智能开放...
来自: 云产品
文档智能
阿里云文档智能基于多年技术积累打造的多模态文档识别与理解引擎,为用户提供各类文档文字提取和文档处理,支持通用场景、行业场景和自定义场景下的多样化文档处理需求。
文档格式转换:PDF、图片等不可编辑的文档转换Word、Excel等可编辑的文档格式,在实现高精度内容识别的同时,最大限度地保留文档版式样式.文档纠错:可对文档中的文字、词语、语法和标点等差错进行纠正,检查文档中各类中英文问题并返回修改建议,实现高效、准确、规范的文档写作.文档格式转换.通用文档智能.面向行业...
来自: 云产品
移动APP业务合规解决方案
移动APP业务合规解决方案以云计算基础设计及达摩院 AI 能力为底座为企业提供合规镜子功能,通过深度学习技术、自动化扫描结合专家服务,帮助企业低成本、高效、精准的识别业务合规风险,持续满足业务合规需求。
方案可通过多维度审核能力,对违规内容、不良内容和未成年人不宜内容智能分级识别平台中产生的音视频图文生成内容标签,帮助客户构建用户内容分级处置机制,有效阻断违规内容,屏蔽不良内容,保障未成年用户的身心健康.未成年保护内容分级.未成年保护内容分级.方案可及时对齐政策法规,提供自动化检测能力及专家服务,...
来自: 解决方案
媒体处理MPS
阿里云媒体处理(ApsaraVideo for Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。
语音识别(ASR)、文字识别(OCR).ASR技术分析视频中的语音信息,音频转成文字。OCR技术识别视频图像中的文字,精准识别视频画面中的字幕、标题、弹幕等关键内容.识别视频中是否有人脸,并支持五官关键点定位、人脸属性分析和快速的人脸聚类。适用于美颜、智能相册分类等场景.基于深度学习、计算机视觉技术和海量数据,对...
来自: 云产品
政企标准地址服务解决方案
政企标准地址服务解决方案基于阿里巴巴自然语言技术,结合在多行业领域的数据积累,充分挖掘基于标准地址的业务场景,为政府及企业客户提供互联网+的标准地址解决方案,实现多行业场景覆盖,提高管理效率。
文字识别(OCR)可以将图片中的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了通用文字识别、个人证照识别、发票凭证识别、教育试题识别、车辆物流识别、办公文档识别、企业资质识别、自定义模板、小语种文字识别、特殊场景OCR识别10大类,满足各种客户的图片识别需求.OCR文字识别.地址标准化是...
来自: 解决方案
跨境电商语言工具
跨境电商语言工具集成阿里云达摩院先进的NLP技术及海量电商领域双语语料,为跨境贸易平台及商家沉淀一套完整的全链路商品信息语言翻译及标题优化工具
集成图像识别、信息处理、机器翻译、图片合成等技术,自动的一种语言的图片翻译成另一种语言的图片。支持中/英文图片翻译成其他语种.商品图片智能翻译.帮助平台或商家诊断当前商品图片中的文字所属语种,便于在目标市场国家获得更好的商品转化效果。支持诊断是否中/英/俄语图片.图片语种诊断.结合标题诊断结果、平台...
来自: 云产品
智能媒资服务
智能媒资服务是阿里云提供的媒体内容资产管理和处理服务,提供标签、审核、检索、视频封面、智能处理等核心功能,提高海量内容的利用分发管理效率。
从视觉、文字、语音、运行行为等多个维度对视频信息进行分析,识别视频中的人物、物体场景、地标、文字、语音等内容.多维度信息识别.识别多模态间不同元素的联系和对齐关系,实现视频文字、语音、视觉等不同模态信息的对齐理解.整合不同模态间的模型和特征,提高理解能力和效率,实现语音文字文本纠错能力,提升识别准确率....
来自: 云产品
科研云解决方案
阿里云科研云解决方案,其数字化运营、高效协作、开放生态构建高校科研新模式,加速高校科研升级, 解决科研问题,释放科研动力,真正实现了科研无边界。
印刷文字识别(OCR)通俗来说是将图片、照片上的文字内容识别出来,直接转换为可编辑文本的功能.印刷文字识别OCR.阿里智能语音交互(Intelligent Speech Interaction),赋予产品“能听、会说、懂你”式的智能人机交互体验.智能语音交互.浙江大学基于阿里科研云构建了在浙大的科研平台,基于科研混合云的快速扩容的能力,...
来自: 解决方案
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
图片翻译集成图像识别、机器翻译、图片合成等技术,可将图片中的文本内容进行识别、翻译,最终合成指定语种图片/输出结构化信息。并提供在线编辑平台,可以对译后内容进行在线编辑、打包下载等操作,满足更多用户对于图片翻译的需求.提供文档端到端翻译服务,输入文档,经过文档解析、机器翻译、自动排版布局,将生成指定...
来自: 云产品
云投屏
云投屏是阿里云基于内容智能开发的针对线下门店智能广告屏场景的信息发布系统。提供内容编辑、审核、增强、排版、投放、设备集成等能力。可实现内容质量算法检测、内容安全黄暴恐过滤、内容智能发布推荐、内容格式云端转码等功能。
支持文字图片、视频、链接等形式.支持屏幕端多台设备,播放联屏内容时,实现毫秒级别同步.内容排版,实现客户通过云平台快速搭建需要展示的页面,包含图文、跑马灯、视频、轮播、电梯、动态二维码等多种模块.支持图片、视频AI加工,包含视图降级、修复、插值等基础能力以及抠图、换背景能力。支持文字生成海报能力.查看...
来自: 云产品
图像搜索
图像搜索是阿里云自研的一款用于图片间相似性检索的平台型产品。通过输入图片,可高精度、高效率的在图库网站中检索到与输入图片相似的图片集合,并支持定制化服务。以图搜图可广泛的应用于拍照购物、 商品推荐、版权保护、图片相似推荐等场景。
将图片搜索技术用于传统纺织产品的物联网平台,针对经纺织布料行业产品进行纹理识别,以搜图的方式反馈供应信息,通过“信息整合+图像识别+大数据”的方式,带给传统行业以新的生命力.深度学习算法训练,满足搜索精度要求.大规模检索引擎可支持百亿级别数据.支持实时更新维护数据.API调用便捷,满足服务快速搭建的需求....
来自: 云产品
企业上云workshop
企业上云workshop
本文模拟了如下场景: 1. 线下 IDC 环境中部署了一个业务系统,业务是利用 wordpress 系统提供网站服务。 2. 本文详细介绍了如何将以上线下系统搬迁到云上, 包括如何在云上构建以上业务系统,如何迁移线下 系统到云上,如何割接。 3. 最后介绍了迁移上云后,如何部署安全系统。 解决问题 IDC 业务系统搬迁上云 云上构建业务系统 部署安全系统
内容主要 包含文字图片及小文件附件等,是典型的读多写少场景。根据场景的业务特点,编 制如下迁移方案:应用迁移:使用服务器迁移中心 SMC应用服务器迁移至云上 ECS镜像。文档版本:20210617 3 企业上云 workshop-IDC业务迁移上云 最佳实践概述 存储迁移:使用 ossimport工具 NAS中的数据迁移至云上 OSS。数据库迁移...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,负载均衡 SLB,弹性公网IP,文件存储NAS,云数据库PolarDB,Web应用防火墙,云防火墙,SSL证书,云速搭
地址标准化
地址标准化(Address Purification)是依托阿里云海量的地址语料库,及超强的NLP算法实力所沉淀出的高性能、高准确率、功能覆盖最全的标准地址算法服务。可为企业、政府机关及开发者提供地址数据清洗。地址标准化通过地址解析、补全、匹配等赋能业务的上层应用。
在对话场景下,通过输入多轮对话文字,通过对话文字识别、上下文推理和信息补全,返回相关性top3的推荐地址,辅助快速定位.对话上下文地址推理.语音对话场景.提供多语种地址结构化解析相关服务,适用于物流、跨境电商等场景.支持菲律宾、印度尼西亚、越南、泰国、马来西亚.支持多个国家.国际地址服务.用户打造的一站式的...
来自: 云产品
音视频终端 SDK
音视频终端 SDK集成了阿里云视频直播和视频点播业务中拍摄、编辑、上传、推流和播放的核心能力,同时融合视频特效、音频特效等音视频AI能力,为用户提供一体化SDK,支持多终端接入,搭配产品级Demo,支持用户根据业务需求快速集成所需
使用播放器 SDK 提供多码率自适应、变速不变调、端侧画质增强等功能,结合云端服务长视频观影提供进度条缩略、防遮弹幕、ASS 字幕等多样玩法,同时配合多重安全策略确保视频安全.播放器 SDK 全端覆盖充分满足业务需求,现已支持移动端(Android、iOS)、桌面端(Windows、macOS、Linux)和跨端方案(Web、Flutter),...
来自: 云产品
视频云营业厅解决方案
远程实现银行柜员服务、证券开户、保险勘察等各类服务场景,建立视频云营业厅,打通金融机构用户线上经营服务能力,满足终端用户线上业务办理的需求。
支持画中画、九宫格等多画面组合模式,支持叠加图片文字水印以及时间戳.丰富的增值功能.mPaaS 移动开发平台.MRTC 音视频通话.mPaaS 小程序.MGS 移动网关.mPaaS 小程序新品发布会.移动智能营销解决方案直播讲解.智能业务在线解决方案直播讲解.蚂蚁mPaaS:有人修建高楼,有人重构城市.mPaaS 斩获2019中国金融科技创新大赛...
来自: 解决方案
视频DNA
阿里云视频DNA采用先进的视频指纹技术标记视频唯一身份,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化,应用于视频查重、版权保护等场景,捍卫数字媒体版权尊严。
支持视频、图片等多种媒体文件指纹提取及识别.与区块链产品结合,支持存证上链,提供完备的版权保护和侵权追溯的解决方案.视频DNA基于视频指纹技术,可以唯一标记一个视频,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化。可用于视频相似查重、视频版权保护等场景.视频DNA集成于媒体处理、...
来自: 云产品
智能媒体服务 IMS
智能媒体服务IMS(Intelligent Media Services),是围绕直播和点播场景下的媒体采集、媒资管理、内容生产、制作和分发能力的一站式服务集,提供广播级、全智能、灵活多样、可多云接入的专业能力,并面向多云复杂业务流场景提供成熟的低代码终端SDK集成方案。
基于文字图片、视频等多维标签和物料检索素材,精准定位.支持百兆bps码率内容的云端转码和剪辑合成.高码率源生产处理.对象存储OSS.视频点播VOD.短视频服务集音视频强大拍摄、特效编辑、本地转码、高速上传、自动化转码处理、媒体资源管理、分发加速、播放于一体的完整短视频解决方案。借助视频摆脱“工具化”印象,提升...
来自: 云产品
企业上云安全建设解决方案
企业上云安全建设解决方案通过简单三步,企业可快速评估自身安全问题,建设云上基础安全能力。第一步:评估安全风险,第二步:建设基础防护,第三步:防控业务风险,共建云上安全体系。
识别文字图片、音频、视频的违规内容.保护线上业务防刷.爬虫风险管理.实名身份验证.云盾身份认证.可以提供的服务.新BGP高防.Web应用防火墙.云盾身份认证.防控业务风险.第一步:评估安全风险.第二步:建设基础防护.评估安全风险.安全风险评估是企业信息系统建设的安全根基,进行安全评估可以达到“以最小成本获得最大安全...
来自: 解决方案
< 1 2 3 >
共有3页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用