AI
依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代
图生:推荐Qwen VL,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题进行解题等。图生文生:推荐通义万相,可用于生成证件照、模特、各种风格(动漫、国风、二次元等)人像,也可用于抠图、生成背景、更改图片元素等。语音和视频类 语音合成(文本转语音):...
来自: 解决方案
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
OCR统一识别....支持弱网或无网环境下的文字识别服务.OCR离线SDK.针对国际贸易行业的各类单证提供智能识别和抽取能力.贸易单证识别.查看全部日志.【OCR统一识别】集成59种识别能力类型,实现多场景.一键开通OCR统一识别,即享200次/月免费额度.热门产品0.99元/1000次资源包.PD转Word、图片转PDF等产品,开通免费试用.
来自: 云产品
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
视觉智能文字识别 OCR可以将图片的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了10大类,满足各种客户的图片识别需求。视觉智能开放平台免费试用拥有阿里达摩院图像、视频、3D视觉等领域科学家和工程师沉淀的视觉 AI 能力,为用户提供具备实战价值的一站式视觉 AI 服务。人脸人体视觉智能开放...
来自: 云产品
科研云解决方案
阿里云科研云解决方案,其数字化运营、高效协作、开放生态构建高校科研新模式,加速高校科研升级, 解决科研问题,释放科研动力,真正实现了科研无边界。
印刷文字识别(OCR)通俗来说是将图片、照片上的文字内容识别出来,直接转换为可编辑文本的功能.印刷文字识别OCR.阿里智能语音交互(Intelligent Speech Interaction),赋予产品“能听、会说、懂你”式的智能人机交互体验.智能语音交互.浙江大学基于阿里科研云构建了在浙大的科研平台,基于科研混合云的快速扩容的能力,...
来自: 解决方案
文档智能
阿里云文档智能基于多年技术积累打造的多模态文档识别与理解引擎,为用户提供各类文档文字提取和文档处理,支持通用场景、行业场景和自定义场景下的多样化文档处理需求。
精准识别图片文字,直接转换为可编辑文本.针对国际贸易行业的各类单证提供智能识别和抽取能力.NLP实验室产品家族齐亮相,最高可享100w免费额度,快来体验!开通后立享免费试用额度,可前往控制台试用.全新OCR文档自学习平台,无需开发,一站式工具平台.超70+API调价,含多种规格资源包,部分商品降幅达26%.OCR自学习.OCR...
来自: 云产品
媒体处理MPS
阿里云媒体处理(ApsaraVideo for Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。
语音识别(ASR)、文字识别(OCR).ASR技术分析视频中的语音信息,音频转成文字。OCR技术识别视频图像中的文字,精准识别视频画面中的字幕、标题、弹幕等关键内容.识别视频中是否有人脸,并支持五官关键点定位、人脸属性分析和快速的人脸聚类。适用于美颜、智能相册分类等场景.基于深度学习、计算机视觉技术和海量数据,对...
来自: 云产品
移动APP业务合规解决方案
移动APP业务合规解决方案以云计算基础设计及达摩院 AI 能力为底座为企业提供合规镜子功能,通过深度学习技术、自动化扫描结合专家服务,帮助企业低成本、高效、精准的识别业务合规风险,持续满足业务合规需求。
对移动 APP 业务场景下的视频、图片、语音、文字内容进行全维度的风险审核,提供鉴黄、涉政暴恐识别、广告识别、不良场景识别、语音反垃圾、文本反垃圾等多种能力,以低成本、高效率、个性化、高准确率的体验提升内容风险防控水位.内容智能审核.内容智能审核.方案可通过多维度审核能力,对违规内容、不良内容和未成年人不宜...
来自: 解决方案
企业上云workshop
企业上云workshop
本文模拟了如下场景: 1. 线下 IDC 环境中部署了一个业务系统,业务是利用 wordpress 系统提供网站服务。 2. 本文详细介绍了如何将以上线下系统搬迁到云上, 包括如何在云上构建以上业务系统,如何迁移线下 系统到云上,如何割接。 3. 最后介绍了迁移上云后,如何部署安全系统。 解决问题 IDC 业务系统搬迁上云 云上构建业务系统 部署安全系统
云上环境联调测试 完成以上修改后,云上环境已经完成数据及配置迁移,可通过修改本地 hosts, SLB 上的 EIP解析为 Wordpress应用域名 ws001.lustre.site(同 4.2.配置 Nginx反向代 理步骤 4方法),进行全链路联调测试。操作步骤 步骤1 浏览器访问 ws001.lustre.site,确认页面及博客访问正常。步骤2 测试可发布新的 blog...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,负载均衡 SLB,弹性公网IP,文件存储NAS,云数据库PolarDB,Web应用防火墙,云防火墙,SSL证书,云速搭
智能媒资服务
智能媒资服务是阿里云提供的媒体内容资产管理和处理服务,提供标签、审核、检索、视频封面、智能处理等核心功能,提高海量内容的利用分发管理效率。
识别视频图像中的文字,提取图像文本内容.分析视频中的语音信息,提取语音文本内容.运动行为识别.分析视频动态信息,识别运动、动作、行为事件等内容.从视觉、文字、语音、运行行为等多个维度对视频信息进行分析,识别视频中的人物、物体场景、地标、文字、语音等内容.多维度信息识别.识别多模态间不同元素的联系和对齐关系...
来自: 云产品
语音自学习平台
阿里云语音自学习平台提供“开箱即用”语音识别效果优化能力,支持热词、语言模型等全流程的识别效果优化功能,让合作伙伴自主、自助定制出垂直领域语音识别模型
图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称.不填写不展示.标题点击能跳转.优化人名、地名.针对特有词汇,建议使用泛热词;针对人名、地名,优先使用类热词;类热词、泛热词使用时,词表中数量有限制,如果需要大量的热词,需要改用定制语言模型.其他优化方法.如果自学习工具无法满足需求...
来自: 云产品
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
图片翻译集成图像识别、机器翻译、图片合成等技术,可将图片中的文本内容进行识别、翻译,最终合成指定语种图片/输出结构化信息。并提供在线编辑平台,可以对译后内容进行在线编辑、打包下载等操作,满足更多用户对于图片翻译的需求.提供文档端到端翻译服务,输入文档,经过文档解析、机器翻译、自动排版布局,将生成指定...
来自: 云产品
云投屏
云投屏是阿里云基于内容智能开发的针对线下门店智能广告屏场景的信息发布系统。提供内容编辑、审核、增强、排版、投放、设备集成等能力。可实现内容质量算法检测、内容安全黄暴恐过滤、内容智能发布推荐、内容格式云端转码等功能。
提供内容上传,识别,存储功能,并支持管理用户的素材源,包含图片,视频,链接格式.设备播放列表,排期播放管理。对设备需要播放的内容进行动态计算和管理,支持插播,轮播机制,最小支持秒级控制,最大支持1年设备播放内容控制.过滤内容。支持黄色,暴力,恐怖等视图资源算法/人工双重过滤,降低客户人工审核投入.支持...
来自: 云产品
图像搜索
图像搜索是阿里云自研的一款用于图片间相似性检索的平台型产品。通过输入图片,可高精度、高效率的在图库网站中检索到与输入图片相似的图片集合,并支持定制化服务。以图搜图可广泛的应用于拍照购物、 商品推荐、版权保护、图片相似推荐等场景。
将图片搜索技术用于传统纺织产品的物联网平台,针对经纺织布料行业产品进行纹理识别,以搜图的方式反馈供应信息,通过“信息整合+图像识别+大数据”的方式,带给传统行业以新的生命力.深度学习算法训练,满足搜索精度要求.大规模检索引擎可支持百亿级别数据.支持实时更新维护数据.API调用便捷,满足服务快速搭建的需求....
来自: 云产品
音视频终端 SDK
音视频终端 SDK集成了阿里云视频直播和视频点播业务中拍摄、编辑、上传、推流和播放的核心能力,同时融合视频特效、音频特效等音视频AI能力,为用户提供一体化SDK,支持多终端接入,搭配产品级Demo,支持用户根据业务需求快速集成所需
全景声音频(Ambisonics 格式)通过独有的双耳渲染技术转换为含有全部空间信息的双声道音频,在 VR 头显以及具有陀螺仪的手机设备实现自由视角下,声像始终保持统一,人转动,声源位置不动的沉浸式体验,可用于 VR 直播,VR 点播等场景.提供先进的音量归一技术。在所有的音频内容中可提供流畅一致的音量水平,解决音量在...
来自: 云产品
跨境电商语言工具
跨境电商语言工具集成阿里云达摩院先进的NLP技术及海量电商领域双语语料,为跨境贸易平台及商家沉淀一套完整的全链路商品信息语言翻译及标题优化工具
帮助平台或商家诊断当前商品图片的文字所属语种,便于在目标市场国家获得更好的商品转化效果。支持诊断是否为中/英/俄语图片.图片语种诊断.结合标题诊断结果、平台搜索、点击、购买、浏览等数据,自动智能优化标题,帮助提升商品曝光及转化率,支持英文、俄语、西班牙语.标题智能优化.根据产品关键词、商品属性及详描中的...
来自: 云产品
地址标准化
地址标准化(Address Purification)是依托阿里云海量的地址语料库,及超强的NLP算法实力所沉淀出的高性能、高准确率、功能覆盖最全的标准地址算法服务。可为企业、政府机关及开发者提供地址数据清洗。地址标准化通过地址解析、补全、匹配等赋能业务的上层应用。
在对话场景下,通过输入多轮对话文字,通过对话文字识别下文推理和信息补全,返回相关性top3的推荐地址,辅助快速定位.对话下文地址推理.语音对话场景.提供多语种地址结构化解析相关服务,适用于物流、跨境电商等场景.支持菲律宾、印度尼西亚、越南、泰国、马来西亚.支持多个国家.国际地址服务.为用户打造的一站式的...
来自: 云产品
视频DNA
阿里云视频DNA采用先进的视频指纹技术标记视频唯一身份,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化,应用于视频查重、版权保护等场景,捍卫数字媒体版权尊严。
支持视频、图片等多种媒体文件指纹提取及识别.与区块链产品结合,支持存证上链,提供完备的版权保护和侵权追溯的解决方案.视频DNA基于视频指纹技术,可以唯一标记一个视频,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化。可用于视频相似查重、视频版权保护等场景.视频DNA集成于媒体处理、...
来自: 云产品
视频云营业厅解决方案
远程实现银行柜员服务、证券开户、保险勘察等各类服务场景,建立视频云营业厅,打通金融机构用户线上经营服务能力,满足终端用户线上业务办理的需求。
支持画中画、九宫格等多画面组合模式,支持叠加图片文字水印以及时间戳.丰富的增值功能.mPaaS 移动开发平台.MRTC 音视频通话.mPaaS 小程序.MGS 移动网关.mPaaS 小程序新品发布会.移动智能营销解决方案直播讲解.智能业务在线解决方案直播讲解.蚂蚁mPaaS:有人修建高楼,有人重构城市.mPaaS 斩获2019中国金融科技创新大赛...
来自: 解决方案
企业上云安全建设解决方案
企业上云安全建设解决方案通过简单三步,企业可快速评估自身安全问题,建设云上基础安全能力。第一步:评估安全风险,第二步:建设基础防护,第三步:防控业务风险,共建云上安全体系。
识别文字图片、音频、视频的违规内容.保护线业务防刷.爬虫风险管理.实名身份验证.云盾身份认证.可以提供的服务.新BGP高防.Web应用防火墙.云盾身份认证.防控业务风险.第一步:评估安全风险.第二步:建设基础防护.评估安全风险.安全风险评估是企业信息系统建设的安全根基,进行安全评估可以达到“以最小成本获得最大安全...
来自: 解决方案
移动研发平台EMAS
阿里云移动研发平台EMAS是国内领先的云原生应用研发平台(移动App、H5应用、小程序、Web应用等),基于广泛的云原生技术,为企业、开发者提供一站式的应用研发管理服务,涵盖应用开发、测试、运维、运营等应用全生命周期。
可以快速发送文字图片、语音进行意见反馈和报告Bug,增强互动,提高用户黏性.查看EMAS所有相关文档.iOS和Android的接入文档.EMAS常见问题汇总.EMAS产品技术支持.在实现高效、精确、实时的移动推送的同时,极大地降低了App开发成本.帮助客户发现App中的各类隐患,减少用户流失,提高App质量和市场竞争力.阿里巴巴首创...
来自: 云产品
< 1 2 >
共有2页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用