云上 AI
依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代
技术实现参考 通义万相提供虚拟模特、鞋靴模特、图像背景生成等功能,可以用于生成精美的模特商品主图。操作过程如下:1.提供原 ◦ 基准:提供一张真人,作为生成模特的基础。或者提供一张商品,作为生成商品主图的基础。◦ 背景:如果有想要让大模型参考的背景,也可以提供。2.提供提示词 例如,提供...
来自: 解决方案
智能视觉生产
高精度图像处理、图像分析、3D生产产品能力 ,传媒、电商、娱乐行业必备
智能视觉生产(Intelligent Visual Production,简称ivpd),是以视觉AI能力为基础,结合平台能力及业务数据积累,面向传媒娱乐、工业制造、数字营销等行业提供视频、模型、图像等视觉内容的智能化生产服务,帮助客户提升生产效率,压缩生产周期,打通生态闭环.【智能视觉生产】限时免费试用.【立即体验】视觉AI体验中心.海量...
来自: 云产品
图像搜索
图像搜索是阿里云自研的一款用于图片间相似性检索的平台型产品。通过输入图片,可高精度、高效率的在图库网站中检索到与输入图片相似的图片集合,并支持定制化服务。以图搜图可广泛的应用于拍照购物、 商品推荐、版权保护、图片相似推荐等场景。
将图片搜索技术用于传统纺织产品的物联网平台,针对经纺织布料行业产品进行纹理识别,以搜图的方式反馈供应信息,通过“信息整合+图像识别+大数据”的方式,带给传统行业以新的生命力.深度学习算法训练,满足搜索精度要求.大规模检索引擎可支持百亿级别数据.支持实时更新维护数据.API调用便捷,满足服务快速搭建的需求....
来自: 云产品
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
覆盖文本、文档、图片、音频和视频模态,与文档解析、语音识别、图像识别相结合,满足多样化应用需求.【标题】行业实战场景.谢赟辉,靖鑫,也树.跨境电商平台商品发布.跨境电商平台的商品货源大多来自国内1688、淘宝等渠道,原始的商品信息为中文,商家或平台需要将商品内容翻译成其他语言.快速的商品信息多语言转化,将商品...
来自: 云产品
仪器仪表识别
阿里云OCR文字识别-燃气表识别,自动识别燃气表、水表读数信息,返回读表器整数和小数部分读数
支持图像智能旋转、畸变矫正、分辨率增强等高精度识别能力,精准识别燃气表、水表读。OCR文字识别大规模调价,部分商品降幅达26%,低至0.011元/次调用 立即购买 免费试用 产品文档文字识别/读表器识别 文字识别主页面 特殊场景识别 行业文档识别 海关物流场景识别 产品规格产品优势应用场景更多产品与服务文档与工具产品...
来自: 云产品
人机协同翻译平台
人机协同翻译平台依托达摩院机器翻译提供智能底座,提供40+类型文档翻译、图片翻译、视频翻译,帮助客户在线完成项目管理、翻译/质检、任务交付,基于客户不断累积数据智能训练最合适客户的机器翻译模型,持续提高客户人工翻译效率。
图片原文自动识别、机器翻译+人工编辑、格式调整、译在线合成.视频语音自动识别与提取、机器翻译+人工编辑、字幕调整.Z型图片卡片板式2.唐家哲,靖鑫,也树.40多种格式文档自动解析、翻译和排版布局.采用OCR,MT知识来自动翻译图像.可实时识别字幕原文和译文,并自动拆分时间轴,生成字幕文件.创建专有术语干预模型,保障...
来自: 云产品
智能标签
智能标签,是通过对视频中视觉、文字、语音、行为等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐,助力视频智能生产。
智能标签,是通过对视频中视觉、文字、语音、行为等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐,助力视频智能生产.03A_频道页banner.产品详情页二级页面锚点导航.唐家...
来自: 云产品
媒体处理MPS
阿里云媒体处理(ApsaraVideo for Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。
智能视觉(IntelligenceVision)为零算法基础的开发者和企业提供定制化模型训练能力,包括图像分类、图像检测、视频分类、视频识别、直播识别等能力,应用于工业质检、零售物件计数、视频监控等各种场景.视频多模态内容理解.视频多模态内容理解是通过分析视频中视觉、文字、语音、行为等多模态信息,自动输出视频的多维度...
来自: 云产品
视觉AI计算和训练
视觉计算服务VCS是阿里云推出的按实际算力计费的产品,AI计算成本节省可达30%。内置20+常用视觉AI算法,也可运行您指定的视觉AI算法,应用支撑达百万级QPS,体验毫秒级响应。
商品卡片,建议使用「轻量商品卡片」.产品动态时间线组件.谢赟辉,靖鑫,纾沉,冷莉营.谢赟辉,靖鑫,也树,纾沉,冷莉营.ACube200 开箱视频.ACube200也称“上云宝”,是能将本地网络摄像机快速接入VCS的工具,本视频是ACube200的开箱演示.如何使用ACube200.本视频讲解如何在15分钟内将本地网络摄像头快速接入VCS进行AI计算....
来自: 云产品
内容安全
阿里云内容安全基于深度学习技术,提供图片、视频、语音、文字、网页等多媒体的内容风险智能识别和审核服务,帮助用户发现色情、暴恐、政治敏感等风险内容,大幅度降低人工审核成本。
提供基于图像、视频、音频、文本的人工审核服务,在机器的识别基础上进一步保证风险内容的识别准确率.提供可视化的控制台,支持用户自行进行内容审核、数据查询等操作.谢赟辉,靖鑫,也树.内容安全产品对直播、视频、社交、游戏、教育、娱乐等场景下的视频、图片、语音、文字内容进行全维度的风险审核,提供鉴黄、涉政暴恐...
来自: 云产品
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
文字识别(OCR)通俗来说是将图片、照片上的文字内容识别出来,直接转换为可编辑文本的功能,阿里云根据客户的使用场景、需求,将产品分为了通用文字识别、个人证照识别、教育试卷识别、车辆物流识别、办公文档识别、企业资质识别、自定义模版、小语种文字识别、泛OCR场景识别10大类,满足各种客户的识别需求.【应用案例】...
来自: 云产品
车辆物流识别
阿里云车辆物流识别,即汽车OCR,是阿里云提供的快速识别并获取和汽车相关的各种内容,结构化输出:包含驾驶证识别,行驶证识别,车牌识别,vin码识别。广泛应用于汽车交易、智慧停车等场景,大大提升了车辆信息录入的速度,助力企业智能化转型。
车辆物流识别是基于读光OCR深度学习与行业共建的产品,适用于结构化识别与车辆相关的各类证件识别,如驾驶证识别、行驶证识别、车牌识别等,广泛应用于智慧停车、汽车交易、汽车保险等场景。专属答疑,请加钉钉群:35208328.产品详情页二级页面锚点导航.唐家哲,靖鑫,也树.产品详情页二级页面锚点导航.孙慧颖,靖鑫,也树.OCR...
来自: 云产品
个人证照识别
个人证照识别是阿里云提供的通用型卡证OCR,可以解决通用卡证类的文字识别及识别信息结构化的问题。本类产品下包含身份证正反面识别、护照识别、银行卡识别、名片识别、户口页识别。
支持二代身份证正反面/多民族/生僻字识别,具备检测篡改PS/复印件、完整度评分、翻拍检测、反光/水印识别图像智能旋转/畸变矫正/分辨率增强、人像检测等高精度识别能力.读光行驶证支持对行驶证正页、副页关键字段的自动定位和识别。其中,行驶证的总体准确率和召回率在93%以上,适应模糊、光照不均、透视畸变、任意背景等...
来自: 云产品
人工智能平台 PAI
阿里云人工智能平台 PAI 涵盖交互式建模、可视化建模、分布式训练到模型在线部署全流程;快速搭建人工智能推荐系统;深度学习模型训练速度提升数十倍;减少50%GPU成本
数据准备阶段,PAI-iTAG 提供智能化数据标注服务,支持图像、文本、视频、音频等不同类型数据标注,支持多模态数据标注;提供丰富的标注内容组件和题目组件,用户可以直接使用平台预置的标注模板,也可以自定义模板进行数据标注。同时提供全托管的数据标注外包服务.进一步了解 PAI-iTAG.在模型开发阶段,可通过 PAI-...
来自: 云产品
场景金融链接器
阿里云场景金融链接器提供面向消费者、企业的金融链接数智科技服务,用它可提升金融机构贷款、保险、银行卡户等产品服务体验和营销运营效率,助力企业支出降本提效。
深度沉淀的场景化风控能力,实物识别、医疗票据识别、重复图像识别能力,提升理赔自动化率和准确率.核保核赔智能助手,辅助人工判断,通过风险模型运营与监测,实现策略灵活调整.谢赟辉,靖鑫,也树.数字化费用支出管理.一款让企业聪明省钱的费用支出产品,聚焦企业7大费用支出高频场景,包括机票、酒店、火车、打车、企餐、...
来自: 云产品
图片翻译
阿里云图片翻译又称识图翻译,可实现电商图片翻译和在线翻译等编辑功能,广泛用于跨境电商和人工智能领域,它可提供在线编辑平台,能满足更多用户对于图片翻译的需求。
图片翻译 图片翻译集成图像识别、机器翻译、图片合成等技术,可将图片中的文本内容进行识别、翻译,最终合成指定语种图片/输出结构化信息。并提供在线编辑平台,可以对译后内容进行在线编辑、打包下载等操作,满足更多用户对于图片翻译的需求。钉钉加群:23369411 立即开通在线翻译平台在线翻译平台使用指南产品定价产品...
来自: 云产品
RAPIDS加速图像搜索
RAPIDS加速<em>图像</em>搜索
场景描述 本方案适用于使用RAPIDS加速平台 +GPU云服务器来对图像搜索任务进行加 速的场景。相比CPU,利用GPU+ RAPIDS在图像搜索场景下可以取得非常 明显的加速效果。 解决问题 1.搭建RAPIDS加速图像搜索环境 2.使用容器服务Kubernetes版部署图 像搜索环境 3.使用NAS存储计算数据 产品列表 容器服务Kubernetes版 GPU云服务器 文件存储NAS
图像识别和搜索,图像搜索任务可以实现以,在不同行业应用和业务场景中帮助您搜索相同或相似的图片。图像搜索任务背 后的两项主要技术是特征提取及向量化、向量索引和检索。27 RAPIDS加速图像搜索 单机部署搜应用 本文案例中,使用开源框架 TensorFlow和 Keras配置生产环境,然后使用 ResNet50卷积神经网络完成...
来自: 最佳实践 | 相关产品:云服务器ECS,文件存储NAS,容器服务 ACK
移动测试
阿里云移动测试(Mobile Testing)是为广大企业客户和移动开发者提供真机测试服务的云平台,拥有大量热门机型,提供7x24全天候App测试服务,帮助客户发现APP中的各类隐患(应用崩溃、各类兼容性问题、功能性问题、性能问题等),减少用户流失,提高APP质量和市场竞争力。
精准的图像识别,提高游戏测试效率.针对游戏测试难、验证难、场景多进行专项优化,提供高质量测试用例,进行性能瓶颈检测并提供解决方案,有效提升识别率,支持弱网验证.提供高质量测试用例,方便在大量真机进行批量回归验证.提供弱网场景的功能验证,不放过边界场景.对游戏App进行7项性能评测、并提供详细性能数据及解决...
来自: 云产品
智能开放搜索 OpenSearch
阿里云智能开放搜索 OpenSearch是阿里自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台,内置全链路搜索功能,提供一站式、场景化的行业大数据解决方案。
向量检索版控制台支持增删数据 查看详情 2024-04-08 新功能/规格 LLM智能问答版支持包年包月付费方式 查看详情 2024-04-30 新功能/规格 LLM智能问答版数据处理策略优化升级 查看详情 2024-05-07 新功能/规格 LLM智能问答版参考图片升级,支持图片理解与多返回 查看详情 2024-06-20 新功能/规格 LLM智能问答版发布模型评测...
来自: 云产品
GPU云服务器
阿里云GPU云服务器(GPU Cloud Computing,GPU)是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景。阿里云作为亚洲第一的云服务提供商,随时为您提供触手可得的算力,有效缓解计算压力,提升您的业务效率,助您提高企业竞争力。
图像领域作为深度学习应用最为成熟的领域,在阿里云强大的GPU算力助力下能够更准确识别图片,提升准确率,也提高运行效率.最新GPU针对AI、数据分析在各种规模上实现出色的加速,应对极其严峻的计算挑战。同时阿里云提供多种GPU实例规格,提供不同算力和场景需求的灵活性.提供业界领先的推理能力,最新GPU通过全系列精度(FP...
来自: 云产品
< 1 2 3 4 ... 6 >
共有6页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用