云上 AI
依托大模型与云计算的协同发展,阿里云帮助企业和开发者以最快速度实现生成式和判别式的创新应用,拥抱 AI 时代
图生:推荐Qwen VL,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题进行解题等。图生文生:推荐通义万相,可用于生成证件照、模特、各种风格(动漫、国风、二次元等)人像,也可用于抠图、生成背景、更改图片元素等。语音和视频类 语音合成(文本转语音):...
来自: 解决方案
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
文字识别 OCR 用于识别图片、文档、卡证等文件所包含的文字信息。本产品具备完善的图像检测、文字识别和文字理解的能力,服务的日均访问量高达上亿次,具有优秀的识别效果与处理性能.更多产品与服务.随着交通行业的发展,车辆服务的需求不断扩大,对应人工成本不断增加,手工输入车辆相关信息,耗时耗力还容易出错.实现违章...
来自: 云产品
通用文字识别
阿里云通用类图片文字识别适用于多场景图片文字识别并返回坐标信息。包括但不限于电商图片文字识别,网络UGC图片文字识,社区贴吧图片文字识别,文档小说图片文字识别,通用文字图片识别。
电商图片文字识别.专门针对电商商品宣传图片、社区贴吧图片、网络UGC图片等网络场景下图片字符快速精准识别的原子能力产品,在违规广告识别、信息审核管理和网络安全治理等场景下具有极大应用价值.支持对有线表格、条纹表格、无线表格进行有效识别,并支持导出Excel功能,用户可进行二次编辑.文档结构化识别.可对文档信息...
来自: 云产品
个人证照识别
个人证照识别是阿里云提供的通用型卡证OCR,可以解决通用卡证类的文字识别及识别信息结构化的问题。本类产品下包含身份证正反面识别、护照识别、银行卡识别、名片识别、户口页识别。
为缓解道路拥堵,移动支付、ETC业务如雨后春笋般涌出,印刷文字识别OCR毫秒级快速识别图片中的文字,在ETC业务办理过程中提供了相应的能力.2、\\tETC收费通道的通行能力是人工收费通道的5至10倍。使用全自动电子收费系统,可以使公路收费走向无纸化、无现金化管理,从根本上杜绝收费票款的流失现象,解决公路收费中的财务...
来自: 云产品
发票凭证识别
阿里云发票凭证识别支持各类票据识别,包括但不限于增值税发票识别,机动车发票识别等。发票凭证识别基于上万亿图片样本训练模型,单张图片毫秒级别返回。广泛应用于财务报销场景,方便信息存储和审核,识别准确率可达98%以上,可有效提升工作效率,减少人工成本。
文字识别主页面.个人证照识别.通用文字识别.车辆物流识别.企业资质识别.贸易单证识别.票据凭证识别.功能介绍与体验.票据凭证识别.混贴发票识别.增值税发票识别.机动车销售发票识别.定额发票识别.航空行程单识别.出租车发票识别.增值税发票卷票识别.网约车行程单识别.过路过桥费发票识别.二手车统一销售发票识别.通用机打...
来自: 云产品
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
视觉智能文字识别 OCR可以将图片中的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了10大类,满足各种客户的图片识别需求。视觉智能开放平台免费试用拥有阿里达摩院图像、视频、3D视觉等领域科学家和工程师沉淀的视觉 AI 能力,为用户提供具备实战价值的一站视觉 AI 服务。人脸人体视觉智能开放...
来自: 云产品
OCR文档自学习
OCR文档自学习现支持模板和模型两大类任务的自主训练。用户可以通过配置模板或少量标注数据,训练出更满足业务场景需求的AI智能模型。
开启全面商业化.OCR 文档自学习将于2023年8月15日结束公测,开启全面商业化.<查看全部文字识别产品.OCR 文档自学习,是面向“无算法基础”的企业与个人开发者用户,通过全流程可视化操作,支持用户完成模板配置、数据处理&标注、模型构建&训练、部署发布等操作的一站工具平台。平台采用少样本训练、智能预标注,视觉-语义...
来自: 云产品
企业上云workshop
企业上云workshop
本文模拟了如下场景: 1. 线下 IDC 环境中部署了一个业务系统,业务是利用 wordpress 系统提供网站服务。 2. 本文详细介绍了如何将以上线下系统搬迁到云上, 包括如何在云上构建以上业务系统,如何迁移线下 系统到云上,如何割接。 3. 最后介绍了迁移上云后,如何部署安全系统。 解决问题 IDC 业务系统搬迁上云 云上构建业务系统 部署安全系统
内容主要 包含文字图片及小文件附件等,是典型的读多写少场景。根据场景的业务特点,编 制如下迁移方案:应用迁移:使用服务器迁移中心 SMC将应用服务器迁移至云上 ECS镜像。文档版本:20210617 3 企业上云 workshop-IDC业务迁移上云 最佳实践概述 存储迁移:使用 ossimport工具将 NAS中的数据迁移至云上 OSS。数据库迁移...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,对象存储 OSS,负载均衡 SLB,弹性公网IP,文件存储NAS,云数据库PolarDB,Web应用防火墙,云防火墙,SSL证书,云速搭
文档智能
阿里云文档智能基于多年技术积累打造的多模态文档识别与理解引擎,为用户提供各类文档文字提取和文档处理,支持通用场景、行业场景和自定义场景下的多样化文档处理需求。
精准识别图片文字,直接转换为可编辑文本.针对国际贸易行业的各类单证提供智能识别和抽取能力.NLP实验室产品家族齐亮相,最高可享100w免费额度,快来体验!开通后立享免费试用额度,可前往控制台试用.全新OCR文档自学习平台,无需开发,一站工具平台.超70+API调价,含多种规格资源包,部分商品降幅达26%.OCR自学习.OCR...
来自: 云产品
媒体处理MPS
阿里云媒体处理(ApsaraVideo for Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。
语音识别(ASR)、文字识别(OCR).ASR技术分析视频中的语音信息,将音频转成文字。OCR技术识别视频图像中的文字,精准识别视频画面中的字幕、标题、弹幕等关键内容.识别视频中是否有人脸,并支持五官关键点定位、人脸属性分析和快速的人脸聚类。适用于美颜、智能相册分类等场景.基于深度学习、计算机视觉技术和海量数据,对...
来自: 云产品
智能媒资服务
智能媒资服务是阿里云提供的媒体内容资产管理和处理服务,提供标签、审核、检索、视频封面、智能处理等核心功能,提高海量内容的利用分发管理效率。
智能媒体审核可从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容,包括色情、暴恐、政治敏感、广告识别等多个功能模块,支持视频图像文件内容质量审核,识别花屏、噪点等视频质量问题,可应用于短视频平台、直播平台、传媒审核等场景.智能检索(视频DNA).视频内容检索用于音视频间相似片段搜索,通过深度模型...
来自: 云产品
视频审核
阿里云视频审核服务基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容,包括色情、暴恐、政治敏感、广告识别等多个功能模块,同时支持视频图像文件内容质量审核功能,应用于短视频平台、直播平台、传媒审核等场景。
视频审核服务基于海量标注数据和深度学习算法实现,从语音、文字、视觉等多维度精准识别媒体文件中包含的违禁内容,包括色情、暴恐、广告、不良场景识别等多个功能模块,同时支持视频图像文件内容质量审核功能,应用于短视频平台、直播平台、传媒审核等场景.使用媒体处理审核.使用直播审核.短视频解决方案.针对平台资讯内容...
来自: 云产品
云投屏
云投屏是阿里云基于内容智能开发的针对线下门店智能广告屏场景的信息发布系统。提供内容编辑、审核、增强、排版、投放、设备集成等能力。可实现内容质量算法检测、内容安全黄暴恐过滤、内容智能发布推荐、内容格式云端转码等功能。
提供内容上传,识别,存储功能,并支持管理用户的素材源,包含图片,视频,链接格式.设备播放列表,排期播放管理。对设备需要播放的内容进行动态计算和管理,支持插播,轮播机制,最小支持秒级控制,最大支持1年设备播放内容控制.过滤内容。支持黄色,暴力,恐怖等视图资源算法/人工双重过滤,降低客户人工审核投入.支持...
来自: 云产品
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
不仅仅是翻译,提供标题的质量诊断、标题智能优化、标题智能生成、图片文字语种诊断等能力.机器翻译团队在阿里巴巴集团内部深耕电商场景10年,在阿里巴巴集团跨境电商平台沉淀了丰富的经验和产品,为客户提供多样化的产品与服务.通用版翻译引擎.智能语音交互.推荐搭配使用.跨境电商平台商品发布.专业的译员在人工翻译场景下...
来自: 云产品
视频DNA
阿里云视频DNA采用先进的视频指纹技术标记视频唯一身份,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化,应用于视频查重、版权保护等场景,捍卫数字媒体版权尊严。
支持视频、图片等多种媒体文件指纹提取及识别.与区块链产品结合,支持存证上链,提供完备的版权保护和侵权追溯的解决方案.视频DNA基于视频指纹技术,可以唯一标记一个视频,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化。可用于视频相似查重、视频版权保护等场景.视频DNA集成于媒体处理、...
来自: 云产品
NLP自学习平台
阿里云NLP自学习平台是面向算法小白用户的自适应标注、训练和服务平台,支持34种算法能力。仅需标注或上传适量数据,即可通过平台创建算法模型并使用。
语种丰富,覆盖全球214种语言,支持文本、文档、图片、语音、视频5种模态,在机器翻译基础上,提供人机协同翻译平台及翻译自学习平台,满足多样化的语言诉求.开放搜索是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站智能搜索业务开发平台,目前为包括淘宝、天猫在内的阿里集团核心业务提供搜索服务支持。通过...
来自: 云产品
音视频终端 SDK
音视频终端 SDK集成了阿里云视频直播和视频点播业务中拍摄、编辑、上传、推流和播放的核心能力,同时融合视频特效、音频特效等音视频AI能力,为用户提供一体化SDK,支持多终端接入,搭配产品级Demo,支持用户根据业务需求快速集成所需
将全景声音频(Ambisonics 格式)通过独有的双耳渲染技术转换为含有全部空间信息的双声道音频,在 VR 头显以及具有陀螺仪的手机设备上实现自由视角下,声像始终保持统一,人转动,声源位置不动的沉浸体验,可用于 VR 直播,VR 点播等场景.提供先进的音量归一技术。在所有的音频内容中可提供流畅一致的音量水平,解决音量在...
来自: 云产品
智能开放搜索 OpenSearch
阿里云智能开放搜索 OpenSearch是阿里自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台,内置全链路搜索功能,提供一站式、场景化的行业大数据解决方案。
企业专属对话搜索.pdf、doc、excel、网页、表格等多样化数据格式支持.多数据格式支持.支持对话结果、参考链接、参考图片等多种结果形式.检索增强生成.一站端到端检索增强生成(RAG)服务.体验电商行业算法版demo.电商/O2O场景对搜索结果的召回和排序有极高的要求。海量业务数据需要实时更新,满足商品进行多维度比较,...
来自: 云产品
智能媒体服务 IMS
智能媒体服务IMS(Intelligent Media Services),是围绕直播和点播场景下的媒体采集、媒资管理、内容生产、制作和分发能力的一站式服务集,提供广播级、全智能、灵活多样、可多云接入的专业能力,并面向多云复杂业务流场景提供成熟的低代码终端SDK集成方案。
基于文字图片、视频等多维标签和物料检索素材,精准定位.支持百兆bps码率内容的云端转码和剪辑合成.高码率源生产处理.对象存储OSS.视频点播VOD.短视频服务集音视频强大拍摄、特效编辑、本地转码、高速上传、自动化转码处理、媒体资源管理、分发加速、播放于一体的完整短视频解决方案。借助视频摆脱“工具化”印象,提升...
来自: 云产品
小语种文字识别
阿里云小语种文字识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息,适用于国际化所需的各类图文识别与信息翻译场景
读光OCR英文专项识别是针对全英文图片文档场景下英文印刷体字符高效检测和识别的原子能力产品,具备英文专项识别和英文分词功能,支持旋转、表格、文字坐标等多项基础功能.读光OCR日语识别是针对全日文图片文档场景下日文印刷体高效检测和识别的原子能力产品,支持旋转、表格、文字坐标等多项基础功能.读光OCR俄语识别是...
来自: 云产品
< 1 2 >
共有2页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用