通义大模型
通义大模型是阿里云打造的高性能、低成本的AI基础设施,依托其深厚的训练数据与优化技术,支持全模态高效精准的模型服务调用和AI应用快速搭建,还能实现模型的高效训练。它以卓越的文本生成和理解能力,服务于广泛的领域,为用户提供性价比极高的智能解决方案,重新定义了AI应用的开发与部署标准。
通义-语音合成模型模型详情cosyvoice-v1Model2元/万字符模型调用语音通义-语音识别大模型语音识别paraformer系列模型,支持将中文普通话、多方言、多语种的音频转为文本,支持文件识别与实时流式识别。通义-语音识别大模型模型详情paraformerModel0.00008元/秒模型调用HumanAIGC通义-舞动人像模型舞动人像AnimateAnyone是一...
来自: 云产品
小语种文字识别
阿里云小语种文字识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息,适用于国际化所需的各类图文识别与信息翻译场景
查看全部文字识别产品.阿里云小语种文字识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。语言检测覆盖十余个国家地区语种,适用于国际化所需的各类图文识别与信息翻译场景。专属答疑,请加钉钉群:35208328.产品详情页二级页面锚点导航.唐家哲,靖鑫,也树.产品详情页二级页面锚点导航.孙慧颖,...
来自: 云产品
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
文字识别(OCR)通俗来说是将图片、照片上的文字内容识别出来,直接转换为可编辑文本的功能,阿里云根据客户的使用场景、需求,将产品分为了通用文字识别、个人证照识别、教育试卷识别、车辆物流识别、办公文档识别、企业资质识别、自定义模版、小语种文字识别、泛OCR场景识别10大类,满足各种客户的识别需求.【应用案例】...
来自: 云产品
便携智能语音一体机
便携智能一体机由达摩院结合应用场景现有问题和用户实际需求,由智能语音识别技术+智能采集阵列硬件+先进的音频处理算法组成。 打破传统场景记录方案,完美解决记录速度慢、记录不完整、速记成本高的问题。具备会后记录实时成稿,参会人无感使用,无需布线等特点,让用户使用更加轻松,记录效率更高
对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等,可集成在各类App、智能家电、智能助手等产品中.语音合成服务,通过先进的深度学习技术,将文本转换成自然流畅的语音。目前有多种音色可供选择,并提供调节语速、语调、音量等功能。适用于智能客服、语音交互、文学...
来自: 云产品
智能标签
智能标签,是通过对视频中视觉、文字、语音、行为等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐,助力视频智能生产。
智能标签,是通过对视频中视觉、文字、语音、行为等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐,助力视频智能生产.03A_频道页banner.产品详情页二级页面锚点导航.唐家...
来自: 云产品
网盘与相册服务
网盘与相册服务基于阿里云高可用存储及高安全水位的能力,帮助客户解决办公数据的搜索、管理、共享、审计等文件管理难题,同时也可为企业办公新形态升级提供打包服务。
按文件名任意连续字符串搜索;按文件名或备注分词查询.提供对图片的标签、人脸、自动识别;对图片、视频的拍摄时间、地点等元数据提取;相同人脸的自动聚类;图片、文档、视频的缩略图;时光轴排序.支持基于阿里云AccessKey签名方式或基于OAuth JWT以应用身份访问;基于手机号码或OAuth2.0的访问令牌以用户身份的访问,支撑...
来自: 云产品
网盘与相册服务PDS
网盘与相册服务(简称PDS)是阿里云为客户提供的面向企业、团队与个人的数据管理开放平台,提供一站式数据存储、分析和AI的能力。方便客户快速高效的构建可支撑海量用户的网盘与相册服务,同时针对团队及个人用户,支持免开发开箱即用。
按文件名任意连续字符串搜索;按文件名或备注分词查询.提供对图片的标签、人脸、自动识别;对图片、视频的拍摄时间、地点等元数据提取;相同人脸的自动聚类;图片、文档、视频的缩略图;时光轴排序.支持基于阿里云AccessKey签名方式或基于OAuth JWT以应用身份访问;基于手机号码或OAuth2.0的访问令牌以用户身份的访问,支撑...
来自: 云产品
Databricks数据洞察
阿里云Databricks数据洞察是基于Apache Spark的全托管数据分析平台, 内核采用更高效、稳定的商业版Databricks Runtime和Delta Lake。可满足数据分析师、数据工程师和数据科学家在大数据场景下对数据湖分析、实时数仓、离线数仓、BI数据分析、AI机器学习等需求
智能语音识别技术能够将法庭庭审过程中的法官、被告、原告、辩护律师、证人等角色所说的每一句话实时转写成文字并进行存储,依靠人工智能技术替代了原本法庭庭审的书记员角色。阿里云智能法庭方案,在司法届引起了强烈反响。目前已经在多家法庭使用,反馈良好.从容应对系统访问量、用户量、流量突发问题,不影响现有业务....
来自: 云产品
运维安全中心
阿里云运维安全中心(堡垒机)作为云上高效运维安全解决方案,通过集中管理资产权限,全程监控操作行为,实时还原运维场景,保障云端运维行为身份可鉴别、权限可管控、风险可阻断、操作可审计、合规可遵从。
可提取命令字符审计,命令定点回放.linux命令审计.远程桌面的操作,全程录像,包括:键盘操作、鼠标操作、窗口打开等.windows操作录像.支持远程桌面文件传输、SFTP的原文件审计.进行账号管控和权限组管理,分职权进行人员和资产管理.运维账号唯一性,解决共享账号、临时账号、滥用权限等问题.按照人员、服务器、服务器组,...
来自: 云产品
通用文字识别
阿里云通用类图片文字识别适用于多场景图片文字识别并返回坐标信息。包括但不限于电商图片文字识别,网络UGC图片文字识,社区贴吧图片文字识别,文档小说图片文字识别,通用文字图片识别。
文字识别主页面.个人证照识别.车辆物流识别.票据凭证识别.企业资质识别.国际卡证场景识别.贸易单证识别.OCR文档自学习.通用文字识别.产品功能与体验.OCR全品免费试用.OCR应用场景介绍.针对国际贸易行业的各类单证提供智能识别和抽取能力.全新OCR文档自学习平台,无需开发,一站式工具平台.体验智能文档产品,赢取大额猫超卡...
来自: 云产品
行业文档识别
阿里云提供行业文档类识别,可以高精度识别各行业文档和表单表格,通用于各行业的通用文字识别。包含单字坐标,表格识别,图像旋转等功能,广泛应用于司法、金融、医疗等各行业,方便工作人员审核录入核对,节约人力时间成本。
识别各类图片上的文字识别,各大行业场景通用 包类型 通用文字识别 流量包容量规格 500次 请 登录 后了解优惠价格 日常价:¥45.00/1年 加入购物车立即购买 通用文字识别资源包 能够对图片上的手写文字进行识别,支持四类手写体识别 包类型 通用手写体识别 流量包容量规格 500次 请 登录 后了解优惠价格 日常价:¥90.00/1年 ...
来自: 云产品
发票凭证识别
阿里云发票凭证识别支持各类票据识别,包括但不限于增值税发票识别,机动车发票识别等。发票凭证识别基于上万亿图片样本训练模型,单张图片毫秒级别返回。广泛应用于财务报销场景,方便信息存储和审核,识别准确率可达98%以上,可有效提升工作效率,减少人工成本。
支持火车票全部字段的识别,包括:编号、席、票价、姓名、座位号、出发时间、出发站、到达站、车次等。火车票关键字段姓名、出发时间、出发站、识别、座位号等识别准确率达到96%以上.出租车机打发票识别.支持的关键字段包括,发票号码、发票代码、金额、日期等识别。出租车票关键字段发票代码、发票号码识别准确率达到95%...
来自: 云产品
车辆物流识别
阿里云车辆物流识别,即汽车OCR,是阿里云提供的快速识别并获取和汽车相关的各种内容,结构化输出:包含驾驶证识别,行驶证识别,车牌识别,vin码识别。广泛应用于汽车交易、智慧停车等场景,大大提升了车辆信息录入的速度,助力企业智能化转型。
查看全部文字识别产品.车辆物流识别是基于读光OCR深度学习与行业共建的产品,适用于结构化识别与车辆相关的各类证件识别,如驾驶证识别、行驶证识别、车牌识别等,广泛应用于智慧停车、汽车交易、汽车保险等场景。专属答疑,请加钉钉群:35208328.产品详情页二级页面锚点导航.唐家哲,靖鑫,也树.产品详情页二级页面锚点导航...
来自: 云产品
企业资质识别
阿里云企业资质识别支持各类资产证件的识别。企业资产如营业执照识别,可结构化识别出注册号,公司名称,公司地址,法人代表,营业期限等多个字段; 房产证识别可识别多种商品性质房源,快速准确识别房屋性质,坐落,权利人等10个字段。结构化输出业务所需的字段,方便工作人员审核录入,核对,有效节约人力时间成本。
部署至本地服务器,在私有化环境中实现文字识别功能,保障数据私密性.集成到移动APP、Android、iOS或设备端中,无需网络即可实现文字识别功能.OCR全品免费试用.OCR应用场景案例.针对国际贸易行业的各类单证提供智能识别和抽取能力.全新OCR文档自学习平台,无需开发,一站式工具平台.体验文档智能产品,赢取大额猫超卡+达摩...
来自: 云产品
个人证照识别
个人证照识别是阿里云提供的通用型卡证OCR,可以解决通用卡证类的文字识别及识别信息结构化的问题。本类产品下包含身份证正反面识别、护照识别、银行卡识别、名片识别、户口页识别。
支持二代身份证正反面/多民族/生僻字识别,具备检测篡改PS/复印件、完整度评分、翻拍检测、反光/水印识别、图像智能旋转/畸变矫正/分辨率增强、人像检测等高精度识别能力.读光行驶证支持对行驶证正页、副页关键字段的自动定位和识别。其中,行驶证的总体准确率和召回率在93%以上,适应模糊、光照不均、透视畸变、任意背景等...
来自: 云产品
教育场景识别
阿里云教育场景识别能解决试题题目、数学公式等信息的智能化识别需求,是为智慧教学场景下的拍照搜题、板书识别、自动阅卷等应用提供关键技术能力的数据智能产品
查看全部文字识别产品.教育场景识别主要满足教育应用场景中试题题目、数学公式等信息的智能化识别需求,为智慧教学场景下的拍照搜题、板书识别、自动阅卷等应用提供关键技术能力。可大程度辅助教师的教务工作,并协助教育进行数字化转型。专属答疑,请加钉钉群:35208328.产品详情页二级页面锚点导航.唐家哲,靖鑫,也树....
来自: 云产品
仪器仪表识别
阿里云OCR文字识别-燃气表识别,自动识别燃气表、水表读数信息,返回读表器整数和小数部分读数
OCR文字识别大规模调价,部分商品降幅达26%,低至0.011元/次调用 立即购买 免费试用 产品文档文字识别/读表器识别 文字识别主页面 特殊场景识别 行业文档识别 海关物流场景识别 产品规格产品优势应用场景更多产品与服务文档与工具产品规格【读表器OCR文字识别】-燃气表/水表识别/读表器OCR识别/燃气表识别/水表识别 套餐...
来自: 云产品
语音识别
阿里云语音识别是一款高准确率、低时延的语音转文字产品,包含实时语音识别、一句话识别和录音文件识别等多款产品,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。
对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间.对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等。录音文件识别极速版.支持30分钟以内的音频转写,返回时间不超过10秒.录音文件识别闲时版.单价低至0.45元/...
来自: 云产品
录音文件识别
阿里云录音文件识别可对用户上传的录音文件进行识别,上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。支持金融、保险、司法、电商、智能家居等多个领域语音识别。
对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景.对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等,可集成在各类App、智能家电...
来自: 云产品
实时语音识别
阿里云实时语音识别是对不限时长的音频流进行实时语音转文字处理,采用业界领先的端到端识别模型,通用字准确率90%以上,用于直播字幕、实时会议、法庭庭审记录等。
实时语音识别是对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。可用于视频实时直播字幕、实时会议记录、实时法庭庭审记录、智能语音助手等场景.通义听悟免费体验火热进行中,体验用大模型做学习笔记、会议记录!通义听悟免费体验火热进行中,体验用大模型做学习笔记...
来自: 云产品
< 1 2 >
共有2页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用