新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
语音本地化部署方案支持语音识别、语音合成、语言模型自学习工具的本地化部署,帮助企业在自己的数据中心零时差使用智能语音服务。模型平台与服务大模型服务平台百炼阿里云百炼于近期正式发布2.0版本,应用、模型双引擎全新升级,兼容LlamaIndex等开源框架,更具开放性的应用框架,更极致生态化的模型服务,降低推理成本,...
来自: 云产品
基于弹性计算的AI推理
基于弹性计算的AI推理
场景描述 本方案适用于使用GPU进行AI在线推理的场 景。在推理之前,模型已经训练完成。例如,刷脸 支付中,我们在刷脸的时候,就是推理的一个过 程。再比如图像分类,目标检测,语音识别,语 义分析等返回结果的过程。 解决问题 使用GPU云服务器搭建推理环境 使用容器服务Kubernetes版构建推理 环境 使用NAS存储模型数据 使用飞天AI加速推理工具加速推理 产品列表 GPU云服务器 容器服务Kubernetes版 NAS共享存储
再 比如图像分类,目标检测,语音识别,语义分析等 返回结果的过程。解决问题 使用 GPU云服务器搭建推理环境 使用容器服务 Kubernetes版构建推理环 境 使用 NAS存储模型数据 使用飞天 AI加速推理工具加速推理 产品列表 GPU云服务器 容器服务 Kubernetes版 NAS共享存储 阿里云最佳实践技术分享群 最佳实践频道 如二维码过期...
来自: 最佳实践 | 相关产品:云服务器ECS,文件存储NAS,容器服务 ACK
AliOS Things
阿里云AliOS Things致力于搭建云端一体化 IoT 基础设施,具备极致性能、极简开发、云端一体、丰富组件、安全防护等关键能力。支持多种多样的设备连接到阿里云IoT平台,可广泛应用在智能家居、智慧城市、工业,新出行等领域。
提供友好高效的视频采集播放传输、视觉处理、语音识别等开发框架和工具,软硬件结合减少多媒体整体方案对硬件资源的开销,帮助客户快速拓展业务场景,降低成本和提升效率.AI智能框架.提供常用AI算法集成的便捷框架,包括Python/C++两套编程规范,隔离硬件差异,提供连云、控端、多媒体、机器学习等能力,大量开箱即用的...
来自: 云产品
FastGPU极速AI训练/推理
FastGPU极速AI训练/推理
利用 FastGPU工具一键构建阿里云上的AI训练/推理环境,并使用AIACC加速工具进行加速。
目前,FastGPU提供了三个 demo,分别是 GTC-demo,Pytorch 手势识别训练 InsightFace,Mxnet 人脸识别训练 Bert模型,Tensorflow语音识别训练 解决问题 1.快速构建 AI训练推理环境 阿里云最佳实践分享群 最佳实践频道 2.快速进行 AI POC性能测试 产品列表 如二维码过期,GPU云服务器 请搜索群号:31852400 文件存储 NAS...
来自: 最佳实践 | 相关产品:块存储,专有网络 VPC,对象存储 OSS,文件存储NAS,文件存储 CPFS,GPU云服务器
语音识别
阿里云语音识别是一款高准确率、低时延的语音转文字产品,包含实时语音识别、一句话识别和录音文件识别等多款产品,适用于智能客服、质检、会议纪要、实时字幕等多个企业应用场景。
提供“开箱即用”语音识别效果优化能力,支持热词、语言模型等全流程的识别效果优化功能,客户可以自主、自助定制出垂直领域语音识别模型.通义听悟免费体验火热进行中,体验用大模型做学习笔记、会议记录!通义听悟免费体验火热进行中,体验用大模型做学习笔记、会议记录!智能语音交互.语音识别提供高准确率、低时延的...
来自: 云产品
实时语音识别
阿里云实时语音识别是对不限时长的音频流进行实时语音转文字处理,采用业界领先的端到端识别模型,通用字准确率90%以上,用于直播字幕、实时会议、法庭庭审记录等。
支持粤语、四川话等20余种方言的识别、支持英语、日语、俄语、印尼等50余种语言识别、并支持中英自由说和英粤自由说混合识别.全新“端到端”框架.新的“端到端”框架同时支持离线转写和实时流式识别,兼容两种模式的诸多优势。服务性能整体优化,时延和并发优势明显.查看全部日志.管控台可视化进行项目、场景、功能配置及...
来自: 云产品
语音自学习平台
阿里云语音自学习平台提供“开箱即用”语音识别效果优化能力,支持热词、语言模型等全流程的识别效果优化功能,让合作伙伴自主、自助定制出垂直领域语音识别模型
某合作伙伴使用自学习平台在一个月之内从无到有打造了全新的俄罗斯和阿拉伯语语音识别模型,识别率达到业界优秀水平.多语种模型自建.疫情期间,湖北的智能疫情机器人使用阿里语音AI自学习平台,湖北口音语音识别率显著提升.智能疫情机器人.图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称....
来自: 云产品
离线语音合成
离线语音合成是在弱网或无网状态下,通过设备本地的语音合成模型,将文本转换成自然流畅的语音。
实时语音识别.对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等,可集成在各类App、智能家电、智能助手等产品中.用户可以自行上传数据,对阿里的语音技术进行深度定制,从而提升特定业务领域的识别准确度。目前仅支持上传文本数据对语言模型进行定制,未来会推出...
来自: 云产品
智能语音交互
阿里云智能语音交互(Intelligent Speech Interaction),提供语音识别、语音合成、自然语言理解等基础技术,应用于智能客服、智能质检、庭审实时记录、实时演讲字幕、访谈录音转写等场景。提供自学习平台等应用工具,辅助实现语音识别效果的定制优化。语音交互产品可进行公共云和私有化部署,在金融、保险、司法、电商等多个领域均有成功应用案例。
提供“开箱即用”语音识别效果优化能力,支持热词、语言模型等全流程的识别效果优化功能,客户可以自主、自助定制出垂直领域语音识别模型.能将用户提交的文本转换成自然流畅的语音,目前有多种音色可供选择,并提供调节语速、语调、音量等功能.长文本语音合成.提供了将超长文本(如千字或者万字)合成为语音二进制数据的...
来自: 云产品
语音合成TTS
阿里云语音合成服务,通过先进的深度学习技术,将文本转换成自然流畅的语音。高拟真度、灵活配置的语音合成产品,打通人机交互的闭环,让应用逼真发声。多种音色可供选择,并提供调节语速、语调、音量等功能。适用于智能客服、语音交互、文学有声阅读和无障碍播报等场景。
在客服机器人、服务机器人等场景中,与语音识别、自然语言处理等模块联动,打通人机交互的闭环,实现高品质的机器人发声,使得人机交互更流畅自然.提供多行业多场景的智能客服语音合成能力;提高解答效率,提升客户满意度;降低呼叫中心人工成本.实时语音转写.语言模型自学习工具.推荐搭配使用.在智能家居、音箱、车载和可...
来自: 云产品
录音文件识别
阿里云录音文件识别可对用户上传的录音文件进行识别,上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。支持金融、保险、司法、电商、智能家居等多个领域语音识别。
实时语音识别.对时长较短(一分钟以内)的语音进行识别,适用于较短的语音交互场景,如语音搜索、语音指令、语音短消息等,可集成在各类App、智能家电、智能助手等产品中.通过对实时上传的音频流或离线音频文件进行智能解析,根据用户请求参数,高效精准的进行包括说话人身份核验、语种识别、性别识别以及声音事件监测等高...
来自: 云产品
一句话识别
阿里云一句话识别可以对1分钟内语音进行识别,采用业界先进的端到端识别模型,通用字准确率90%以上,适用于较短的语音交互场景,如语音指令、语音短消息等。
实时语音识别.互联网娱乐领域竞争激烈,传统工程化模式进入瓶颈期,需要结合智能语音技术扩展玩法.将语音输入、口令红包作为吸引客户的新产品功能;语音AI+互联网娱乐领域的业务创新,帮助客户在激烈的竞争环境中获取优势.录音文件识别.实时语音识别.推荐搭配使用.智能家居理念已经成为市场主流,家电用品“听”懂话,逐渐...
来自: 云产品
语音本地化部署方案
提供轻量化本地部署方案,支持语音识别、语音合成、语言模型自学习工具的本地化部署,帮助企业在自己的数据中心零时差使用与阿里云公共云同款的智能语音服务。
提供轻量化本地部署方案,支持语音识别、语音合成、语言模型自学习工具的本地化部署,帮助企业在自己的数据中心零时差使用与阿里云公共云同款的智能语音服务.语音本地化部署方案.本地部署是基于客户自身的服务器部署.私密数据的安全性更有保障.操作简单灵活调配.采用docker进行容器化部署管理.软件授权方案,摆脱传统硬件...
来自: 云产品
语音分析
阿里云语音分析是通过检测与分析音频,识别特定语音分类的技术,包括说话人识别、语种识别、性别识别、声音事件检测等技术,可应用于会议音频识别、客服音频分析或音视频剪辑等场景。
语音分析技术是指通过检测与分析音频,识别特定语音分类的技术,包括说话人识别、语种识别、性别识别、声音事件检测等技术,可应用于会议音频识别、客服音频分析或视频剪辑等场景.实现对上传音频(实时或离线)中所说的是哪种语言进行句级别的判定,并返回是中、英、粤语或其他语言.电话客服营销场景下基于语种信息智能...
来自: 云产品
语音服务
语音服务支持快速发送语音通知、拨打验证和多方通话。 安全级别更高,难窃取。支持大容量、高并发,稳定可靠。极大的提升了用户体验和验证成功率。
智能语音机器人是基于呼叫控制、语音转文本(ASR)、语音合成(TTS)、自然语言理解(NLU)等基础技术,实现AI交互式对话的电话机器人产品.智能语音机器人.查看全部日志.生活服务行业解决方案.生活服务行业O2O解决方案,领限量无门槛代金券.<查看全部产品.语音服务(Voice Service)是一款基于云服务提供的语音通信能力,为...
来自: 云产品
文字识别
阿里云OCR文字识别是可以将图片识别文字的数据智能产品,支持印刷品、卡证、票据、图片、文档等多类文件,具备全栈全场景的文字识别能力,
通用语言文字识别.卡证文字识别.交通物流场景文字识别.票据凭证文字识别.企业资质文字识别核验.教育场景文字识别.文档自学习文字识别.开通享免费额度.可享200次/月&50次/账号的免费额度.产品规格-预付费资源包.【OCR统一识别】集成59种识别能力类型,实现多场景.一键开通OCR统一识别,即享200次/月免费额度.热门产品0.99元/...
来自: 云产品
风险识别
风险识别是一套实时分析、精准识别、全场景覆盖的业务风险管理产品。基于海量攻防样本、机器学习算法以及流式计算等技术,帮助企业一站式管理用户注册、营销活动、交易、信贷申请等关键业务中的欺诈风险。
风险识别(Fraud Detection)是一套实时分析、精准识别、全场景覆盖的业务风险管理产品。基于海量攻防样本、机器学习算法以及流式计算等技术,帮助企业一站式管理用户注册、营销活动、交易、信贷申请等关键业务中的欺诈风险.构建流量、风控识别、核身手段全链路的安全能力.更多产品与服务.一站式解决业务场景的风险问题....
来自: 云产品
语种识别
阿里翻译依托领先的自然语言处理技术和海量数据优势,研发基于注意力机制的语种识别系统,支持104种语言的语种检测,只需调用语种识别API,上传待检测的内容,即可得到相应的语种识别结果。
致力于解决全场景语言障碍,多领域适用,可快速实现一种语言到另一种语言的自动翻译,覆盖全球214种语言,专业版针对电商、医疗、社交领域有垂直优化.集成OCR识别、MT翻译功能,帮助解决通用图片、电商图片、卡证翻译问题,可在线翻译.提供几十种文档的自动解析、翻译和排版布局,输入一篇文档,指定语言方向,即可获得另一...
来自: 云产品
发票凭证识别
阿里云发票凭证识别支持各类票据识别,包括但不限于增值税发票识别,机动车发票识别等。发票凭证识别基于上万亿图片样本训练模型,单张图片毫秒级别返回。广泛应用于财务报销场景,方便信息存储和审核,识别准确率可达98%以上,可有效提升工作效率,减少人工成本。
支持火车票全部字段的识别,包括:编号、席、票价、姓名、座位号、出发时间、出发站、到达站、车次等。火车票关键字段姓名、出发时间、出发站、识别、座位号等识别准确率达到96%以上.出租车机打发票识别.支持的关键字段包括,发票号码、发票代码、金额、日期等识别。出租车票关键字段发票代码、发票号码识别准确率达到95%...
来自: 云产品
行业文档识别
阿里云提供行业文档类识别,可以高精度识别各行业文档和表单表格,通用于各行业的通用文字识别。包含单字坐标,表格识别,图像旋转等功能,广泛应用于司法、金融、医疗等各行业,方便工作人员审核录入核对,节约人力时间成本。
全部 OCR 文字识别产品.高精度识别各行业文档和表单表格,通用于各行业的通用文字识别。包含单字坐标,表格识别,图像旋转等功能,广泛应用于司法、金融、医疗等各行业.行业文档类识别.个人证照识别.车辆物流识别.票据凭证识别.企业资质识别.行业文档类识别.通用文字识别.教育场景识别.仪器仪表识别.特殊场景 OCR 识别....
来自: 云产品
< 1 2 >
共有2页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用