阿里云智能语音交互(Intelligent Speech Interaction),提供语音识别、语音合成、自然语言理解等基础技术,应用于智能客服、智能质检、庭审实时记录、实时演讲字幕、访谈录音转写等场景。提供自学习平台等应用工具,辅助实现语音识别效果的定制优化。语音交互产品可进行公共云和私有化部署,在金融、保险、司法、电商等多个领域均有成功应用案例。
支持SSML标签语言;支持流式合成,边合成边播放.【标题】子产品与服务-copy.孙慧颖,靖鑫,也树.提交录音文件识别请求后,商业用户的转写任务可在3小时之内完成识别并返回识别文本。对不限时长的音频流做实时识别,达到“边说边出文字”的效果,内置智能断句,可提供每句话开始结束时间。对时长较短(一分钟以内)的语音进行...