当前位置: 首页 > 专利查询>容毅专利>正文

一种使用语音合成技术实现语音资料下载及播放的方法技术

技术编号:3507819 阅读:125 留言:0更新日期:2012-04-11 18:40
一种使用语音合成技术实现语音资料下载及播放的方法,使用语音识别的方法通过文本文件从语音文件中提取阅读文本文件韵律信息,将提取的韵律信息嵌入到文本文件中,从而生成下载文件,下载文件存放在服务器上;用户端设备通过网络协议连接服务器并将下载文件下载到用户端设备上;用户端设备通过下载文本里的文本信息和韵律信息使用设备上的语音库合成最终语音,实现语音播放。本发明专利技术技术的主要用途是提供语音信息的点播服务,有相当一部分的语音点播不需要保持原发声者的发声特征,只需要提供一个高质量的语音阅读,如外语听力的点播,新闻播报的点播等。在这种应用环境中本发明专利技术技术相当于实现了高发声质量下的高压缩比。

【技术实现步骤摘要】

本专利技术涉及一种通过计算机或电子手持设备实现语音资料点播的技术,特别是。
技术介绍
近年来随着手机的普及,无线网络在迅猛发展。手机将成为人们使用最广的信息处理设备。手机通过无线网络的语音资料的点播有着广泛的应用。语音资料的点播有两种方式,一种是在线播放,即边下载边播放;一种是将语音文件完全下载后播放。在无线网络环境下,由于无线信号易受到干扰以及移动中无线信号的强弱易受环境的影响,在线播放的质量不易保证。下载后播放在无线环境里是更为适合的方法。被下载的义件一般是压缩过的语音文件,压缩比例的高低取决于需要的语音质量,和语音质量成反比。高质量的语音会产生出比较大的语音文件。无线网络由于受到自然条件的限制,其带宽为有限资源,不能无限增加。高质量的语音需要消耗更多的带宽资源来传送。使用小下载语音文件而能产生高质量语音的技术在无线网络环境下将会有竞争力。语音合成是将任意文本转换成相应的阅读语音的技术。现在的主流方法是语音拼接法,即预先录制音素或音素组合或词或句子,语音合成时通过对文本的分析选择适合录音单元拼接而成最终的语音。主要包括文本预处理,语言分析,韵律生成,语音单元挑选和语音拼接合成等关键步骤。大型的语音合成系统已经得到广泛的应用。但在手机等无线手持设备上,由于受到运算和存储资源的限制语音合成还不能得到很好的效果。通过消耗低带宽资源,实现高质量语音资料下载及播放,成为一种强烈的技术要求和市场需求。
技术实现思路
为弥补现有技术的不足,本专利技术提供一种设计科学合理,实现容易/使用方便,在手机等无线手持设备上使用语音合成技术实现语音资料下载及播放的方法。,使用语音识别的方法通过文本文件从语音文件中提取阅读文本文件韵律信息,将提取的韵律信息嵌入到文本文件中,从而生成下载文件,下载文件存放在服务器上;用户端设备通过网络协议连接服务器并将下载文件下载到用户端设备上;用户端设备通过下载文本里的文本信息和韵律信息使用设备上的语音库合成最终语音,实现语音播放。语音文件为原始录音文件或保持了发音人语音特征的原录音文件的压缩文件。文本文件为和语音文件相对应的文本文件,即语音文件为阅读文本文件的录音。下载文件为经过本专利技术方法处理过的供用户端设备下载的文件。服务器为存储下载文件的设备。用户端设备为播放下载文件的设备,用户端设备中设有合成语音所需要的语音库。本专利技术具有以下突出的优点1、使用语音识别技术从录音文件里提取真实的韵律信息并用来合成最终语音,从而大大提高了合成后的语音质量,降低了用户端设备的语音合成所需要的运算量,无需通过计算得到韵律信息。2、在保持同样发音质量的情况下,嵌入韵律信息的下载文本大大小于原始录音的压缩语音文件,从而大大降低了存储或传输所需要的资源。3、本专利技术技术的主要用途是提供语音信息的点播服务,有相当一部分的语音点播不需要保持原发声者的发声特征,只需要提供一个高质量的语音阅读,如外语听力的点播,新闻播报的点播等。在这种应用环境中本专利技术技术相当于实现了高发声质量下的高压缩比。由于具有以上突出优点,本专利技术在无线网络环境中将会有十分广泛的应用。附图说明图1为本专利技术的工作流程图。其中,1、下载文件播放系统,2、下载文件生成系统,3、下载文件下载系统,4、4、服务器,5、网络,6、用户终端设备。具体实施方式实施例本专利技术包括下载文件播放系统、下载文件生成系统、下载文件下载系统、服务器、因特网和用户终端设备,工作流程图如图1所示,使用语音识别的方法通过文本文件从语音文件中提取阅读文本文件韵律信息,将提取的韵律信息嵌入到文本文件中,从而生成下载文件,下载文件存放在服务器上;用户端设备通过网络协议连接服务器并将下载文件下载到用户端设备上;用户端设备通过下载文本里的文本信息和韵律信息使用设备上的语音库合成最终语音,实现语音播放。例如,一个英语听力文件的点播系统,下载文件生成系统将下载文件播放系统的语音文件嵌入到文本文件中,生成下载文件并下载到下载文件下载系统,下载文件下载系统将文本文件下载到服务器上,服务器通过网络将本文件下载到用户终端设备上,用户端设备通过下载文本里的文本信息和韵律信息使用设备上的语音库合成最终语音,实现语音播放。权利要求1.,其特征在于,使用语音识别的方法通过文本文件从语音文件中提取阅读文本文件韵律信息,将提取的韵律信息嵌入到文本文件中,从而生成下载文件,下载文件存放在服务器上;用户端设备通过网络协议连接服务器并将下载文件下载到用户端设备上;用户端设备通过下载文本里的文本信息和韵律信息使用设备上的语音库合成最终语音,实现语音播放。2.如权利要求1所述的,其特征在于,语音文件为原始录音文件或保持了发音人语音特征的原录音文件的压缩文件。3.如权利要求1所述的,其特征在于,文本文件为和语音文件相对应的文本文件,即语音文件为阅读文本文件的录音。4.如权利要求1所述的,其特征在于,下载文件为经过本专利技术方法处理过的供用户端设备下载的文件。5.如权利要求1所述的,其特征在于,服务器为存储下载文件的设备。全文摘要,使用语音识别的方法通过文本文件从语音文件中提取阅读文本文件韵律信息,将提取的韵律信息嵌入到文本文件中,从而生成下载文件,下载文件存放在服务器上;用户端设备通过网络协议连接服务器并将下载文件下载到用户端设备上;用户端设备通过下载文本里的文本信息和韵律信息使用设备上的语音库合成最终语音,实现语音播放。本专利技术技术的主要用途是提供语音信息的点播服务,有相当一部分的语音点播不需要保持原发声者的发声特征,只需要提供一个高质量的语音阅读,如外语听力的点播,新闻播报的点播等。在这种应用环境中本专利技术技术相当于实现了高发声质量下的高压缩比。文档编号G10L13/00GK1885773SQ20051004386公开日2006年12月27日 申请日期2005年6月21日 优先权日2005年6月21日专利技术者容毅 申请人:容毅本文档来自技高网...

【技术保护点】
一种使用语音合成技术实现语音资料下载及播放的方法,其特征在于,使用语音识别的方法通过文本文件从语音文件中提取阅读文本文件韵律信息,将提取的韵律信息嵌入到文本文件中,从而生成下载文件,下载文件存放在服务器上;用户端设备通过网络协议连接服务器并将下载文件下载到用户端设备上;用户端设备通过下载文本里的文本信息和韵律信息使用设备上的语音库合成最终语音,实现语音播放。

【技术特征摘要】

【专利技术属性】
技术研发人员:容毅
申请(专利权)人:容毅
类型:发明
国别省市:88[中国|济南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利