一种用于嵌入式语音合成系统的音库压缩及使用方法技术方案

技术编号:8656476 阅读:273 留言:0更新日期:2013-05-02 00:13
本发明专利技术公开了一种用于嵌入式语音合成系统的音库压缩及使用方法,用于嵌入式操作系统,将接收到的任意文字转换成语音输出。以汉语中的音节作为合成系统及语音模型库的基本单元;首先创建基于音节的原始语音模型库,然后对所述原始语音模型库进行数据分解和压缩,最后通过数据重组得到最终的压缩模型库。依据本发明专利技术提供的方法可以降低合成系统在嵌入式平台下所占用的空间资源,并提高合成速度,同时使合成语音保持良好的自然度和音质。

【技术实现步骤摘要】

本专利技术总的来说涉及一种面向嵌入式语音合成系统的音库压缩和使用方法,尤其是存储和运算资源有限的终端设备。
技术介绍
语音合成技术的目的是让机器还原自然的人类语音,嵌入式设备应用广泛,终端类嵌入式设备与用户交互频繁,语音是最自然的交互手段。一般的语音合成系统可分为三个主要的功能模块:文本分析模块、韵律生成模块和声学合成模块。基于大规模语料库的拼接合成方法由于技术简单,合成音质高被广泛采用。但是,这种方法的音库规模大,虽然通过聚类、编码和压缩等技术手 段处理后,空间可以降低,但音质受到损伤,且灵活度下降。因此,近年来基于大规模语料库的统计建模参数合成方法被广泛研究,基本思想是,对大量的原始语音库进行参数化表示和统计建模,合成时依照特定规则挑选模型构成模型序列,进一步计算得到合成语句的参数序列,通过参数化合成的方法合成符合要求的语音。通过参数化统计建模方法合成的语音具有较高的自然度和智能度。在这种方法中,为保证合成效果,原始语音库需要尽可能覆盖韵律特征,得到的模型库可达到数百兆字节。经过模型聚类,可将模型库压缩至十兆左右。这种规模对一些掌上电脑等中高端设备的存储和计算能力来说可以满足,本文档来自技高网...

【技术保护点】
一种嵌入式语音合成系统,包括以下模块:A.文本分析及韵律生成模块,用于对合成文本进行内容分析,得到对应的音节序列,同时每个音节附着相关的以上下文语境标识的韵律信息,其格式与模型训练时使用的标识相同;B.模型决策模块,用于接收上述附着韵律信息的音节序列,利用训练得到的模型决策树生成相应的模型状态序列,并得到时长决策结果;C.参数序列生成模块,用于接收上述模型状态序列,利用压缩频谱模型计算全局方差加窗矩阵,最后计算得到谱参数序列和基频参数序列;D.语音波形合成输出模块,用于接收参数序列,生成所要合成的语音波形数据,并输出播放或存储。

【技术特征摘要】
1.一种嵌入式语音合成系统,包括以下模块: A.文本分析及韵律生成模块,用于对合成文本进行内容分析,得到对应的音节序列,同时每个音节附着相关的以上下文语境标识的韵律信息,其格式与模型训练时使用的标识相同; B.模型决策模块,用于接收上述附着韵律信息的音节序列,利用训练得到的模型决策树生成相应的模型状态序列,并得到时长决策结果; C.参数序列生成模块,用于接收上述模型状态序列,利用压缩频谱模型计算全局方差加窗矩阵,最后计算得到谱参数序列和基频参数序列; D.语音波形合成输出模块,用于接收参数序列,生成所要合成的语音波形数据,并输出播放或存储。2.根据权利要求...

【专利技术属性】
技术研发人员:那兴宇谢湘何娅玲何宇新
申请(专利权)人:北京宇音天下科技有限公司北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1