【技术实现步骤摘要】
本专利技术总的来说涉及一种面向嵌入式语音合成系统的音库压缩和使用方法,尤其是存储和运算资源有限的终端设备。
技术介绍
语音合成技术的目的是让机器还原自然的人类语音,嵌入式设备应用广泛,终端类嵌入式设备与用户交互频繁,语音是最自然的交互手段。一般的语音合成系统可分为三个主要的功能模块:文本分析模块、韵律生成模块和声学合成模块。基于大规模语料库的拼接合成方法由于技术简单,合成音质高被广泛采用。但是,这种方法的音库规模大,虽然通过聚类、编码和压缩等技术手 段处理后,空间可以降低,但音质受到损伤,且灵活度下降。因此,近年来基于大规模语料库的统计建模参数合成方法被广泛研究,基本思想是,对大量的原始语音库进行参数化表示和统计建模,合成时依照特定规则挑选模型构成模型序列,进一步计算得到合成语句的参数序列,通过参数化合成的方法合成符合要求的语音。通过参数化统计建模方法合成的语音具有较高的自然度和智能度。在这种方法中,为保证合成效果,原始语音库需要尽可能覆盖韵律特征,得到的模型库可达到数百兆字节。经过模型聚类,可将模型库压缩至十兆左右。这种规模对一些掌上电脑等中高端设备的存储和计 ...
【技术保护点】
一种嵌入式语音合成系统,包括以下模块:A.文本分析及韵律生成模块,用于对合成文本进行内容分析,得到对应的音节序列,同时每个音节附着相关的以上下文语境标识的韵律信息,其格式与模型训练时使用的标识相同;B.模型决策模块,用于接收上述附着韵律信息的音节序列,利用训练得到的模型决策树生成相应的模型状态序列,并得到时长决策结果;C.参数序列生成模块,用于接收上述模型状态序列,利用压缩频谱模型计算全局方差加窗矩阵,最后计算得到谱参数序列和基频参数序列;D.语音波形合成输出模块,用于接收参数序列,生成所要合成的语音波形数据,并输出播放或存储。
【技术特征摘要】
1.一种嵌入式语音合成系统,包括以下模块: A.文本分析及韵律生成模块,用于对合成文本进行内容分析,得到对应的音节序列,同时每个音节附着相关的以上下文语境标识的韵律信息,其格式与模型训练时使用的标识相同; B.模型决策模块,用于接收上述附着韵律信息的音节序列,利用训练得到的模型决策树生成相应的模型状态序列,并得到时长决策结果; C.参数序列生成模块,用于接收上述模型状态序列,利用压缩频谱模型计算全局方差加窗矩阵,最后计算得到谱参数序列和基频参数序列; D.语音波形合成输出模块,用于接收参数序列,生成所要合成的语音波形数据,并输出播放或存储。2.根据权利要求...
【专利技术属性】
技术研发人员:那兴宇,谢湘,何娅玲,何宇新,
申请(专利权)人:北京宇音天下科技有限公司,北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。