一种基于声管的语音合成方法技术

技术编号：16328913 阅读：328 留言：0更新日期：2017-09-29 20:06

一种基于声管的语音合成方法：输入数据包括发音时所有对应位置声管的面积函数值及声管的长度值，进行相关初始化，并设定声管个数；计算声管的声学元素；确定声管的收缩入口及收缩出口，对其求取平均值；确定磁单极子和偶极子源的位置，磁单极子放在收缩的最前部分，偶极子源放在一个具有代表性的障碍位置处；判断是否要激活噪声源；增加伯努利阻力，是将额外的阻力分离为Ri和

全部详细技术资料下载

【技术实现步骤摘要】
一种基于声管的语音合成方法
本专利技术涉及一种语音合成方法。特别是涉及一种考虑噪声源模型和流体动压的基于声管的语音合成方法。
技术介绍
语音合成指利用电子计算机及一些专业装置来模拟人制造语音的技术，是当前人机语音交互的主要技术之一。现阶段，语音合成的研究还是集中到文字到语音的合成这一阶段，也就是TTS合成系统。语音合成主要被分成两种方法，就是参数合成法以及波形拼接法。经过多年的发展，衔接合成是目前主要的高质量语音合成方法。从长远来看，似乎最有前途的是发音语音合成，它不受任何基本的限制，并且超出纯文本-语音合成的应用程序。而基于声管的语音合成是基于发音机理的语音合成方法的重要组成部分。关于人类声道的数学模型，一直以来就有两种说法：第一个观点是将声道看成是由多个横截面积不一样的声管串联而形成的声道系统，被叫作声管模型；而第二个观点是将声道看成一个谐振腔，腔体的谐振频率由共振峰表示，用该方法来描述声道的模型即为共振峰模型。本专利技术中采用的是第一种，也就是声管模型。有不同的技术来模拟离散管中声波的传播模型。最常用的技术是基于波数字滤波器,或者基于传输线电路模型的直接数值模拟，或者是基于时域-频域的混合仿真系统模拟声道。每种方法都有其特有的优点和缺点。
技术实现思路
本专利技术所要解决的技术问题是，提供一种不仅可以生成元音而且可以生成辅音，提高了生成元音准确度的基于声管的语音合成方法。本专利技术所采用的技术方案是：一种基于声管的语音合成方法，包括如下步骤：1)输入数据包括发音时所有对应位置声管的面积函数值及声管的长度值，进行相关初始化，并设定声管个数为500；2)计算...

【技术保护点】
一种基于声管的语音合成方法，其特征在于，包括如下步骤：1)输入数据包括发音时所有对应位置声管的面积函数值及声管的长度值，进行相关初始化，并设定声管个数为500；2)计算第n个声管的声学元素，所述的声学元素是传统输电线电路模型所需要的各个变量，n初始化为1，每循环一次，n加1；3)确定声管的收缩位置，是分别确定声管的收缩入口及收缩出口，然后对所述的收缩入口及收缩出口求取平均值；4)在确定声管的收缩位置的基础上确定磁单极子和偶极子源的位置，磁单极子放在收缩的最前部分，偶极子源放在一个具有代表性的障碍位置处，所述的具有代表性的障碍位置是由流动分离点与牙齿的距离来决定；5)判断是否要激活噪声源，当收缩中雷诺数的平方Re

【技术特征摘要】
1.一种基于声管的语音合成方法，其特征在于，包括如下步骤：1)输入数据包括发音时所有对应位置声管的面积函数值及声管的长度值，进行相关初始化，并设定声管个数为500；2)计算第n个声管的声学元素，所述的声学元素是传统输电线电路模型所需要的各个变量，n初始化为1，每循环一次，n加1；3)确定声管的收缩位置，是分别确定声管的收缩入口及收缩出口，然后对所述的收缩入口及收缩出口求取平均值；4)在确定声管的收缩位置的基础上确定磁单极子和偶极子源的位置，磁单极子放在收缩的最前部分，偶极子源放在一个具有代表性的障碍位置处，所述的具有代表性的障碍位置是由流动分离点与牙齿的距离来决定；5)判断是否要激活噪声源，当收缩中雷诺数的平方Re2大于一定的阈值时，激活噪声源，反之则不激活噪声源，其中Re＝vcdc/v是收缩中的雷诺数，是临界雷诺数；6)增加伯努利阻力，是将额外的阻力分离为Ri和公式如下：其中，和是两个连续声管i和j的横截面积的平方，uij是这两个声管之间的体积速度，ρ是周围空气密度，uin,i是进入声管i的体积速度，uout,i是离开声管i的体积速度，Apre...

【专利技术属性】
技术研发人员：喻梅，张洁，王建荣，于健，高洁，赵满坤，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人