一种基于变分高斯回归过程的语音数据处理方法技术

技术编号:18303060 阅读:38 留言:0更新日期:2018-06-28 12:35
本发明专利技术公开了一种基于变分高斯回归过程的语音数据处理方法,基于变分高斯回归过程模型进行语音数据处理,所述变分高斯回归过程模型在VFE近似基础上,对对数似然函数进行变换,使得求出的最终下限变大,求出活动点集的自由变分高斯分布,自由变分高斯分布为映射近似中所需要的选取点的后验分布,按映射近似的方法来对语音数据进行处理。本发明专利技术提高计算的效率,对于最后求出的下限最大值中的部分项作出近似,在尽量减小相似性的损失的同时,使得计算效率能够大大提升。

A speech data processing method based on variational Gauss regression process

The invention discloses a speech data processing method based on the variational Gauss regression process, and carries out speech data processing based on the variational Gauss regression process model. The variational Gauss regression process model transforms the logarithmic likelihood function on the basis of the VFE approximation, making the final lower limit larger and finding the active point set. The free variational Gauss distribution and the free variational Gauss distribution are the posterior distribution of the selected points needed in the mapping approximation, and the speech data are processed according to the mapping approximation method. The invention improves the efficiency of calculation, approximating some items in the maximum value of the final lower limit, and reduces the loss of similarity as much as possible, so that the calculation efficiency can be greatly improved.

【技术实现步骤摘要】
一种基于变分高斯回归过程的语音数据处理方法
本专利技术涉及语音数据处理领域,具体涉及一种基于变分高斯回归过程的语音数据处理方法
技术介绍
对于语音数据的处理是现代信息数据处理的很重要的一部分,通过按时间间隔分帧,对于每一帧语音数据,可以用一个高维列向量来表示它,每一维对应一个特征,如共振峰频率,带宽等等。这样就能将语音数据的处理问题转换为更为常见的数据处理问题,进而转换为回归问题;高斯过程回归是一种机器学习回归方法,它是一种非参数回归方法,所以相较于参数回归方法,它的过拟合现象并不严重,而且预测结果具有概率意义,既有预测值,同时还有对于预测值的可信度的判断(通俗的讲,就是对于预测结果准确率的信心),在对于小样本数据的处理上,高斯过程回归的效果相当好。但是高斯过程回归也有一些问题,最主要的就是所花费的计算代价极大,在当下时代,数据处理中所涉及的都是量级十分巨大的数据,所以标准的高斯过程回归在实际应用中并没有得到推广。现有技术,最标准高斯过程回归的最大问题就是计算量太大,换句话来说就是计算时间太长。而之后的各种近似包括VFE近似都是在尽量保证准确性的基础上,使得计算量减小,不可避免的会造成准确度的降低。
技术实现思路
专利技术目的:本专利技术在VFE((VariationalFreeapproximationVariatioinalFreeEnergyapproximation))近似模型的基础上进一步缩小PP近似(Projectprocessapproximation,映射近似)模型和标准高斯过程回归模型两者对数似然函数之间的差异,从而提升预测准确性。本专利技术技术方案如下。一种基于变分高斯回归过程的语音数据处理方法,基于变分高斯回归过程模型进行语音数据处理,变分高斯回归过程模型在VFE近似基础上,对对数似然函数进行变换,使得求出的最终下限变大,求出活动点集的自由变分高斯分布,自由变分高斯分布为映射近似中所需要的选取点的后验分布,按映射近似的方法来对语音数据进行处理。一种基于变分高斯回归过程的语音数据处理方法,具体包括以下步骤:S01,语音数据按时间间隔分帧,对每一帧数据提取特征数据,将特征数据组成训练数据,数量记为N,每个特征数据为d维数据;S02,确定所需要的活动点的数量,记为m,在对数似然函数表达式进行变换之后,通过运用詹森不等式,计算得出一个下限,求出活动点集所服从的自由高斯分布;S03,采用贪婪算法确定活动点集中的m个元素;S04,对求出的对数似然函数下限中的参数求偏导,采用优化方法对偏导数进行最小化,得出参数的最优解;S05,将步骤S04中求出的参数代入到步骤S02中的活动点集高斯分布中,并按照PP近似的方法来求出语音数据的预测值,实现对语音数据的回归。步骤S02具体包括以下步骤:(201)对数似然函数表达式为式(1):lnp(y)=lnkp(y|f)p(f|fm)p(fm)dfdfm(1)在语音转换中,训练样本是每一帧源语音数据与其对应的目标语音数据所形成的数据对集合,假设目标语音数据为一维数据,建立目标语音数据模型为y=f(x)+ε,其中y为观测到的带有噪声的观测值,f为未受到噪声污染的函数值,x为源语音数据,ε为噪声,假设噪声服从高斯分布N(0,σ2I),定义I是指单位矩阵;fm为活动点集中所有源语音数据所对应的目标数据的函数值;p(y|f)表示已知变量f后变量y的概率;p(f|fm)表示已知fm情况下f的概率,p(fm)表示fm的概率;p(y)表示y的概率;(202)VFE近似过程为式(2):(203)詹森不等式表述为式为:f为凸函数或者凹函数,x为随机变量,若f为凸函数,则E(f(x))≥f(E(x));若f为凹函数,则E(f(x))≤f(E(x))),其中E(f(x))是随机变量f(x)的期望;(204)在高斯过程回归的预测阶段,结合詹森不等式将对数似然函数进行最小化,又因为ln函数为凹函数,得到式(3):将lnp(y)的最小化问题转化为求式(3)不等式右边的最大化问题,不等式(3)右边定义为FV(Xm,φ),要求FV(Xm,φ)的最大值,将φ(fm)作为自变函数,进行变分求解,求出FV(Xm,φ)的最大值以及所对应的φ(fm)所服从的高斯分布;(205)以所述VFE近似过程为基础,对数似然函数转换为式(4):则式(4)经过詹森不等式变化后,转换为式(5):n为正整数,的Hessian矩阵为半正定矩阵,为凸函数,则为凹函数,得出:表示均值为0,方差为的高斯分布;其中KNm为所有N个数据与m个活动点之间的协方差,Kmm为m个活动点与m个活动点之间的协方差,KmN为KNm的转置。将n取得足够大(n≥104),式(7)中第三项忽略掉,近似等式变换为式(8):得出活动点集所服从的分布为:φ(fm)~N(σ-2Kmm(Kmm+σ-2KmnKnm)-1Kmny,Kmm(Kmm+σ-2KmnKnm)-1Kmm)(8)设θ为所有参数的集合,根据极大似然法,要求出FH(Xm)对θ的偏导,最终求出所有的参数θ。步骤S03具体包括以下步骤:(301)建立一个活动点集,活动点集初始为一个空集记为J,然后建立J的余集记为JC,则JUJC为全部训练数据;(302)随机从JC中选取一部分元素建立一个工作集,记为W,将W中的数据点分别代入到FHn-m(Xm)中去,最大化FHn-m(Xm)为选取活动点的选择标准,其中其中Tr是指矩阵的迹,即主对角线所有元素的和;选出使得最大一个点加入活动点集J,更新JC,并再次从JC中随机选取工作集W,第二次选择第二个活动点,重复m次,直至选出m个活动点,使得J成为所需要的活动点集。活动点集为代表整个训练样本的子集。较优地,步骤S04所述优化方法为共轭梯度法或者牛顿法。本专利技术的有益效果包括:本申请一种基于变分高斯回归过程的语音数据处理方法利用了凹函数的性质,在VFE近似的基础上进一步提高了预测值得精确性;在VFE近似的基础上进一步缩小了PP近似与标准高斯过程回归两者似然函数的差异,从而使得语音预测结果会更加好,实现原语音数据准确回归;本专利技术提高计算的效率,对于最后求出的下限最大值中的部分项作出近似,在尽量减小相似性的损失的同时,使得计算效率能够大大提升。附图说明下面结合附图和实施例对本专利技术进一步说明;图1为本专利技术一种基于变分高斯回归过程的语音数据处理方法流程图;图2为本专利技术涉及的活动点集按照变分方法根据近似性标准选取的图示说明。具体实施方式下面结合附图并通过具体实施例对本专利技术作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本专利技术的保护范围。为了使本专利技术的技术手段、创作特征、工作流程、使用方法达成目的与功效,且为了使该评价方法易于明白了解,下面结合具体实施例,进一步阐述本专利技术。一种基于变分高斯回归过程的语音数据处理方法,基于变分高斯回归过程模型进行语音数据处理,所述变分高斯回归过程模型在VFE近似基础上,对对数似然函数进行变换,使得求出的最终下限能够变得更大,然后求出活动点集的自由变分高斯分布,自由变分高斯分布为映射近似(PP近似)(ProjectProcessapproximation)中所需要的选取点的后验分布,按映射近似(PP近似)的方法来对语音数据进行处理。如图1本文档来自技高网...
一种基于变分高斯回归过程的语音数据处理方法

【技术保护点】
1.一种基于变分高斯回归过程的语音数据处理方法,其特征在于,基于变分高斯回归过程模型进行语音数据处理,所述变分高斯回归过程模型在VFE近似基础上,对对数似然函数进行变换,使得求出的最终下限变大,求出活动点集的自由变分高斯分布,自由变分高斯分布为映射近似中所需要的选取点的后验分布,按映射近似的方法来对语音数据进行处理。

【技术特征摘要】
1.一种基于变分高斯回归过程的语音数据处理方法,其特征在于,基于变分高斯回归过程模型进行语音数据处理,所述变分高斯回归过程模型在VFE近似基础上,对对数似然函数进行变换,使得求出的最终下限变大,求出活动点集的自由变分高斯分布,自由变分高斯分布为映射近似中所需要的选取点的后验分布,按映射近似的方法来对语音数据进行处理。2.根据权利要求1所述的一种基于变分高斯回归过程的语音数据处理方法,其特征在于,具体包括以下步骤:S01,语音数据按时间间隔分帧,对每一帧数据提取特征数据,将特征数据组成训练数据,数量记为N,每个特征数据为d维数据;S02,确定所需要的活动点的数量,记为m,在对数似然函数表达式进行变换之后,通过运用詹森不等式,得出一个下限,求出活动点集所服从的自由高斯分布;S03,采用贪婪算法确定活动点集中的m个元素;S04,对求出的对数似然函数下限中的参数求偏导,采用优化方法对偏导数进行最小化,得出参数的最优解;S05,将步骤S04中求出的参数代入到步骤S02中的活动点集高斯分布中,并按照PP近似的方法来求出语音数据的预测值,实现对语音数据的回归。3.根据权利要求2所述的一种基于变分高斯回归过程的语音数据处理方法,其特征在于,所述步骤S02具体包括以下步骤:(201)对数似然函数表达式为式(1):lnp(y)=ln∫∫p(y|f)p(f|fm)p(fm)dfdfm(1)在语音转换中,训练样本是每一帧源语音数据与其对应的目标语音数据所形成的数据对集合,假设目标语音数据为一维数据,建立目标语音数据模型为y=f(x)+ε,其中y为观测到的带有噪声的观测值,f为未受到噪声污染的函数值,x为源语音数据,ε为噪声,假设噪声服从高斯分布N(0,σ2I),定义I是指单位矩阵;fm为活动点集中所有源语音数据所对应的目标数据的函数值;p(y|f)表示已知变量f后变量y的概率;p(f|fm)表示已知fm情况下f的概率,p(fm)表示fm的概率;p(y)表示y的概率;(202)VFE近似过程为式(2):(203)詹森不等式表述为式为:如果f为凸函数或者凹函数,x为随机变量,若f为凸函数,则E(f(x))≥f(E(x));若f为凹函数,则E(f(x))≤f(E(x))),其中E(f(x))是随机变...

【专利技术属性】
技术研发人员:徐宁缪晓宇刘小峰蒋爱民王平
申请(专利权)人:河海大学常州校区
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1