The invention discloses a speech data processing method based on the variational Gauss regression process, and carries out speech data processing based on the variational Gauss regression process model. The variational Gauss regression process model transforms the logarithmic likelihood function on the basis of the VFE approximation, making the final lower limit larger and finding the active point set. The free variational Gauss distribution and the free variational Gauss distribution are the posterior distribution of the selected points needed in the mapping approximation, and the speech data are processed according to the mapping approximation method. The invention improves the efficiency of calculation, approximating some items in the maximum value of the final lower limit, and reduces the loss of similarity as much as possible, so that the calculation efficiency can be greatly improved.
【技术实现步骤摘要】
一种基于变分高斯回归过程的语音数据处理方法
本专利技术涉及语音数据处理领域,具体涉及一种基于变分高斯回归过程的语音数据处理方法
技术介绍
对于语音数据的处理是现代信息数据处理的很重要的一部分,通过按时间间隔分帧,对于每一帧语音数据,可以用一个高维列向量来表示它,每一维对应一个特征,如共振峰频率,带宽等等。这样就能将语音数据的处理问题转换为更为常见的数据处理问题,进而转换为回归问题;高斯过程回归是一种机器学习回归方法,它是一种非参数回归方法,所以相较于参数回归方法,它的过拟合现象并不严重,而且预测结果具有概率意义,既有预测值,同时还有对于预测值的可信度的判断(通俗的讲,就是对于预测结果准确率的信心),在对于小样本数据的处理上,高斯过程回归的效果相当好。但是高斯过程回归也有一些问题,最主要的就是所花费的计算代价极大,在当下时代,数据处理中所涉及的都是量级十分巨大的数据,所以标准的高斯过程回归在实际应用中并没有得到推广。现有技术,最标准高斯过程回归的最大问题就是计算量太大,换句话来说就是计算时间太长。而之后的各种近似包括VFE近似都是在尽量保证准确性的基础上,使得计算量减小,不可避免的会造成准确度的降低。
技术实现思路
专利技术目的:本专利技术在VFE((VariationalFreeapproximationVariatioinalFreeEnergyapproximation))近似模型的基础上进一步缩小PP近似(Projectprocessapproximation,映射近似)模型和标准高斯过程回归模型两者对数似然函数之间的差异,从而提升预测准确性。本专利技术 ...
【技术保护点】
1.一种基于变分高斯回归过程的语音数据处理方法,其特征在于,基于变分高斯回归过程模型进行语音数据处理,所述变分高斯回归过程模型在VFE近似基础上,对对数似然函数进行变换,使得求出的最终下限变大,求出活动点集的自由变分高斯分布,自由变分高斯分布为映射近似中所需要的选取点的后验分布,按映射近似的方法来对语音数据进行处理。
【技术特征摘要】
1.一种基于变分高斯回归过程的语音数据处理方法,其特征在于,基于变分高斯回归过程模型进行语音数据处理,所述变分高斯回归过程模型在VFE近似基础上,对对数似然函数进行变换,使得求出的最终下限变大,求出活动点集的自由变分高斯分布,自由变分高斯分布为映射近似中所需要的选取点的后验分布,按映射近似的方法来对语音数据进行处理。2.根据权利要求1所述的一种基于变分高斯回归过程的语音数据处理方法,其特征在于,具体包括以下步骤:S01,语音数据按时间间隔分帧,对每一帧数据提取特征数据,将特征数据组成训练数据,数量记为N,每个特征数据为d维数据;S02,确定所需要的活动点的数量,记为m,在对数似然函数表达式进行变换之后,通过运用詹森不等式,得出一个下限,求出活动点集所服从的自由高斯分布;S03,采用贪婪算法确定活动点集中的m个元素;S04,对求出的对数似然函数下限中的参数求偏导,采用优化方法对偏导数进行最小化,得出参数的最优解;S05,将步骤S04中求出的参数代入到步骤S02中的活动点集高斯分布中,并按照PP近似的方法来求出语音数据的预测值,实现对语音数据的回归。3.根据权利要求2所述的一种基于变分高斯回归过程的语音数据处理方法,其特征在于,所述步骤S02具体包括以下步骤:(201)对数似然函数表达式为式(1):lnp(y)=ln∫∫p(y|f)p(f|fm)p(fm)dfdfm(1)在语音转换中,训练样本是每一帧源语音数据与其对应的目标语音数据所形成的数据对集合,假设目标语音数据为一维数据,建立目标语音数据模型为y=f(x)+ε,其中y为观测到的带有噪声的观测值,f为未受到噪声污染的函数值,x为源语音数据,ε为噪声,假设噪声服从高斯分布N(0,σ2I),定义I是指单位矩阵;fm为活动点集中所有源语音数据所对应的目标数据的函数值;p(y|f)表示已知变量f后变量y的概率;p(f|fm)表示已知fm情况下f的概率,p(fm)表示fm的概率;p(y)表示y的概率;(202)VFE近似过程为式(2):(203)詹森不等式表述为式为:如果f为凸函数或者凹函数,x为随机变量,若f为凸函数,则E(f(x))≥f(E(x));若f为凹函数,则E(f(x))≤f(E(x))),其中E(f(x))是随机变...
【专利技术属性】
技术研发人员:徐宁,缪晓宇,刘小峰,蒋爱民,王平,
申请(专利权)人:河海大学常州校区,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。