基于区分性互补信息的语音客观评价最优特征组筛选方法技术

技术编号:28379866 阅读:19 留言:0更新日期:2021-05-08 00:07
本发明专利技术公开了一种基于区分性互补信息的语音客观评价最优特征组筛选方法,包括先提取语音样本的多种特征来构成样本特征集;计算特征集的互补信息熵和单一特征的区分性;根据特征集中单一特征与主观评分的相关性,以及单一特征的区分性,选择第一个使二者之和最大的特征;根据候选特征集中单一特征与主观评分的相关性,以及候选特征集的互补信息熵,选择其他使二者之和最大的特征;最后采用皮尔逊相系数作为语音客观质量评价指标,根据岭回归模型的性能提升指数判断最优特征组是否收敛。本发明专利技术解决了单一特征难以实现理想的语音客观评价,多特征组合容易造成模型过拟合、计算复杂度高的问题,有效选择出实现语音客观质量评价的最佳特征组合。

【技术实现步骤摘要】
基于区分性互补信息的语音客观评价最优特征组筛选方法
本专利技术涉及数据特征选择
,特别涉及一种基于区分性互补信息的语音客观评价最优特征组筛选方法。
技术介绍
随着通信技术的高速发展,多种多样的编解码技术层出不穷,不同种类的编解码技术和传输技术都会给语音质量造成不同程度的损伤,由于语音质量的下降会降低获取信息的准确性,语音质量的优劣直接影响着用户的体验。在移动网络环境中,如果能实时进行终端用户语音质量的评估工作,就可根据其结果而进行质量调整,因此寻找有效、可靠和灵活的语音质量评价方法是十分迫切的。文献上用于语音客观质量评价的语音特征达数十多种,例如语音的基频、基频扰动、关键频带能量、LSP、谱偏态等特征,由于单一特征难以实现理想的语音客观质量评价,因此通常采用多种特征组合。在已有的研究中,只是选择几种特征组合来用于语音质量评价,缺乏对各特征之间的组合效益分析,无法保证所选特征组是最优特征组。在多个语音特征中如何选择最优特征组合用于语音质量评价还是一个未解的问题,其涉及到需要在多特征联合使用时,选择最小特征子集使语音客观评价模型具有最佳的性能。现有的特征选择方法主要有过滤式选择方法,包裹式选择方法和嵌入式选择方法。其中过滤式方法先对数据集进行特征选择,然后再训练学习器,但是其特征选择与学习器无关,所以在性能上不能保证所选特征集使得学习器具有最佳性能。包裹式选择方法直接把最终选择要使用的学习器性能作为特征子集的评价准则,从学习器性能来看,包裹式特征选择会比其它选择方法好,但是由于在特征选择过程中需要多次训练学习器,会导致算法复杂度太大。嵌入式是将选择特征过程与学习器训练过程融为一体,同样在特征选择过程中需要多次训练学习器,算法复杂度太大,且存在模型过拟合的风险。因此需要找到一种能够更加方便有效的语音客观评价最优特征组选择方法。
技术实现思路
本专利技术的第一目的在于克服现有技术的缺点与不足,提供一种基于区分性互补信息的语音客观评价最优特征组筛选方法,该方法解决了单一特征难以实现理想的语音客观评价,多特征组合容易造成模型过拟合、计算复杂度高的问题,能有效选择出实现语音客观质量评价的最佳特征组合。本专利技术的第二目的在于提供一种基于区分性互补信息的语音客观评价最优特征组筛选装置。本专利技术的第三目的在于提供一种计算机可读存储介质。本专利技术的第四目的在于提供一种计算设备。本专利技术的第一目的通过下述技术方案实现:一种基于区分性互补信息的语音客观评价最优特征组筛选方法,包括如下步骤:S1、获取语音样本集X={(Xn,sn),n=1,2,...,N},语音样本集中的每个样本Xn都有对应的质量主观评分sn,N为语音样本集的样本量,n为样本序号,对每个样本提取多种待选特征,构成样本特征集;S2、计算每个样本的各待选特征之间的相关性,得到样本特征集的互补信息熵HR;S3、计算样本特征集在缺少其中任意单个特征情况下的互补信息熵减少量,作为该单个特征的区分性大小,即该单个特征相对其他特征的区分性互补信息;S4、计算样本特征集中的每个特征与其所属样本对应的质量主观评分之间的相关性,根据每个特征与质量主观评分的相关性以及每个特征的区分性,选择第一个使二者之和最大的特征,构建初始的最优特征组;S5、遍历剩余样本特征集,将剩余样本特征集的单个特征增补到最优特征组中,得到对应的候选特征集,计算候选特征集的互补信息熵,根据候选特征集中的每个特征与其所属样本对应的质量主观评分之间的相关性,以及候选特征集的互补信息熵,选择第t个使二者之和最大的特征,并加入到最优特征组;S6、以岭回归模型作为语音客观质量评价模型,每一步筛选得到的最优特征组作为模型输入,模型输出该最优特征组所对应的样本的质量客观评分;以样本的质量客观评分与样本的质量主观评分之间的皮尔逊相关系数作为语音客观质量评价指标,基于皮尔逊相关系数计算岭回归模型的性能提升指数,根据性能提升指数判断最优特征组是否收敛,若是,则判定当前的最优特征组构建完成,可用于实现语音客观质量评价;若否,则需要返回步骤S5继续拓展最优特征组。优选的,在步骤S1中,每个样本提取的多种待选特征,构成样本特征集,具体为:S11、对样本进行滤波预处理,然后采用语音端点检测方法标注每个样本中的浊音帧、清音帧、无声帧;S12、提取浊音帧的韵律特征的高阶统计量,以及频谱特征的高阶统计量,构建集合D={(fn,sn),n=1,2,...,N};其中,fn表示第n个样本提取的特征;fn是一个M维的向量;M是单个样本的特征总数;韵律特征包括基频和基频抖动,频谱特征包括共振峰特征和高维的MFCC特征、高维的LPC特征、高维的LPCC特征、高维的LSP特征、线性预测信号的高维MFCC特征、线性预测残差信号的高维MFCC特征,高阶统计量包括均值、方差、偏峰和峰度;S13、所有样本的第i个特征构成的集合表示为Fi={fin,i=1,2...,M;n=1,2...,N},fin代表第n个样本的第i个特征,样本特征集表示为F={F1,F2,...,FM}。更进一步的,步骤S2的过程如下:S21、考虑到不同特征在数值上的差异较大,这里先对特征集F={F1,F2,...,FM}中的每一类特征进行归一化和中心化,得到处理后的特征集合使得每一类特征Fi的均值为0,方差为1,从而消除量纲和数量级影响;S22、计算各特征之间的协方差矩阵其中,rij代表样本特征集中的Fi和Fj之间的协方差,i=1,2...,M,j=1,2...,M;M代表需计算互补信息熵的特征集中的特征个数;协方差表征两个特征之间的相关性;S23、由协方差矩阵的计算方法和矩阵性质得到,R为正定矩阵,所以对于R的任意的特征值λi>0,且λi是fn归一化和中心化之后的结果,计算样本特征集的互补信息熵HR:其中,0≤HR≤1,如果HR为1,则各特征之间的协方差为0,相关性为0,样本特征集中不含有冗余信息,此时特征集的互补信息最大;如果HR<1,则样本特征集中含有冗余信息;HR值越大,特征集中的冗余信息越小,互补信息越大,各特征之间的区分性越好。更进一步的,步骤S3具体为:按照步骤S2分别计算样本特征集在删除其不同的单个特征Fi情况下的互补信息熵计算HR与之间的差值,并将其作为特征Fi在样本特征集中相对于其它特征的区分性大小;删除特征Fi后,如果互补信息熵增大,则说明特征Fi的冗余性较大;如果互补信息熵减小,则说明特征Fi的区分性较好。更进一步的,步骤S4具体如下:S41、计算样本特征集F中单个特征Fi与其所属样本对应的质量主观评分的相关性:得到样本特征集中所有特征与质量主观评分的相关性{ρi,i=1,2,…M};其中,M是单个样本的特征总数;是Fi的均值;代表所有样本主观评分的均值,yn是第n个样本的主观评分;如果ρi的值越大,说明单个特征Fi与质量主观评分本文档来自技高网
...

【技术保护点】
1.一种基于区分性互补信息的语音客观评价最优特征组筛选方法,其特征在于,包括如下步骤:/nS1、获取语音样本集X={(X

【技术特征摘要】
1.一种基于区分性互补信息的语音客观评价最优特征组筛选方法,其特征在于,包括如下步骤:
S1、获取语音样本集X={(Xn,sn),n=1,2,...,N},语音样本集中的每个样本Xn都有对应的质量主观评分sn,N为语音样本集的样本量,n为样本序号,对每个样本提取多种待选特征,构成样本特征集;
S2、计算每个样本的各待选特征之间的相关性,得到样本特征集的互补信息熵HR;
S3、计算样本特征集在缺少其中任意单个特征情况下的互补信息熵减少量,作为该单个特征的区分性大小,即该单个特征相对其他特征的区分性互补信息;
S4、计算样本特征集中的每个特征与其所属样本对应的质量主观评分之间的相关性,根据每个特征与质量主观评分的相关性以及每个特征的区分性,选择第一个使二者之和最大的特征,构建初始的最优特征组;
S5、遍历剩余样本特征集,将剩余样本特征集的单个特征增补到最优特征组中,得到对应的候选特征集,计算候选特征集的互补信息熵,根据候选特征集中的每个特征与其所属样本对应的质量主观评分之间的相关性,以及候选特征集的互补信息熵,选择第t个使二者之和最大的特征,并加入到最优特征组;
S6、以岭回归模型作为语音客观质量评价模型,每一步筛选得到的最优特征组作为模型输入,模型输出该最优特征组所对应的样本的质量客观评分;
以样本的质量客观评分与样本的质量主观评分之间的皮尔逊相关系数作为语音客观质量评价指标,基于皮尔逊相关系数计算岭回归模型的性能提升指数,根据性能提升指数判断最优特征组是否收敛,若是,则判定当前的最优特征组构建完成,可用于实现语音客观质量评价;若否,则需要返回步骤S5继续拓展最优特征组。


2.根据权利要求1所述的基于区分性互补信息的语音客观评价最优特征组筛选方法,其特征在于,在步骤S1中,每个样本提取的多种待选特征,构成样本特征集,具体为:
S11、对样本进行滤波预处理,然后采用语音端点检测方法标注每个样本中的浊音帧、清音帧、无声帧;
S12、提取浊音帧的韵律特征的高阶统计量,以及频谱特征的高阶统计量,构建集合D={(fn,sn),n=1,2,...,N};
其中,fn表示第n个样本提取的特征;fn是一个M维的向量;M是单个样本的特征总数;韵律特征包括基频和基频抖动,频谱特征包括共振峰特征和高维的MFCC特征、高维的LPC特征、高维的LPCC特征、高维的LSP特征、线性预测信号的高维MFCC特征、线性预测残差信号的高维MFCC特征,高阶统计量包括均值、方差、偏峰和峰度;
S13、所有样本的第i个特征构成的集合表示为Fi={fin,i=1,2...,M;n=1,2...,N},fin代表第n个样本的第i个特征,样本特征集表示为F={F1,F2,...,FM}。


3.根据权利要求2所述的基于区分性互补信息的语音客观评价最优特征组筛选方法,其特征在于,步骤S2的过程如下:
S21、考虑到不同特征在数值上的差异较大,这里先对特征集F={F1,F2,...,FM}中的每一类特征进行归一化和中心化,得到处理后的特征集合使得每一类特征Fi的均值为0,方差为1,从而消除量纲和数量级影响;
S22、计算各特征之间的协方差矩阵



其中,rij代表样本特征集中的Fi和Fj之间的协方差,i=1,2...,M,j=1,2...,M;M代表需计算互补信息熵的特征集中的特征个数;协方差表征两个特征之间的相关性;
S23、由协方差矩阵的计算方法和矩阵性质得到,R为正定矩阵,所以对于R的任意的特征值λi>0,且λi是fn归一化和中心化之后的结果,计算样本特征集的互补信息熵HR:



其中,0≤HR≤1,如果HR为1,则各特征之间的协方差为0,相关性为0,样本特征集中不含有冗余信息,此时特征集的互补信息最大;如果HR<1,则样本特征集中含有冗余信息;HR值越大,特征集中的冗余信息越小,互补信息越大,各特征之间的区分性越好。


4.根据权利要求3所述的基于区分性互补信息的语音客观评价最优特征组筛选方法,其特征在于,步骤S3具体为:
按照步骤S2分别计算样本特征集在删除其不同的单个特征Fi情况下的互补信息熵计算HR与之间的差值,并将其作为特征Fi在样本特征集中相对于其它特征的区分性大小;
删除特征Fi后,如果互补信息熵增大,则说明特征Fi的冗余性较大;如果互补信息熵减小,则说明特征Fi的区分性较好。


5.根据权利要求2所述的基于区分性互补信息的语音客观评价最优特征组筛选方法,其特征在于,步骤S4具体如下:
S41、计算样本特征集F中单个特征Fi与其所属样本对应的质量主观评分的相关性:



得到样本特征集中所有特征与质量主观评分的相关性{ρi,i=1,2...

【专利技术属性】
技术研发人员:贺前华阳平苏健彬周密陈国强任丹丹李冬梅
申请(专利权)人:华南理工大学中国残疾人辅助器具中心广州音书科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1