改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法制造技术

技术编号:23606783 阅读:70 留言:0更新日期:2020-03-28 07:23
本发明专利技术公开了改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法,其特征在于,对普通传统Mel频率尺度以及M

An improved ear speech enhancement algorithm based on Mel frequency scale and ear speech formant

【技术实现步骤摘要】
改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法
本专利技术涉及Mel频率尺度与耳语音增强算法领域,特别涉及改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法。
技术介绍
耳语音是人类交流过程中一种自然但又特殊的语言形式。耳语被定义为轻声说话但声带不振动以避免被偷听到的讲话方式。在许多公共场所,用耳语音进行交流是非常有必要的,如图书馆或会议厅等。耳语音的发声机制与正常语音不同。第一个不同之处在于,当耳语音发音时,声带没有振动,这点与噪声激励有点相似。第二个区别是气管和声道由于声带打开而耦合。正是由于这两个特点,尤其在嘈杂的环境中耳语音比正常语音更难检测。与正常语音相比,耳语音的第一共振峰频率向更高频率移动。同时,根据Sahar和John的研究表明,人耳对耳语音的敏感区域在第二共振峰频率附近,而不是在第一共振峰频率附近。目前,耳语音在国内外是比较新的研究课题,还处于研究初期。考虑到耳语音和正常语音之间声学特性的差异,传统的语音增强方法并不适用于耳语音增强。但是,在一定程度上,可以在传统语音增强算法的基础上对耳语音增强有一定的理论帮助。本专利技术要采用基于多频带谱减法来实现耳语音增强。耳语音的第一共振峰和第二共振峰频率与正常语音有所不同。因此,本文将根据这种差异来改进传统的Mel频率尺度频带划分,与此同时还将对耳语音共振峰进行提取,对需要增强处理的输入耳语音提取其第二共振峰以此来选取适合的频带的划分尺度,从而得到改进的耳语音增强算法。
技术实现思路
为了解决上述问题,本专利技术提供了改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法,采用客观评价和主观评价,来评价增强后耳语音的质量。为了实现上述目的,本专利技术的技术方案为:改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法,对普通传统Mel频率尺度以及Mm频率尺度根据耳语音的特点进行改进,将提出的新频率尺度称为Mimproved频率尺度,根据耳语音的感知特性,需要使用频率映射函数来抑制高、低频,增强中间频率,通常,考虑到耳语音的第二共振峰的频率范围约为1500-2500Hz,则在这种情况下两者频率的映射假设如下:式中,f为耳语音线性频率,C和q为假设的未知常数;为满足映射函数的连续性及对第二共振峰频率权值的加重,Mimproved频率尺度的频率映射公式计算出来为:同样的思想,当输入耳语音信号的第二共振峰在1000Hz至1500Hz之间,则需要加重该频段的尺度权重,因此可以计算出在这种情况下的Mel频率尺度频带划分表达式:若输入耳语音信号的第二共振峰在1500Hz至2000Hz之间以及2500Hz至3000Hz之间时,其频带划分尺度分别为如下:依照上述规律,当耳语音的第二共振峰频率处于除上述情况之外时,则采用提出的改进Mimproved频率尺度,如公式(2)所示,根据提取的耳语音信号第二共振峰频率范围来选择上述改进的Mel频率尺度划分频带;经过上述的耳语音共振峰频率与频带划分相结合,增强后的耳语音功率谱可由下式得到:其中,xi<ω<xi+1,这里xi和xi+1分别表示为第i个频带中的起始频点和结束频点,αi与β′分别是第i个频带中的过减因子和谱下限,过减因子由分段信噪比构成的函数来控制每个子带中去除噪声的程度,而谱下限代表着每个频带的权重值,为各个频带之间提供更大的灵活性;|Yi(ω)|2是带噪耳语音功率谱,表示更新的噪声功率谱;各个频带中的过减因子可表示如下:式中,αmax=5,αmin=1,SNRmin=-5dB,SNRmax=20dB,其中第i个频带的分段信噪比为:其中,和是第i个频带中的带噪耳语音功率谱和噪声功率谱,X是频带划分的总频带数;公式(6)中的比例因子δi可以提供附加控制去噪程度,根据耳语音特性分析可知该值可设为如下:式中,fi代表第i个频带中的上界频率,Fs是信号的采样频率。与现有技术相比,本专利技术的有益效果:根据人耳对耳语音的特性分析,对现有的Mel频率尺度进行改进;其次,采用能熵比法进行有话段的检测,再在有话段处用线性预测LPC法提取耳语音信号的第二共振峰频率,根据第二共振峰频率选择合适的频率尺度在各个频带内单独地进行功率谱减。该算法试图在耳语音失真、噪声降低和残余音乐噪声水平之间找到一个平衡。客观评价和主观评价表明,该算法优于同类可比较的耳语音增强算法。附图说明图1是本专利技术的四种不同节点下的Mel频率尺度与线性频率之间的映射关系图。图2是本专利技术的耳语音增强算法框图。图3是本专利技术的对不同噪声类型在不同输入信噪比下几种算法的信噪比提高示意图。图4是本专利技术的对不同噪声类型在不同输入信噪比下几种算法的PESQ图。图5是本专利技术的耳语音语谱图。图6是本专利技术的残余噪声的独立测试给出测试结果的平均值。图7是本专利技术的耳语音失真度的独立测试给出测试结果的平均值。具体实施方式下面将对本专利技术实施例中的技术方案结合附图进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1,图1至图7所示:改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法,对普通传统Mel频率尺度以及Mm频率尺度根据耳语音的特点进行改进,将提出的新频率尺度称为Mimproved频率尺度,根据耳语音的感知特性,需要使用频率映射函数来抑制高、低频,增强中间频率,通常,考虑到耳语音的第二共振峰的频率范围约为1500-2500Hz,则在这种情况下两者频率的映射假设如下:式中,f为耳语音线性频率,C和q为假设的未知常数;为满足映射函数的连续性及对第二共振峰频率权值的加重,Mimproved频率尺度的频率映射公式计算出来为:同样的思想,当输入耳语音信号的第二共振峰在1000Hz至1500Hz之间,则需要加重该频段的尺度权重,因此可以计算出在这种情况下的Mel频率尺度频带划分表达式:若输入耳语音信号的第二共振峰在1500Hz至2000Hz之间以及2500Hz至3000Hz之间时,其频带划分尺度分别为如下:依照上述规律,当耳语音的第二共振峰频率处于除上述情况之外时,则采用提出的改进Mimproved频率尺度,如公式(2)所示,根据提取的耳语音信号第二共振峰频率范围来选择上述改进的Mel频率尺度划分频带;经过上述的耳语音共振峰频率与频带划分相结合,增强后的耳语音功率谱可由下式得到:其中,xi<ω<xi+1,这里xi和xi+1分别表示为第i个频带中的起始频点和结束频点,αi与β′分别是第i个频带中的过减因子和谱下限,过减因子由分段信本文档来自技高网...

【技术保护点】
1.改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法,其特征在于,对普通传统Mel频率尺度以及M

【技术特征摘要】
1.改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法,其特征在于,对普通传统Mel频率尺度以及Mm频率尺度根据耳语音的特点进行改进,将提出的新频率尺度称为Mimproved频率尺度,根据耳语音的感知特性,需要使用频率映射函数来抑制高、低频,增强中间频率,通常,考虑到耳语音的第二共振峰的频率范围约为1500-2500Hz,则在这种情况下两者频率的映射假设如下:



式中,f为耳语音线性频率,C和q为假设的未知常数;
为满足映射函数的连续性及对第二共振峰频率权值的加重,Mimproved频率尺度的频率映射公式计算出来为:



同样的思想,当输入耳语音信号的第二共振峰在1000Hz至1500Hz之间,则需要加重该频段的尺度权重,因此可以计算出在这种情况下的Mel频率尺度频带划分表达式:



若输入耳语音信号的第二共振峰在1500Hz至2000Hz之间以及2500Hz至3000Hz之间时,其频带划分尺度分别为如下:






依照上述规律,当耳语音的第二共振峰频率处于除上述情况之外时,则采用提出的改进M...

【专利技术属性】
技术研发人员:李晨韦怡曾毓敏
申请(专利权)人:南京师范大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1