当前位置: 首页 > 专利查询>武汉大学专利>正文

抗噪感知敏感度曲线建立及语音合成方法技术

技术编号:26602139 阅读:69 留言:0更新日期:2020-12-04 21:25
本发明专利技术提供一种抗噪感知敏感度曲线建立及语音合成方法,包括使用带通滤波,将噪声按人耳感知的临界频带划分,得到若干临界频带噪声;针对每个临界频带噪声,按不同的噪声分贝级,录制对应的抗噪语音序列;基于SII客观测试指标确定感知阈值,对每个临界频带做噪声分贝级感知测试,得到更新后的临界分贝;根据更新后的临界分贝生成抗噪感知敏感度曲线;从抗噪感知敏感度曲线获取临界分贝值,选取不同临界分贝值的抗噪语音,训练抗噪语音特征映射模型,利用映射后的抗噪语音特征进行语音合成。本发明专利技术方法利用人们在噪声环境下的听觉特性,提出了一种抗噪感知敏感度曲线建立及语音合成方法,更有利于抗噪语音转换的实际应用场景。

【技术实现步骤摘要】
抗噪感知敏感度曲线建立及语音合成方法
本专利技术属于声学
,尤其涉及一种抗噪感知敏感度曲线建立及语音合成方法。
技术介绍
等响度曲线是指典型听音者感知响度相同的纯音的声压级与频率关系的曲线。双耳测听的等响度曲线,其中阈值最低一条的虚线,即纯音最小可听声场,作为双耳测听的听阈曲线。响度主要决定于声强,提高声强,响度级也相应增加。但是声音的响度并不是单纯由声强决定的,还取决于频率,不同频率的纯音有不同的响度增长率,其中低频纯音的响度增长率比中频纯音要快。因此,和等响度曲线类似,说话人对环境噪声的感知在不同频率,不同噪声等级不同,相应触发的抗噪发声模式也不同。确定说话人对环境噪声分贝级变化的分辨阈值曲线,可以指导建立基于Lombard效应的抗噪发声模型,适时启动相应的抗噪语音转换,保证转换后的抗噪语音和各类真实噪声场景的一致性。然而,现有技术重点关注Lombard效应改变的声学特征,以及声学特征对提高抗噪语音的可懂度的重要性。由于缺乏抗噪感知敏感度的指导,会导致转换后的抗噪语音和真实场景不匹配,进而影响后续语音应用的体验。为了充分利用人们在不同的噪声环境下的感知特性,从听觉感知的角度,研究抗噪发声机理,建立说话人对环境噪声的感知敏感度曲线,解决目前抗噪语音发声缺乏听觉感知模型指导,导致抗噪语音转换与真实场景脱节的问题,本专利技术提出了一种抗噪感知敏感度曲线建立及语音合成方法。
技术实现思路
本专利技术为解决目前抗噪语音发声缺乏听觉感知模型指导的问题,缩小在频率上的细节性差异,提出了一种抗噪感知敏感度曲线建立及语音合成方法。本专利技术所采用的技术方案是一种抗噪感知敏感度曲线建立方法,包括以下步骤,步骤1,使用带通滤波,将噪声按人耳感知的临界频带划分,得到若干临界频带噪声;步骤2,针对步骤1中每个临界频带噪声,按不同的噪声分贝级,录制对应的抗噪语音序列;步骤3,基于SII客观测试指标确定感知阈值,对每个临界频带做噪声分贝级感知测试,得到更新后的临界分贝;步骤4,根据步骤3所得更新后的临界分贝生成抗噪感知敏感度曲线。而且,步骤1中,所述噪声采用白噪声。而且,步骤1中,所述人耳感知的临界频带使用Bark带或Mel带。而且,步骤2的实现方式为,首先针对步骤1所得每个临界频带噪声,通过人工头采集数据,根据预设的信噪比对每个临界频带噪声进行相应调整,校准分贝级;然后针对每个临界频带噪声,对不同的分贝级,分别录制语音序列。而且,根据预设的信噪比范围下限MIN和上限MAX、步长d,分别按信噪比为MIN、MIN+d、MIN+2d、…、MAX录制,得到相应的语音序列。而且,步骤3中,对每个临界频带做噪声分贝级感知测试采用MUSHRA标准实现。本专利技术还提供一种基于抗噪感知敏感度曲线建立的语音合成方法,包括以下步骤,步骤1,使用带通滤波,将噪声按人耳感知的临界频带划分,得到若干临界频带噪声;步骤2,针对步骤1中每个临界频带噪声,按不同的噪声分贝级,录制对应的抗噪语音序列;步骤3,基于SII客观测试指标确定感知阈值,对每个临界频带做噪声分贝级感知测试,得到更新后的临界分贝;步骤4,根据步骤3所得更新后的临界分贝生成抗噪感知敏感度曲线;步骤5,从步骤4所得抗噪感知敏感度曲线获取临界分贝值,选取不同临界分贝值的抗噪语音,训练抗噪语音特征映射模型,利用映射后的抗噪语音特征进行语音合成。而且,步骤5中,采用WORLD声码器提取声学特征,所述包括基频和频谱包络。而且,步骤5中,所述抗噪语音特征映射模型是采用高斯混合模型,使用EM方法对频谱包络训练得到的。而且,基于抗噪语音特征映射模型所得频谱包络特征转换结果,并结合基频特征进行语音合成。本专利技术方法利用人们在噪声环境下的听觉特性和特殊的发声机理,提出了一种抗噪感知敏感度曲线建立及语音合成方法,更有利于抗噪语音转换的实际应用场景,准确性高,具有广泛的应用前景,例如在语音分离和会议转录的实际应用中需要大量的抗噪语音数据集,该专利技术方法能为此提供指导性意见,并合成需要的数据集。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。本专利技术提供的方法能够用计算机软件技术和其他硬件设备实现流程,以下是对本专利技术的流程进行一个具体的阐述。实施例一本专利技术实施例一提供的一种基于抗噪感知敏感度曲线建立的语音合成方法,具体实施步骤如下:步骤1:使用带通滤波,将噪声按人耳感知的临界频带划分,得到若干临界频带噪声;本实施例中使用的噪声是白噪声,人耳感知的临界频带使用Bark带,利用带通滤波,将白噪声按Bark带划分。步骤2:针对步骤1中所得每个临界频带噪声,按不同的噪声分贝级,录制对应的抗噪语音序列;针对步骤2,本实施例可以采用以下步骤实现:步骤2.1:针对步骤1中每个Bark带噪声,通过人工头采集数据,根据预设的信噪比对每个Bark带噪声进行相应调整,校准分贝级。考虑到常见场景噪声为35dB左右,人耳听觉痛阈为85dB,实施例中预设的信噪比范围为40-85dB,即MIN=40,MAX=85,步长d为5dB。对每个Bark带噪声,分别按信噪比为40、45、…80、85dB录制,得到相应的语音数据。实施例优选采用的录音材料和具体设置如下:实施例采用人工头设备进行录制,例如G.R.A.S.KEMAR45BA1/2英寸低噪声耳模拟系统,包含高仿真延伸耳道。为了避免墙壁反射等其他噪音,人工头戴耳机,耳机内播放各类环境噪声,人工头录音,可以得到准确的信噪比。本领域中信噪比计算方式如下:其中,s(n)为语音信号,d(n)为噪声信号,ps为语音信号功率,pd为噪声信号功率,其中n为采样点,N为采样点长度。步骤2.2:针对每个Bark带噪声,对不同的分贝级,分别录制语音序列。具体实施时,可以每个说话人佩戴耳机,耳机播放步骤2.1中校准后的噪声,针对每个Bark带噪声,对不同的分贝级,录制每个说话人的语音序列。实施例方案的相应实验在武汉大学的消音室进行,使用高保真麦克风进行录制,得到对应分贝级的语音数据。具体实施,可以预先进行步骤1和步骤2,作为输入数据。步骤3:基于语音可懂度指数(Speechintelligibilityindex,SII)客观测试指标确定感知阈值,然后使用MUSHRA(Multi-StimulusTestwithHiddenReferenceandAnchor)标准对每个临界频带做噪声分贝级感知测试,得到更新后的临界分贝;具体实施时,还可以采用其他客观测试指标,例如;也可以采用其他标准进行测试,例如清晰度指数(ArticulationIndex,AI)本文档来自技高网...

【技术保护点】
1.一种抗噪感知敏感度曲线建立方法,其特征在于:包括以下步骤,/n步骤1,使用带通滤波,将噪声按人耳感知的临界频带划分,得到若干临界频带噪声;/n步骤2,针对步骤1中每个临界频带噪声,按不同的噪声分贝级,录制对应的抗噪语音序列;/n步骤3,基于客观测试指标确定感知阈值,对每个临界频带做噪声分贝级感知测试,得到更新后的临界分贝;/n步骤4,根据步骤3所得更新后的临界分贝生成抗噪感知敏感度曲线。/n

【技术特征摘要】
1.一种抗噪感知敏感度曲线建立方法,其特征在于:包括以下步骤,
步骤1,使用带通滤波,将噪声按人耳感知的临界频带划分,得到若干临界频带噪声;
步骤2,针对步骤1中每个临界频带噪声,按不同的噪声分贝级,录制对应的抗噪语音序列;
步骤3,基于客观测试指标确定感知阈值,对每个临界频带做噪声分贝级感知测试,得到更新后的临界分贝;
步骤4,根据步骤3所得更新后的临界分贝生成抗噪感知敏感度曲线。


2.根据权利要求1所述抗噪感知敏感度曲线建立方法,其特征在于:步骤1中,所述噪声采用白噪声。


3.根据权利要求1所述抗噪感知敏感度曲线建立方法,其特征在于:步骤1中,所述人耳感知的临界频带使用Bark带或Mel带。


4.根据权利要求1所述抗噪感知敏感度曲线建立方法,其特征在于:步骤2的实现方式为,首先针对步骤1所得每个临界频带噪声,通过人工头采集数据,根据预设的信噪比对每个临界频带噪声进行相应调整,校准分贝级;然后针对每个临界频带噪声,对不同的分贝级,分别录制语音序列。


5.根据权利要求4所述抗噪感知敏感度曲线建立方法,其特征在于:根据预设的信噪比范围下限MIN和上限MAX、步长d,分别按信噪比为MIN、MIN+d、MIN+2d、…、MAX录制,得到相应的语音序列。


6.根据权利要求1所述抗噪感知敏感度曲线建立方法,其特...

【专利技术属性】
技术研发人员:杨玉红冯佳倩蔡林君陈旭峰刘青沐郭佳昊余洪江涂卫平艾浩军王晓晨高戈
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1