抗噪感知敏感度曲线建立及语音合成方法技术

技术编号：26602139 阅读：69 留言：0更新日期：2020-12-04 21:25

本发明专利技术提供一种抗噪感知敏感度曲线建立及语音合成方法，包括使用带通滤波，将噪声按人耳感知的临界频带划分，得到若干临界频带噪声；针对每个临界频带噪声，按不同的噪声分贝级，录制对应的抗噪语音序列；基于SII客观测试指标确定感知阈值，对每个临界频带做噪声分贝级感知测试，得到更新后的临界分贝；根据更新后的临界分贝生成抗噪感知敏感度曲线；从抗噪感知敏感度曲线获取临界分贝值，选取不同临界分贝值的抗噪语音，训练抗噪语音特征映射模型，利用映射后的抗噪语音特征进行语音合成。本发明专利技术方法利用人们在噪声环境下的听觉特性，提出了一种抗噪感知敏感度曲线建立及语音合成方法，更有利于抗噪语音转换的实际应用场景。

全部详细技术资料下载

【技术实现步骤摘要】
抗噪感知敏感度曲线建立及语音合成方法
本专利技术属于声学
，尤其涉及一种抗噪感知敏感度曲线建立及语音合成方法。
技术介绍
等响度曲线是指典型听音者感知响度相同的纯音的声压级与频率关系的曲线。双耳测听的等响度曲线，其中阈值最低一条的虚线，即纯音最小可听声场，作为双耳测听的听阈曲线。响度主要决定于声强，提高声强，响度级也相应增加。但是声音的响度并不是单纯由声强决定的，还取决于频率，不同频率的纯音有不同的响度增长率，其中低频纯音的响度增长率比中频纯音要快。因此，和等响度曲线类似，说话人对环境噪声的感知在不同频率，不同噪声等级不同，相应触发的抗噪发声模式也不同。确定说话人对环境噪声分贝级变化的分辨阈值曲线，可以指导建立基于Lombard效应的抗噪发声模型，适时启动相应的抗噪语音转换，保证转换后的抗噪语音和各类真实噪声场景的一致性。然而，现有技术重点关注Lombard效应改变的声学特征，以及声学特征对提高抗噪语音的可懂度的重要性。由于缺乏抗噪感知敏感度的指导，会导致转换后的抗噪语音和真实场景不匹配，进而影响后续语音应用的体验。为了充分利用人们在不同的噪声环境下的感知特性，从听觉感知的角度，研究抗噪发声机理，建立说话人对环境噪声的感知敏感度曲线，解决目前抗噪语音发声缺乏听觉感知模型指导，导致抗噪语音转换与真实场景脱节的问题，本专利技术提出了一种抗噪感知敏感度曲线建立及语音合成方法。
技术实现思路
本专利技术为解决目前抗噪语音发声缺乏听觉感知模型指导的问题，缩小在频率上的细节性差异，提出了...

【技术保护点】
1.一种抗噪感知敏感度曲线建立方法，其特征在于：包括以下步骤，/n步骤1，使用带通滤波，将噪声按人耳感知的临界频带划分，得到若干临界频带噪声；/n步骤2，针对步骤1中每个临界频带噪声，按不同的噪声分贝级，录制对应的抗噪语音序列；/n步骤3，基于客观测试指标确定感知阈值，对每个临界频带做噪声分贝级感知测试，得到更新后的临界分贝；/n步骤4，根据步骤3所得更新后的临界分贝生成抗噪感知敏感度曲线。/n

【技术特征摘要】
1.一种抗噪感知敏感度曲线建立方法，其特征在于：包括以下步骤，
步骤1，使用带通滤波，将噪声按人耳感知的临界频带划分，得到若干临界频带噪声；
步骤2，针对步骤1中每个临界频带噪声，按不同的噪声分贝级，录制对应的抗噪语音序列；
步骤3，基于客观测试指标确定感知阈值，对每个临界频带做噪声分贝级感知测试，得到更新后的临界分贝；
步骤4，根据步骤3所得更新后的临界分贝生成抗噪感知敏感度曲线。

2.根据权利要求1所述抗噪感知敏感度曲线建立方法，其特征在于：步骤1中，所述噪声采用白噪声。

3.根据权利要求1所述抗噪感知敏感度曲线建立方法，其特征在于：步骤1中，所述人耳感知的临界频带使用Bark带或Mel带。

4.根据权利要求1所述抗噪感知敏感度曲线建立方法，其特征在于：步骤2的实现方式为，首先针对步骤1所得每个临界频带噪声，通过人工头采集数据，根据预设的信噪比对每个临界频带噪声进行相应调整，校准分贝级；然后针对每个临界频带噪声，对不同的分贝级，分别录制语音序列。

5.根据权利要求4所述抗噪感知敏感度曲线建立方法，其特征在于：根据预设的信噪比范围下限MIN和上限MAX、步长d，分别按信噪比为MIN、MIN+d、MIN+2d、…、MAX录制，得到相应的语音序列。

6.根据权利要求1所述抗噪感知敏感度曲线建立方法，其特...

【专利技术属性】
技术研发人员：杨玉红，冯佳倩，蔡林君，陈旭峰，刘青沐，郭佳昊，余洪江，涂卫平，艾浩军，王晓晨，高戈，
申请(专利权)人：武汉大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人