语音降噪方法、装置、耳机和存储介质制造方法及图纸

技术编号：41420920 阅读：13 留言：0更新日期：2024-05-28 20:21

本申请公开了一种语音降噪方法、装置、耳机和存储介质，该方法通过对时频域特征数据的平滑能量谱进行非线性压缩，并基于时频域特征数据与非线性压缩结果的比值确定第一PCEN特征数据，实现了更加稳定高效的对时频域特征数据进行归一化处理，并基于时频域特征数据和第一PCEN特征数据的比较结果生成第二PCEN特征数据，使第二PCEN特征数据的能量更加合理，从而避免了在归一化时放大噪声的问题，实现了更加有效的进行语音降噪。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及音频处理，特别涉及一种语音降噪方法、装置、耳机和存储介质。

技术介绍

1、随着技术的发展，通话降噪技术得到广泛的应用，然而，受限于硬件条件，端侧的通话降噪模型往往比较轻量化，用于大风噪、地铁等低信噪比的环境时，会出现人声失真或降噪力度不够的情况，从而导致用户听感不佳。

2、为了提高降噪模型的降噪能力，现有技术中，存在利用pcen(per-channel energynormalization，每通道能量归一化)技术对语音进行归一化操作的处理方式，该方式可有效提高小信号的能量，增强降噪模型的识别能力，但其也会造成噪声进一步扩大，在一些低信噪比环境下的降噪效果较差。

3、因此，如何更加有效的进行语音降噪，是目前有待解决的技术问题。

技术实现思路

1、本申请旨在提供一种语音降噪方法、装置、耳机和存储介质，基于时频域特征数据与经非线性压缩后的平滑能量谱确定第一pcen特征数据，并基于时频域特征数据和第一pcen特征数据的比较结果生成第二pcen特征数据，所述语音降...

【技术保护点】

1.一种语音降噪方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，基于所述时频域特征数据和所述第一PCEN特征数据的比较结果，生成第二PCEN特征数据，包括：

3.如权利要求1所述的方法，其特征在于，

4.如权利要求3所述的方法，其特征在于，将α设为0.5。

5.如权利要求1所述的方法，其特征在于，所述语音降噪模型的训练过程包括：

6.如权利要求5所述的方法，其特征在于，所述预设样本语音数据包括所述样本语音和与所述样本语音对应的样本掩膜增益系数，基于与所述样本时频域特征数据对应的第二PCEN特征数据对预设...

【技术特征摘要】

1.一种语音降噪方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，基于所述时频域特征数据和所述第一pcen特征数据的比较结果，生成第二pcen特征数据，包括：

3.如权利要求1所述的方法，其特征在于，

4.如权利要求3所述的方法，其特征在于，将α设为0.5。

5.如权利要求1所述的方法，其特征在于，所述语音降噪模型的训练过程包括：

6.如权利要求5所述的方法，其特征在于，所述预设样本语音数据包括所述样本语音和与所述样本语音对应的样本掩膜增益系数，基于与所述样本时频域特征数据对应的第二pcen特征数据对预设神经网...

【专利技术属性】
技术研发人员：吴涛，
申请(专利权)人：恒玄科技上海股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人