多通道噪音抑制方法和设备技术

技术编号:38821091 阅读:28 留言:0更新日期:2023-09-15 20:00
本发明专利技术的实施例提供了多通道噪音抑制方法、装置和设备。所述方法包括获取音频信号,所述音频信号包括人声信号和噪声信号;对所述音频信号进行人声特征提取,得到目标人声信号;对所述目标人声信号进行预处理,将预处理后的信号进行小波变换,得到每一帧受噪声影响最大的小波系数;对所述目标人声信号进行滤波,滤除受噪声影响最大的小波系数;对滤波后的目标人声信号进行重构,得到降噪的音频数据。以此方式,可以有效地减少音频中不同类型的噪声,尽可能地保留原始音频的信号信息,并且在去除噪声的同时能够保持语音的清晰度和自然度。噪声的同时能够保持语音的清晰度和自然度。噪声的同时能够保持语音的清晰度和自然度。

【技术实现步骤摘要】
多通道噪音抑制方法和设备


[0001]本专利技术一般涉及数字音频信号处理领域,并且更具体地,涉及多通道噪音抑制方法和设备。

技术介绍

[0002]视频门禁对讲机就是安装在门禁系统上,能够进行视频通话的对讲机。在对讲过程中,由于对讲机外部环境复杂,麦克风在收集人声的同时,往往还会收集到噪声,使对讲中的音频信号质量不高,从而需要进一步进行音频降噪处理。
[0003]现有的音频降噪技术中,基于频域滤波,小波变换和麦克风阵列的方法成为了主流方案。然而,这些方法也存在着一些缺点,限制了它们的应用范围和效果。例如,频域滤波容易导致原始语音信号失真和相关性丢失;小波变换需要复杂的超参数选择和滤波器设计,可能会产生计算复杂度高和信息损失等问题;基于麦克风阵列的方法则需要高昂的硬件成本和复杂的系统架构等。

技术实现思路

[0004]根据本专利技术的实施例,提供了一种多通道噪音抑制方案。本方案可以有效地减少音频中不同类型的噪声,尽可能地保留原始音频的信号信息,并且在去除噪声的同时能够保持语音的清晰度和自然度。
[0005]在本专利技本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多通道噪音抑制方法,其特征在于,包括:获取音频信号,所述音频信号包括人声信号和噪声信号;对所述音频信号进行人声特征提取,得到目标人声信号;对所述目标人声信号进行预处理,将预处理后的信号进行小波变换,得到每一帧受噪声影响最大的小波系数;对所述目标人声信号进行滤波,滤除受噪声影响最大的小波系数;对滤波后的目标人声信号进行重构,得到降噪的音频数据。2.根据权利要求1所述的方法,其特征在于,所述对所述音频信号进行人声特征提取,得到目标人声信号,包括:将所述音频信号转换为时域数据;对所述时域数据进行频域分析,得到声音频谱数据;对所述声音频谱数据进行滤波,得到目标人声信号。3.根据权利要求2所述的方法,其特征在于,所述对所述声音频谱数据进行滤波,得到目标人声信号,包括:对于所述声音频谱数据进行傅里叶变换,得到频率域上的复数谱;计算所述复数谱的幅度信息;将幅度谱转化为对数刻度下的梅尔频谱;将所述梅尔频谱作用于一组梅尔滤波器,得到人声音频数据。4.根据权利要求1所述的方法,其特征在于,所述对所述目标人声信号进行预处理,将预处理后的信号进行小波变换,得到不同尺度下的小波系数,包括:将所述目标人声信号进行分帧和加窗处理;对加窗后的目标人声信号进行信号特点判断;所述信号特点包括平稳性、可导性和突变性;对每一帧信号进行小波变换,得到每个子带的小波系数;根据所述信号的平稳性、可导性和突变性特点,计算出每一帧受噪声影响最大的小波系数。5.根据权利要求4所述的方法,其特征在于,所述对所述目标人声信号进行信号特点判断,包括:平稳性判断:将加窗后的目标人声信号进行功率频谱密度计算,若功率频谱密度的自相关函数在整个时间范围内保持不变,则信号为平稳信号;若功率频谱密度的自相关函数存在周期性变化或变化趋势,则信号为非平稳信号;可导性判断:将加窗后的目标人声信号转为数学函数表达式,对所述数学函数表达式求导,若存在导数,则信号为可导信号,若在所述数学函数表达式中的每个时间点都存在导数,则信号为连续可导信号;若不存在导数,则信号为不可导信号;突变性判断:将加窗后的目标人声信号进行帧化,将每一帧看作一个局部信号,对每一帧信号进行傅里叶变换得到对应的频谱,计算频谱的相位并根据相位计算相邻两帧之间的频率变化

【专利技术属性】
技术研发人员:葛志远范忠柳娄虹张宇
申请(专利权)人:沈阳卡得智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1