噪声检测及压制方法、装置、终端设备和系统、芯片制造方法及图纸

技术编号:28119078 阅读:14 留言:0更新日期:2021-04-19 11:22
本发明专利技术公开了一种噪声检测及压制方法、装置、终端设备和系统、芯片,噪声检测方法包括:步骤S100,将在时域上连续获取的若干帧原始音频信号转换为频域上的若干帧第一频域信号,原始音频信号包含噪声信号和语音信号;步骤S200,对若干帧第一频域信号分别进行子带划分得到子带能量谱;步骤S300,基于局部最小值的噪声估算法求取得到第一噪声;步骤S400,基于VAD的噪声估算法得到第二噪声;步骤S500,对当前第一噪声和当前第二噪声进行加权组合得到当前频域上的噪声信号。一方面能够检测到平稳的噪声,另一方面又能抵抗噪声的变化,识别到变化的噪声。继而,提高噪声识别的准确性。提高噪声识别的准确性。提高噪声识别的准确性。

【技术实现步骤摘要】
噪声检测及压制方法、装置、终端设备和系统、芯片


[0001]本专利技术涉及音频数据处理
,具体涉及一种噪声检测及压制方法、装置、终端设备和系统、芯片。

技术介绍

[0002]随着音频设备的普及,应用于直播、K歌、会议室等诸多环境,但麦克风不能主动识别并区分语音和噪声,通常,麦克风会同时采集到语音和外界噪声。如果未通过抑制处理或降噪处理,噪声通过扬声器放大,对语音的音频内容造成干扰,给用户带来了较差的体验。为了保证采集的语音尽量清晰就需要降噪,降噪的前提就需要检测噪声信号,从而保证降噪的同时不能损伤语音信号。
[0003]传统的方案中,设置能量阈值,通过计算能量、采用阈值的办法判断是否是语音。对于这种方案,需要根据适用场景不同来设置不同的阈值,定义的标准不同,只适用于噪声比较单一的环境,当环境比较嘈杂的时,整个信号的能量都会持续比较大。此时能量阈值的方法基本失效。
[0004]现有技术中,也存在采用局部最小值的噪声估算方法(以下简称最小值估算法)、基于语音活动检测(Voice Activity Detection,VAD)的噪声估计算法(以下简称基于VAD估算法)来实现噪声的检测。总体而言,最小值估算法能够比较好地区分平稳的噪声信号和语音信号;基于VAD估算法能够快速估算噪声。
[0005]经申请人研究发现,当噪声发生幅值变化时,最小值估算法则可能将该发生变化的噪声误认为是语音,也就是,最小值估算法无法抵抗幅度变化,容易出现漏检噪声的情况;而,基于VAD估算法,由于噪声估算的更新速度过快,容易导致误检噪声,也就是,将语音错误地估计为噪声,由此导致对语音等有用信号带来了损害。
[0006]因此,如何提高噪声识别的准确性成为亟待解决的第一技术问题。
[0007]此外,如何快速地对噪声进行压制,提升输出音频的音质成为亟待解决的第二技术问题。

技术实现思路

[0008]基于上述现状,本专利技术的主要目的在于提供一种噪声检测及压制方法、装置、终端设备和系统、芯片,以提高噪声识别的准确性。
[0009]为实现上述目的,本专利技术采用的技术方案如下:
[0010]第一方面,本专利技术实施例公开了一种噪声检测方法,包括:
[0011]步骤S100,将在时域上连续获取的若干帧原始音频信号转换为频域上的若干帧第一频域信号,原始音频信号包含噪声信号和语音信号;步骤S200,对若干帧第一频域信号分别进行子带划分得到子带能量谱;步骤S300,基于局部最小值的噪声估算法求取得到第一噪声;步骤S400,基于VAD的噪声估算法得到第二噪声;步骤S500,对当前第一噪声和当前第二噪声进行加权组合得到当前频域上的噪声信号。
[0012]可选地,步骤S300包括:确定当前子带能量和前次第一噪声中较小的信号;对较小的信号和当前子带能量进行加权得到当前第一噪声。
[0013]可选地,步骤S400包括:步骤S400-1,计算长时子带能量;步骤S400-2,基于长时子带能量和当前子带能量计算当前的语音概率,当前的语音概率表示当前信号属于语音信号的概率;
[0014]步骤S400-3,通过长时子带能量和语音概率得到当前第二噪声;在步骤S500中,基于语音概率对当前第一噪声和当前第二噪声进行加权组合得到当前频域上的噪声信号。
[0015]可选地,步骤S400-2包括:采用如下公式计算长时子带能量和当前子带能量的相关程度:cr=sum(x2.*y2)/(sqrt(sum(x2.*x2)*sum(y2.*y2))),其中,cr为相关程度,x2为长时子带能量的去均值,y2当前子带能量的去均值;sum()为求和,sqrt()为平方根计算;采用如下公式计算当前的语音概率:s_p=1-cr*kr,其中,s_p为当前的语音概率,kr为常系数。
[0016]可选地,在计算相关程度和计算语音概率之间,还包括:判断相关程度是否小于第一阈值;如果相关程度小于第一阈值,则将第一阈值赋值于相关程度;判断相关程度是否大于第二阈值,第一阈值小于第二阈值;如果相关程度大于第二阈值,则将第二阈值赋值于相关程度。
[0017]可选地,在步骤S400-3中,采用如下公式计算得到当前第二噪声:es_n(i)=((es_n(i-1)*s_p)+X_mean*(1-s_p))*k1+es_n(i-1)*(1-k1),其中,es_n(i)为当前第二噪声,es_n(i-1)为前次第二噪声,X_mean为当前的长时子带能量,k1为常系数。
[0018]可选地,在步骤S500中,采用如下公式计算得到当前频域上的噪声信号:n_f(i)=(B_n(i)*(1-k3(i))+es_n(i)*k3(i))*k2+(1-k2)*n_f(i-1);其中,n_f(i)为当前频域上的噪声信号;n_f(i-1)为前次频域上的噪声信号;k2为0-1之间的常系数,k3(i)为与当前语音概率s_p(i)相关的系数。
[0019]可选地,在步骤S200之后,还包括:对当前子带能量进行归一化处理得到归一化后的当前子带能量;在步骤S300和步骤S400中,采用归一化的当前子带能量得到当前第一噪声和当前第二噪声。
[0020]第二方面,本专利技术实施例公开了一种噪声压制方法,包括:
[0021]B100,获取当前频域上的噪声信号,当前频域上的噪声信号采用第一方面公开的噪声检测方法检测得到;B200,在频域上,对若干帧第一频域信号进行压制得到压制噪声后的频域信号;B300,将压制噪声后的频域信号转化为时域信号得到降噪后的时域音频信号。
[0022]可选地,步骤B200包括:步骤B200-1,基于当前频域上的噪声信号得到当前的压制系数数组;步骤B200-2,在频域上,采用压制系数数组中的系数与若干帧第一频域信号的频谱进行相乘得到若干帧第二频域信号的频谱,第二频域信号为压制后的频域信号;步骤B200-3,对第二频域信号进行滤波处理,得到压制噪声后的频域信号。
[0023]可选地,步骤B200-1包括:根据第一频域信号和当前频域上的噪声信号得到当前第一频域信号在当前频域噪声谱上的投影信号;依据投影信号得到当前的压制系数数组。
[0024]第三方面,本专利技术实施例公开了一种噪声检测装置,包括:
[0025]第一转换模块用于将在时域上连续获取的若干帧原始音频信号转换为频域上的若干帧第一频域信号,原始音频信号包含噪声信号和语音信号;子带划分模块,用于对若干
帧第一频域信号分别进行子带划分得到子带能量谱;第一噪声求取模块,用于基于局部最小值的噪声估算法求取得到第一噪声;第二噪声估算模块,用于基于VAD的噪声估算法得到当前第二噪声;当前噪声组合模块,用于对当前第一噪声和当前第二噪声进行加权组合得到当前频域上的噪声信号。
[0026]可选地,第一噪声求取模块包括:较小信号确定单元,用于确定当前子带能量和前次第一噪声中较小的信号;加权单元,用于对较小的信号和当前子带能量进行加权得到当前第一噪声。
[0027本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种噪声检测方法,其特征在于,包括:步骤S100,将在时域上连续获取的若干帧原始音频信号转换为频域上的若干帧第一频域信号,所述原始音频信号包含噪声信号和语音信号;步骤S200,对所述若干帧第一频域信号分别进行子带划分得到子带能量谱;步骤S300,基于局部最小值的噪声估算法求取得到第一噪声;步骤S400,基于VAD的噪声估算法得到第二噪声;步骤S500,对当前第一噪声和当前第二噪声进行加权组合得到当前频域上的噪声信号。2.如权利要求1所述的噪声检测方法,其特征在于,所述步骤S300包括:确定所述当前子带能量和所述前次第一噪声中较小的信号;对所述较小的信号和所述当前子带能量进行加权得到所述当前第一噪声。3.如权利要求1所述的噪声检测方法,其特征在于,所述步骤S400包括:步骤S400-1,计算长时子带能量;步骤S400-2,基于所述长时子带能量和当前子带能量计算当前的语音概率,所述当前的语音概率表示当前信号属于语音信号的概率;步骤S400-3,通过所述长时子带能量和所述语音概率得到所述当前第二噪声;在所述步骤S500中,基于所述语音概率对所述当前第一噪声和所述当前第二噪声进行加权组合得到当前频域上的噪声信号。4.如权利要求3所述的噪声检测方法,其特征在于,所述步骤S400-2包括:采用如下公式计算所述长时子带能量和所述当前子带能量的相关程度:cr=sum(x2.*y2)/(sqrt(sum(x2.*x2)*sum(y2.*y2))),其中,cr为所述相关程度,x2为所述长时子带能量的去均值,y2所述当前子带能量的去均值;sum()为求和,sqrt()为平方根计算;采用如下公式计算所述当前的语音概率:s_p=1-cr*kr,其中,s_p为所述当前的语音概率,kr为常系数。5.如权利要求4所述的噪声检测方法,其特征在于,在计算所述相关程度和所述计算语音概率之间,还包括:判断所述相关程度是否小于第一阈值;如果所述相关程度小于所述第一阈值,则将所述第一阈值赋值于所述相关程度;判断所述相关程度是否大于第二阈值,所述第一阈值小于所述第二阈值;如果所述相关程度大于所述第二阈值,则将所述第二阈值赋值于所述相关程度。6.如权利要求5所述的噪声检测方法,其特征在于,在所述步骤S400-3中,采用如下公式计算得到所述当前第二噪声:es_n(i)=((es_n(i-1)*s_p)+X_mean*(1-s_p))*k1+es_n(i-1)*(1-k1),其中,es_n(i)为所述当前第二噪声,es_n(i-1)为前次第二噪声,X_mean为当前的长时子带能量,k1为常系数。7.如权利要求4-6任意一项所述的噪声检测方法,其特征在于,在所述步骤S500中,采用如下公式计算得到所述当前频域上的噪声信号:
n_f(i)=(B_n(i)*(1-k3(i))+es_n(i)*k3(i))*k2+(1-k2)*n_f(i-1);其中,n_f(i)为当前频域上的噪声信号;n_f(i-1)为前次频域上的噪声信号;k2为0-1之间的常系数,k3(i)为与当前语音概率s_p(i)相关的系数。8.如权利要求1-3任意一项所述的噪声检测方法,其特征在于,在所述步骤S200之后,还包括:对当前子带能量进行归一化处理得到归一化后的当前子带能量;在所述步骤S300和所述步骤S400中,采用归一化的当前子带能量得到所述当前第一噪声和所述当前第二噪声。9.一种噪声压制方法,其特征在于,包括:B100,获取当前频域上的噪声信号,所述当前频域上的噪声信号采用如权利要求1-8任意一项所述的噪声检测方法检测得到;B200,在频域上,对所述若干帧第一频域信号进行压制得到压制噪声后的频域信号;B300,将所述压制噪声后的频域信号转化为时域信号得到降噪后的时域音频信号。10.如权利要求9所述的噪声压制方法,其特征在于,所述步骤B200包括:步骤B200-1,基于所述当前频域上的噪声信号得到当前的压制系数数组;步骤B200-2,在频域上,采用所述压制系数数组中的系数与所述若干帧第一频域信号的频谱进行相乘得到若干帧第二频域信号的频谱,所述第二频域信号为压制后的频域信号;步骤B200-3,对所述第二频域信号进行滤波处理,得到所述压制噪声后的频域信号。11.如权利要求10所述的噪声压制方法,其特征在于,所述步骤B200-1包括:根据所述第一频域信号和所述当前频域上的噪声信号得到当前所述第一频域信号在当前频域噪声谱上的投影信号(P);依据所述投影信号(P)得到所述当前的压制系数数组。12.一种噪声检测装置,其特征在于,包括:第一转换模块(100),用于将在时域上连续获取的若干帧原始音频信号转换为频域上的若干帧第一频域信号,所述原始音频信号包含噪声信号和语音信号;子带划分模块(200),用于对所述若干帧第一频域信号分别进行子带划分得到子带能量谱;第一噪声求取模块(300),用于基于局部最小值的噪声估算法求取得到第一噪声;第二噪声估算模块(400),用于基于VAD的噪声估算法得到当前第二噪声;当前噪声组合模块(500),用于对当前第一噪声和当前第二噪声进行加权组合得到当前频域上的噪声信号。13.如权利要求12所述的噪声检测装置,其特征在于,所述第一噪声求...

【专利技术属性】
技术研发人员:方桂萍肖全之
申请(专利权)人:珠海市杰理科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1