键盘声处理方法、装置、终端设备及存储介质制造方法及图纸

技术编号:24760338 阅读:31 留言:0更新日期:2020-07-04 10:08
本公开公开了键盘声处理方法、装置、终端设备及介质。所述方法包括:响应于键盘声抑制触发条件,对采集到的键盘声信号进行人声区检测;若所述键盘声信号包含非人声信号,则对所述键盘声信号中符合非人声信号的频谱特征的噪声进行抑制;输出经过抑制的键盘声信号。利用该方法,能够有效抑制噪声,提高键盘声抑制的可靠性,提高远程通话质量。

Keyboard sound processing method, device, terminal equipment and storage medium

【技术实现步骤摘要】
键盘声处理方法、装置、终端设备及存储介质
本专利技术实施例涉及信号处理
,尤其涉及一种键盘声处理方法、装置、终端设备及存储介质。
技术介绍
在语音或视频办公、远程会议等场景中,参与方经常需要在说话的同时,通过敲击键盘的方式及时发布或记录相关信息,这种场景下,敲击键盘的声音会被麦克风采集到,使得通信过程中掺杂着键盘的敲击声,严重影响参与方的通话质量。键盘声与人声在频谱分量上重叠,这给键盘声的一致提出了很高的技术要求,通常需要将键盘声和人声进行盲源分离,尽量保留人声分量。由于键盘声检测的准确度有限,可能发生误检,而为了将键盘声消除,一般会采用深度抑制的方法,容易导致人声也被抑制,出现丢字漏字等情况,声音出现明显卡顿,甚至听不清楚,最终在通信过程中丢失重要信息,键盘声抑制的可靠性低,影响远程通话的质量。
技术实现思路
本专利技术提供了一种键盘声处理方法、装置、终端设备及存储介质及系统,以提高键盘声抑制的可靠性,提高远程通话质量。第一方面,本公开实施例提供了一种键盘声处理方法,应用于终端设备上的应用程序,包括:响应于键盘声抑制触发条件,对采集到的键盘声信号进行人声区检测;若所述键盘声信号包含非人声信号,则对所述键盘声信号中符合非人声信号的频谱特征的噪声进行抑制;输出经过抑制的键盘声信号。第二方面,本公开实施例还提供了一种键盘声处理装置,包括:检测模块,用于响应于键盘声抑制触发条件,对采集到的键盘声信号进行人声区检测;抑制模块,用于若所述键盘声信号包含非人声信号,则对所述键盘声信号中符合非人声信号的频谱特征的噪声进行抑制;输出模块,用于输出经过抑制的键盘声信号。第三方面,本公开实施例还提供了一种终端设备,包括:一个或多个处理装置;存储装置,用于存储一个或多个程序;所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现本公开实施例提供的方法。第四方面,本公开实施例还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开实施例提供的方法。本公开实施例提供了键盘声处理方法、装置、终端设备及介质,首先响应于键盘声抑制触发条件,对采集到的键盘声信号进行人声区检测;然后若所述键盘声信号包含非人声信号,则对所述键盘声信号中符合非人声信号的频谱特征的噪声进行抑制;最后输出经过抑制的键盘声信号。利用上述技术方案,根据非人声信号的频谱特征对键盘声信号中的噪声进行抑制,能够有效抑制噪声,提高键盘声抑制的可靠性,提高远程通话质量。附图说明图1为本公开实施例一提供的一种键盘声处理方法的流程示意图;图2为本公开实施例二提供的一种键盘声处理方法的流程示意图;图3为本公开实施例三提供的一种键盘声处理方法的流程示意图;图4为本公开实施例四提供的一种键盘声处理方法的流程示意图;图5为本公开实施例四中对键盘声信号进行分级抑制的示意图;图6为本公开实施例四中的处理前后的键盘声信号的示意图;图7为本公开实施例五提供的一种键盘声处理装置的结构示意图;图8为本公开实施例六提供的一种终端设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。此外,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。实施例一图1为本公开实施例一提供的一种键盘声处理方法的流程示意图,该方法可适用于对远程通话中的键盘声进行抑制的情况,具体的,用于对键盘声信号的目标帧进行分级抑制,以提高远程通话质量的情况。该方法可以由键盘声处理装置来执行,其中该装置可由软件和/或硬件实现,并一般集成在终端设备上,在本实施例中终端设备包括但不限于:手机、电脑和个人数字助理等设备。如图1所示,本公开实施例一提供的一种键盘声处理方法,包括如下步骤:S110、响应于键盘声抑制触发条件,对采集到的键盘声信号进行人声区检测。在本实施例中,键盘声抑制触发条件可以认为是触发进行键盘声抑制的条件。此处不对键盘声抑制条件的触发进行限定,本领域技术人员可以根据具体业务场景确定。在一个实施例中,键盘声抑制触发条件可以为终端设备通过麦克风采集到符合键盘敲击声特点的音频信号,也可以为终端设备检测到键盘输入设备响应用户的敲击所生成的输入信号,也可以为接收到用户向终端设备发出的开始执行抑制键盘声的指令,或者终端设备中设定键盘声抑制功能为开启状态,或者通过终端设备与键盘输入设备进行通信的接口获知键盘敲击事件等。键盘声信号是一种包含键盘敲击噪声的音频信号。假设键盘声信号的帧长为L,其中的每一帧都是目标帧,对每个目标帧的噪声都需要进行抑制。为便于描述,将键盘声信号时域上的第m帧(也是第m个目标帧)记为x(m),对应的频域记为X(m,k),X(m,k)表示第m帧的第k个频点对应的频谱分量,为复数形式,由频谱分量的幅度和相位组成。对采集到的键盘声信号进行人声区检测,是指利用语音识别算法对键盘声信号中的人声区和非人声区进行检测,以识别键盘声信号中包含人声信号的部分和包含非人声信号的部分,其中,非人声信号可包括由键盘产生的噪声信号。包含人声信号的部分即为人声区;包含非人声信号的即为非人声区。对于人声信号无需进行抑制,还可以利用语音信号处理技术在一定程度上进行加强;而对于非人声信号,需要对其进行抑制。S120、若所述键盘声信号包含非人声信号,则对所述键盘声信号中符合非人声信号的频谱特征的噪声进行抑制。在本实施例中,键盘声信号可以是单纯的键盘噪声信号,也可以是键盘噪声信号和人声信号的混合信号。符合非人声信号的频谱特征的噪声是指频谱分量符合键盘声的冲击跳变规律,和/或频谱分量有别于本文档来自技高网...

【技术保护点】
1.一种键盘声处理方法,其特征在于,包括:/n响应于键盘声抑制触发条件,对采集到的键盘声信号进行人声区检测;/n若所述键盘声信号包含非人声信号,则对所述键盘声信号中符合非人声信号的频谱特征的噪声进行抑制;/n输出经过抑制的键盘声信号。/n

【技术特征摘要】
1.一种键盘声处理方法,其特征在于,包括:
响应于键盘声抑制触发条件,对采集到的键盘声信号进行人声区检测;
若所述键盘声信号包含非人声信号,则对所述键盘声信号中符合非人声信号的频谱特征的噪声进行抑制;
输出经过抑制的键盘声信号。


2.根据权利要求1所述的方法,其特征在于,所述对所述键盘声信号中符合非人声信号的频谱特征的噪声进行抑制,包括:
检测所述键盘声信号的瞬时冲击程度,并根据所述瞬时冲击程度对所述键盘声信号的瞬时噪声进行抑制,得到第一抑制信号;
对所述第一抑制信号的低频区域噪声进行抑制,得到第二抑制信号;
对所述第二抑制信号的残余冲击噪声进行抑制,得到经过抑制的键盘声信号。


3.根据权利要求2所述的方法,其特征在于,所述根据所述瞬时冲击程度对所述键盘声信号的瞬时噪声进行抑制,包括:
若所述键盘声信号满足时域跳变条件,则根据所述瞬时冲击程度对所述键盘声信号的瞬时噪声进行抑制。


4.根据权利要求2所述的方法,其特征在于,所述根据所述瞬时冲击程度对所述键盘声信号的瞬时噪声进行抑制,包括:
根据所述瞬时冲击程度计算所述键盘声信号的目标帧的瞬时冲击程度值;
基于所述瞬时冲击程度值对所述目标帧进行瞬时噪声抑制。


5.根据权利要求4所述的方法,其特征在于,所述根据所述瞬时冲击程度计算所述键盘声信号的目标帧的瞬时冲击程度值,包括:
对所述目标帧进行小波包分解;
计算分解后的每个叶子节点的一阶跳变统计量和二阶跳变统计量;
根据各所述一阶跳变统计量和二阶跳变统计量计算平均跳变统计量;
将所述平均跳变统计量转换为所述目标帧的瞬时冲击程度值,所述瞬时冲击程度值的取值范围为[0,1]。


6.根据权利要求4所述的方法,其特征在于,所述基于所述瞬时冲击程度值对所述目标帧进行瞬时噪声抑制,包括:
若所述目标帧的频谱分量的幅值大于所述目标帧的平滑谱幅度均值,则根据所述瞬时冲击程度值调整所述目标帧的频谱分量;
将调整后的频谱分量与平滑增量的和作为所述第一抑制信号的频谱分量,所述平滑增量为所述瞬时冲击程度值与所述平滑谱幅度均值的乘积。


7.根据权利要求6所述的方法,其特征在于,在得到第一抑制信号之后,还包括:
根据所述第一抑制信号的频谱分量更新所述目标帧的下一帧的平滑谱...

【专利技术属性】
技术研发人员:吴威麒江卫丰陈敏许一峰陈满砚
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1