使麦克风信号静音和取消静音的方法技术

技术编号:34005132 阅读:105 留言:0更新日期:2022-07-02 13:10
提供了一种用于使麦克风静音和取消静音的方法。该方法包括提供处理器,接收输入麦克风信号,以采样率测量输入麦克风信号的响度水平,计算静音阈值水平,检查响度水平是否高于等于静音阈值水平,以及在确定响度水平高于等于静音阈值水平时重置静音延迟定时器并获得输入麦克风信号,或者在确定响度水平不高于等于静音阈值水平时检查静音延迟定时器是否正在运行,如果静音延迟定时器未运行则衰减输入麦克风信号,或者如果静音延迟定时器仍在运行则获得输入麦克风信号,并将输入麦克风信号或经衰减的输入麦克风信号写入输出缓冲器。经衰减的输入麦克风信号写入输出缓冲器。经衰减的输入麦克风信号写入输出缓冲器。

【技术实现步骤摘要】
使麦克风信号静音和取消静音的方法


[0001]本专利技术总体涉及对麦克风信号的静音和取消静音,并且更具体地涉及使用语音活动检测器对麦克风信号进行静音和取消静音。

技术介绍

[0002]麦克风在语音或视频通话(例如电话通话或互联网通话(带或不带视频,使用诸如Zoom、Skype和Microsoft Teams的通信软件))期间被使用。通常,麦克风在通话期间始终处于启用状态。但是,始终启用的麦克风会从环境中拾取不需要的背景噪音或非预期音频,从而对通话中的远程方造成干扰和影响。为了防止这个问题,通常在通话期间,用户会在他不说话时将他的麦克风静音,这样通话中的其他远程方就不会听到背景声音/噪音。麦克风也可以被默认静音,以尽量减少对其他用户的干扰。很多时候,用户可能会在开始说话时忘记取消麦克风静音。
[0003]因此,可见需要一种在用户不说话和用户说话时分别使麦克风信号静音和取消静音的方法。此外,根据随后的详细描述和所附权利要求,结合附图和本公开的该背景,其他期望的特征和特性将变得明显。

技术实现思路

[0004]在本专利技术的一个方面,提供了一种用于使麦克风静音和取消静音的方法。该方法包括提供处理器,接收输入麦克风信号,以采样率测量输入麦克风信号的响度(loudness)水平,计算静音阈值水平,检查响度水平是否高于等于静音阈值水平,以及在确定响度水平高于等于静音阈值水平时重置静音延迟定时器并获得输入麦克风信号,或者在确定响度水平不高于等于静音阈值水平时检查静音延迟定时器是否正在运行,如果静音延迟定时器未运行,则衰减输入麦克风信号,或者如果静音延迟定时器仍在运行,则获得输入麦克风信号,并将输入麦克风信号或衰减的输入麦克风信号写入输出缓冲器。
[0005]在本专利技术的另一方面,提供了一种软件产品,包括处理器可读的非暂态存储介质,该非暂态存储介质上存储了一组用于使输入麦克风信号静音和取消静音的指令。该软件产品包括第一指令序列,当由处理器执行时使所述处理器接收输入麦克风信号,第二指令序列,当由处理器执行时使所述处理器以采样率测量输入麦克风信号的响度水平,第三指令序列,当由处理器执行时使所述处理器计算静音阈值水平,第四指令序列,当由处理器执行时使所述处理器检查响度水平是否高于等于静音阈值水平,以及在确定响度水平高于等于静音阈值水平时重置静音延迟定时器并获得输入麦克风信号,或者在确定响度水平不高于等于静音阈值水平时检查静音延迟定时器是否正在运行,如果静音延迟定时器未运行,则衰减输入麦克风信号,或者如果静音延迟定时器仍在运行,则获得输入麦克风信号,以及第五指令序列,当由处理器执行时使所述处理器将输入麦克风信号或衰减的输入麦克风信号写入输出缓冲器。
附图说明
[0006]图1是描绘根据各种实施例的用于使麦克风信号静音和取消静音的方法的流程图。
具体实施方式
[0007]以下详细说明本质上仅是示例性的,并不用于限制本专利技术或本专利技术的应用和用途。此外,无意受本专利技术的前述背景或以下详细描述中提出的任何理论的束缚。各种实施例的意图是呈现一种使麦克风信号静音和取消静音的方法。
[0008]参考图1,示出了描绘根据各种实施例的用于使麦克风信号静音和取消静音的方法的流程图100。设备设置有处理器。处理器在步骤110接收输入麦克风信号,并且在步骤120测量麦克风信号的响度水平。在一个实施例中,输入麦克风信号可以在频域中。可以通过将复数输入麦克风信号的均方根(RMS)乘以幅度缩放因子来测量来自频带的麦克风信号的频带幅度。频带可以从下限频率(例如250Hz)到上限频率(例如输入麦克风信号的奈奎斯特频率或8000Hz,以较低者为准)。幅度缩放因子考虑了音频的采样率。在一个实施例中,幅度缩放因子可以是采样率和帧大小的函数的平方根的倒数。通过乘以幅度缩放因子,频带幅度变为对于不同的采样率和帧大小是不变的。
[0009]当前响度水平是通过使用利用触发响应(attack response)时间和释放响应时间的平滑函数来平滑频带幅度而获得的。触发响应是平滑值与其先前值相比将增加得多快/慢的响应,释放响应是平滑值与其先前值相比将减少得多快/慢的响应。在一个实施例中,触发响应时间和释放响应时间为16毫秒。实时测量麦克风信号的响度水平,采样率为16kHz,帧大小为512,触发响应时间为16毫秒,释放响应时间为16毫秒,这样麦克风信号的响度水平可以每32毫秒确定一次。有利地,这将允许麦克风信号几乎立即被取消静音而不会丢失语音,如下文将进一步详述的。根据系统资源和限制,也可以使用其他合适的采样率和帧大小。例如,48kHz的采样率和512的帧大小允许每10.67毫秒确定一次麦克风信号的响度水平。
[0010]在步骤130中,处理器基于语音活动检测(VAD)设置计算静音阈值水平。在一个实施例中,静音阈值水平是基于五种不同的VAD模式之一来设置的。模式有自动校准、按预设手动校准、按预设水平手动校准、按自定义值手动校准和实时自动调整。在一个实施例中,默认设置的优选模式为实时自动调整模式。
[0011]当模式被设置为自动校准时,用户在音频校准正在进行时被要求在一段时间内(例如至少3秒)保持沉默。在自动校准期间,处理器测量峰值环境噪音水平并基于测量的水平调整静音阈值水平。可以每200ms测量麦克风信号的峰值噪音并将其存储在大小为8的循环缓冲器中。这与获取最后1.6秒(8x200ms)的峰值噪音相同,该峰值噪音每200ms更新一次。可以为用户提供按钮来开始校准。虽然自动校准可以更准确地测量环境声音/噪音水平,但它需要用户在每次通话开始时都进行此校准。
[0012]当模式设置被为按预设手动校准时,要求用户考虑他的语音水平(例如洪亮、中等、柔和)、环境噪音水平(例如高、中或低背景噪音)和使用的麦克风(例如耳机、耳塞、前置麦克风、远场麦克风)选择不同的预设。静音阈值水平是基于预定义的预设值设置的,这些预设值经过本地预调以与选定的预设相对应。
[0013]当模式设置为按预设水平手动校准时,要求用户选择自定义预设,例如但不限于特定的麦克风类型和型号,以及环境类型。例如,可以向用户呈现麦克风选项,例如“Creative Labs Live!Cam Sync HD 1080p Webcam麦克风”、“Lewitt LCT 640TS麦克风”、“Audio Technica AE2300麦克风”、“Panasonic Dynamic麦克风WM

530”等。还可以为用户呈现环境选择选项,例如“市场”、“购物中心”、“办公室”等。静音阈值水平是基于与所选自定义预设相对应的预设水平设置的。
[0014]当模式被设置为按自定义值手动校准时,静音阈值水平是基于本底噪音和用户定义的固定偏移来设置的。可以向用户呈现滑块以允许用户调整用于VAD的偏移值。本底噪音可以通过跟踪频带幅度的最小水平、使用利用慢触发响应和快释放响应的平滑函数来测量。触发响应是平滑值与其先前值相比将增加得多快/慢的响应,释放响应是平滑值与其先前值相比将减少得多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于使麦克风信号静音和取消静音的方法,包括:提供处理器;接收输入麦克风信号;以采样率测量所述输入麦克风信号的响度水平;计算静音阈值水平;检查所述响度水平是否高于等于所述静音阈值水平,以及在确定所述响度水平高于等于所述静音阈值水平时重置静音延迟定时器并获得所述输入麦克风信号,或者在确定所述响度水平不高于等于所述静音阈值水平时检查所述静音延迟定时器是否正在运行,并且如果所述静音延迟定时器未运行则衰减所述输入麦克风信号,或者如果所述静音延迟定时器仍在运行则获得所述输入麦克风信号;以及将所述输入麦克风信号或经衰减的输入麦克风信号写入输出缓冲器。2.如权利要求1所述的方法,其中,所述输入麦克风信号在频域中,并且测量输入麦克风信号的响度水平的步骤是通过将所述输入麦克风信号的均方根乘以幅度缩放因子。3.如权利要求2所述的方法,其中,所述幅度缩放因子是采样率和帧大小的函数的平方根的倒数。4.如权利要求1所述的方法,其中,每32毫秒确定一次所述输入麦克风信号的响度水平。5.如权利要求1所述的方法,其中,计算所述静音阈值水平的步骤包括:检查语音活动检测模式,并获得用于计算所述静音阈值水平的一组参数。6.如权利要求5所述的方法,其中,所述语音活动检测模式选自由如下项组成的组:自动校准、按预设手动校准、按预设水平手动校准、按自定义值手动校准和实时自动调整,并且其中,默认选择实时自动调整模式。7.如权利要求1所述的方法,其中,所述静音延迟定时器被配置为1秒。8.如权利要求1所述的方法,还包括如下步骤:获得用户的静音延迟定时器的优选值,并将静音延迟定时器配置为所述优选值。9.如权利要求1所述的方法,还包括如下步骤:显示视觉指示符以显示当前静音状态。10.如权利要求1所述的方法,其中,衰减所述输入麦克风信号的步骤包括:基于所述输入麦克风信号的目标音频水平和所述响度水平确定衰减值,并且其中,所述输入麦克风信号的目标音频水平足够低以致人类无法听到音频,但足够高以致通信应用仍然能检测到所述经衰减的输入麦克风信号的存在。11.一种软件产品,包括处理器可读的非暂态存储介质,所述非暂态存储介质上存储了一组用于使输入麦克风信号静音和取消静音的指令,所述指令包括:第一指令序列,所述第一指令序列当由所述处理器执行时使所述处理器接收输入麦克风信号;第二指令序列,所述第二指令序列当由所述...

【专利技术属性】
技术研发人员:陈启升曾伦阶艾莉尔
申请(专利权)人:创新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1