语音处理系统的自动增益控制方法及控制装置制造方法及图纸

技术编号:18241021 阅读:162 留言:0更新日期:2018-06-17 06:05
一种语音处理系统的自动增益控制方法及控制装置,该控制方法包括:将麦克风的输出信号输入运算放大器放大;将放大后的信号转换为数字信号;对所述数字信号进行语音活动检测;以及当检测到所述数字信号为语音信号时,比较当前运算窗框和前一运算窗框的语音信号参数,根据比较结果向所述运算放大器输出相应的增益调整数据。该控制装置包括顺次连接的运算放大器、模拟数字转换器和微控制器,所述运算放大器的增益调整端与所述微控制器连接。本发明专利技术能够动态调适地追踪语音输入信号,处理后有效地调整运算放大器的增益,使输入的语音信号能够有效达到电压位准目标范围。 1

Automatic gain control method and control device for speech processing system

An automatic gain control method and a control device for a speech processing system. The control method includes: amplifying the output signal of the microphone into an operational amplifier, converting the amplified signal to a digital signal, detecting the speech activity for the digital signal, and when the digital signal is detected as a voice signal. The speech signal parameters of the current operation window frame and the previous operation window frame are compared, and the corresponding gain adjustment data are output to the operational amplifier according to the comparison result. The control device consists of an operational amplifier, an analog digital converter and a micro controller which is connected in a continuous connection. The gain adjustment end of the operational amplifier is connected with the microcontroller. The invention can dynamically and adaptively track the speech input signal, and effectively adjust the gain of the operational amplifier after processing, so that the input speech signal can effectively reach the range of the voltage bit quasi target. One

【技术实现步骤摘要】
语音处理系统的自动增益控制方法及控制装置
本专利技术涉及语音处理系统,尤其涉及一种语音处理系统的自动增益控制方法及控制装置,可以应用在语音压缩、录音或语音识别等系统的输入信号处理,能有效地提供达到电压位准(powerlevel)目标范围的输入语音信号,以利语音处理系统的后续相关处理。
技术介绍
在语音压缩、录音或语音识别等语音处理系统中,其模拟语音输入信号的前置处理,是期望被处理的语音信号在进入模拟数字转换处理时,就能够达到应用所需的电压位准,然后提供后续语音处理单元进行应用处理。就语音处理系统而言,语音的输入是透过麦克风及模拟电路作为前置电路,然后进入模拟数字转换器(AnalogtoDigitalConverter,ADC)转换成数字语音数据。但是,麦克风输入的语音信号会受到许多原因的影响,而产生变动性的电压位准。分析影响语音输入产生不同电压位准或能量的原因,其包括:1)麦克风的灵敏度;2)语音输入源(人声)与麦克风的距离远近;3)语音输入源发出声音的能量大小;4)环境噪声声的能量位准等因素,这些都会影响输入语音的电压位准或能量。然而,有些硬件处理方式是在麦克风及模拟电路的前置电路中,采用固定增益的方法来放大语音的电压位准。但是当语音输入源时而靠近、时而离远麦克风时,所获得的语音信号就会忽大忽小;或者语音输入源发出声音的能量产生大小变化时,亦会影响输入的电压位准。此外,在固定增益的电路处理下,环境噪声是会被同步放大的,进而影响后续语音处理的正确性。因此,为使后续语音处理单元能获得稳定且达到电压位准目标范围的输入语音信号,则需要能够依据输入语音信号自动调整增益的方法,来达到应用所需的目的。另外,目前有许多语音活动检测(VoiceActivityDetection,VAD)的方法,在时域中有使用输入语音音框的能量平均值、均方根值(RootMeanSquare,RMS),或在频域中有使用语音音框的频谱峰值(SpectralPeak)等特征值,来进行是否有语音活动的判断。但是,应用前述的运算方法来检测语音活动,其属于较高的计算复杂度;尤其在采用频域的特征值时,需要将输入语音作频谱转换,亦会增加处理时间及计算复杂度。因此,这些语音活动检测方法虽能有效检测语音活动,但是并不适用在使用低阶的微处理器的应用上。
技术实现思路
本专利技术的目的是提供一种语音处理系统的自动增益控制方法及控制装置,该控制方法及控制装置能在语音处理系统中动态调适地追踪语音输入信号,处理后有效地调整运算放大器的增益,使输入的语音信号能够有效达到电压位准目标范围。为达上述目的,本专利技术采用的技术方案如下:一种语音处理系统的自动增益控制方法,所述自动增益控制方法包括:将麦克风的输出信号输入运算放大器放大;将放大后的信号转换为数字信号;对所述数字信号进行语音活动检测;以及当检测到所述数字信号为语音信号时,比较当前运算窗框和前一运算窗框的语音信号参数,根据比较结果向所述运算放大器输出相应的增益调整数据。在上述的语音处理系统的自动增益控制方法中,优选地,对所述数字信号进行语音活动检测的步骤包括:按采样频率读取所述数字信号;获取每个采样音框内数字信号的最大峰值;比较所述最大峰值,获取运算窗框内信号的最大振幅;以及将所述最大振幅与设定的阀值比较,判断所述数字信号是否为语音信号。在上述的语音处理系统的自动增益控制方法中,优选地,每一运算窗框包括四个采样音框,每一采样音框的时间长度为20~40ms。在上述的语音处理系统的自动增益控制方法中,优选地,增益调整数据符合渐进调整所述运算放大器增益的原则。在上述的语音处理系统的自动增益控制方法中,优选地,所述的语音信号参数为语音信号的最大振幅。在上述的语音处理系统的自动增益控制方法中,优选地,所述自动增益控制方法还包括:在启动时或判断不是语音信号时,将所述运算放大器的增益调整为初始值。在上述的语音处理系统的自动增益控制方法中,优选地,在所述的根据比较结果向所述运算放大器输出相应的增益调整数据的步骤中,当语音能量连续小于设定下限时,快速降低所述运算放大器的增益。一种语音处理系统的自动增益控制装置,所述自动增益控制装置包括从输入端到输出端顺次连接的运算放大器、模拟数字转换器和微控制器,所述运算放大器的增益调整端与所述微控制器连接,所述微控制器用于:采样所述模拟数字转换器输出的数字信号;对所述数字信号进行语音活动检测;以及当检测到语音信号时,比较当前运算窗框和前一运算窗框的语音信号参数,根据比较结果向所述运算放大器输出相应的增益调整数据。在上述的语音处理系统的自动增益控制装置中,优选地,所述运算放大器的输入端和麦克风之间设置有抗混迭滤波器。在上述的语音处理系统的自动增益控制装置中,优选地,所述微控制器配置为:依据渐进调整原则生成所述增益调整数据,且当语音能量连续小于设定下限时快速调降所述运算放大器的增益。与现有技术相比,本专利技术至少具有以下有益效果:能使语音输入信号达到所设定的电压位准目标范围,提供稳定的语音数字采样数据给语音处理单元,进行语音处理相关应用的运算。直接使用麦克风输入语音信号进行自动增益控制,无须对麦克风输入电压位准进行校准程序。能对麦克风输入信号进行语音活动检测,以利正确进行语音增益调整。附图说明图1为典型实施例自动增益控制方法的流程图;图2为其中语音活动检测方法的流程图;图3为采样音框及运算窗框的定义示意图;图4为典型实施例自动增益控制装置的原理框图。具体实施方式下面结合附图和实施例对本专利技术做进一步说明。参照图1,典型实施例语音处理系统的自动增益控制方法包括:步骤S100、将麦克风的输出信号输入运算放大器放大;步骤S200、将放大后的信号转换为数字信号;步骤S300、对所述数字信号进行语音活动检测;以及步骤S400、当检测到所述数字信号为语音信号时,比较当前运算窗框和前一运算窗框的语音信号参数,根据比较结果向所述运算放大器输出相应的增益调整数据。参照图2,对所述数字信号进行语音活动检测的方法,即步骤S300包括:步骤S301、按采样频率读取所述数字信号。更具体地说包括:读取模拟数字转换器(DAC)的输出值,该数值表示为PK(Peakvalue)。由于模拟数字转换器的输出值即为波形取样值,当为语音信号时在转换过程中会产生有符号数值,所以在音框采样数值比对前,进一步还包括将PK值取绝对值,该绝对值表示为PKCUR=|PK|。步骤S302、获取每个采样音框内数字信号的最大峰值。更具体地说包括:连续比对在同一音框内采样数值,并储存比对后的最大值,当完成1个音框的采样数及数值比较,即获得该采样音框的PK最大值(即,数字信号的最大峰值),其表示为PKMAXFn,n=0,1,2,3其中,Fn,n=0,1,2,3为4个连续的采样音框PK最大值。在增益控制算法中储存采样音框PK最大值的缓存器是循环使用的,即在进行下一个采样音框处理前,就会调整储存下一个采样音框PK最大值的缓存器位置参数,即步骤S305,(n+1)mod4。步骤S303、比较所述最大峰值(即上述PK最大值),获取运算窗框内信号的最大振幅。在典型实施例中,运算窗框由连续的四个采样音框组成,通过比较连续的四个采样音框的PK最大值,选出最大值PKMAX=max(PK本文档来自技高网
...
语音处理系统的自动增益控制方法及控制装置

【技术保护点】
1.一种语音处理系统的自动增益控制方法,其特征在于,所述自动增益控制方法包括:

【技术特征摘要】
1.一种语音处理系统的自动增益控制方法,其特征在于,所述自动增益控制方法包括:将麦克风的输出信号输入运算放大器放大;将放大后的信号转换为数字信号;对所述数字信号进行语音活动检测;以及当检测到所述数字信号为语音信号时,比较当前运算窗框和前一运算窗框的语音信号参数,根据比较结果向所述运算放大器输出相应的增益调整数据。2.根据权利要求1所述的语音处理系统的自动增益控制方法,其特征在于,对所述数字信号进行语音活动检测的步骤包括:按采样频率读取所述数字信号;获取每个采样音框内数字信号的最大峰值;比较所述最大峰值,获取运算窗框内信号的最大振幅;以及将所述最大振幅与设定的阀值比较,判断所述数字信号是否为语音信号。3.根据权利要求2所述的语音处理系统的自动增益控制方法,其特征在于,每一运算窗框包括四个采样音框,每一采样音框的时间长度为20~40ms。4.根据权利要求1所述的语音处理系统的自动增益控制方法,其特征在于,在所述的根据比较结果向所述运算放大器输出相应的增益调整数据的步骤中,增益调整数据符合渐进调整所述运算放大器增益的原则。5.根据权利要求1所述的语音处理系统的自动增益控制方法,其特征在于,所述的语音信号参数为语音信号的最大振幅。6.根据权利要求1所述的语音处理系统的自动增益控制方法,其特征在于,所述自动增益控制方法还包...

【专利技术属性】
技术研发人员:刘焱
申请(专利权)人:深圳市富励逻辑科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1