一种基于自适应带宽判断的带宽扩展方法及系统技术方案

技术编号:18290905 阅读:35 留言:0更新日期:2018-06-24 06:13
本发明专利技术公开了一种基于自适应带宽判断的带宽扩展方法,所述方法包括:步骤1)根据设置的语音信号的输入采样率和输出采样率,对输入语音信号x(n)进行采样率转换,输出信号y(n),其采样率为输出采样率;步骤2)计算信号y(n)的帧能量值,依次对信号y(n)进行低通、带通和高通滤波处理,计算处理后信号与信号y(n)的帧能量值的比值,将比值与相应阈值进行比较,从而判定信号的有效频带宽度是否存在,并根据判定结果进一步判定是否需要对信号y(n)进行带宽扩展,如果需要,转入步骤3),否则,直接将输入信号y(n)进行输出;步骤3)对信号y(n)的进行带宽扩展,然后输出。本发明专利技术的方法及系统在可变采样率、可变带宽条件下,能够稳健地实现对语音带宽的扩展。

【技术实现步骤摘要】
一种基于自适应带宽判断的带宽扩展方法及系统
本专利技术涉及语音信号的带宽扩展方法,更具体地说,涉及一种基于自适应带宽判断的带宽扩展方法及系统。
技术介绍
根据人们对语音质量的实际需求,数字语音技术所重现信号的带宽会受到一定的限制。为此,语音可以分为窄带、宽带、超宽带和全带四种。其中全带信号的有效带宽覆盖了人耳能感知全部频率范围(20Hz~20kHz),这类音频主要用于音乐信号的高保真重现,所需要的网络传输速率和终端计算能力相对较高,不适合语音信号的即时通信。传统电话语音通常采用窄带语音信号,其频率分布在300Hz~3.4kHz内,采样率为8kHz,可以满足人们基本通话需求,但存在语音主观感知质量不高等缺陷。电话语音通信领域中,采样率16kHz、有效带宽为50Hz~7kHz宽带音频的引入可以获得更好的语音可懂度。此外,与宽带语音信号相比,32kHz采样的超宽带语音频带范围进一步扩大到50Hz~14kHz,其重现声音具有更好的自然度和表现力。鉴于较高带宽的语音信号具有良好的听觉质量,宽带、超宽带语音处理技术日益成为电视电话会议、网络流媒体等通信传输市场的热点。然而,信号带宽的提高必然导致处理数据量的增加,而数据量增加所导致网络服务器在传输、运算、存储能力方面的设备改动将会十分繁琐,对基站设备的大规模升级也将会耗资巨大。与此同时,超宽带语音传输需要终端设备至少包含更加先进的前端声电器件和数模转换器,同时还要具备新的超宽带语音编码器以及向下兼容宽窄带通信的处理能力。而要求大多数用户为终端设备的更新进行投资也是不切实际的。并且在复杂的语音通信传输系统中,由于受到码率限制、设备缺陷等方面影响,输入信号带宽不够稳定,存在可变带宽的现象。因此,受到历史、经济、技术等诸多问题的限制,在不同带宽设备长期共存的过渡时期中,如何最小代价地改善现有宽带通信设备的兼容性使其能够较为稳定地达到宽带甚至超宽带处理能力就成为现代通信系统亟待解决的问题。作为一种有效的语音增强方法,语音带宽扩展(BandwidthExtension,BE)日臻成为过渡时期宽带、超宽带语音处理领域研究的最新热点。它在不影响网络传输和宽带信号信源编码的前提下,通过分析原始全带语音的信号特点,在接收端对重建的窄带或者宽带语音人为增加一定的频率信息,恢复其截去的高频带成分,从而达到增强听觉质量、重现宽带或者超宽带语音的目的。在目前网络传输条件下,该技术的引入对于缓解通信设备兼容性不足和用户高质量语音需求间的矛盾具有十分重要的现实意义,因此近几年来国内外学者针对带宽扩展技术进行了广泛而深入的研究。然而,目前传统的音频带宽扩展方法一般仅针对具有固定频带宽度的信号进行处理,能够在固定采样率和固定带宽条件下,对高频部分进行较好的重建。但在实际语音通信系统中,输入语音信号的采样率和带宽通常并不满足固定传输的条件,针对可变带宽语音通信,现有的带宽扩展方法中难以找到合适的解决方案。
技术实现思路
本专利技术的目的在于克服目前带宽扩展方法无法满足可变带宽语音通信的问题,提出了一种基于自适应带宽判断的带宽扩展方法,该方法对于不同带宽的语音,根据采样率和帧能量判断其是否能够进行带宽扩展,对于满足带宽扩展条件的进行后续的带宽扩展处理,否则,直接输出原语音信号。为了实现上述目的,本专利技术提供了一种基于自适应带宽判断的带宽扩展方法,所述方法包括:步骤1)根据设置的语音信号的输入采样率和输出采样率,对输入语音信号x(n)进行采样率转换,输出信号y(n),其采样率为输出采样率;步骤2)计算信号y(n)的帧能量值,依次对信号y(n)进行低通、带通和高通滤波处理,计算处理后信号与信号y(n)的帧能量值的比值,将比值与相应阈值进行比较,从而判定信号的有效频带宽度是否存在,并根据判定结果进一步判定是否需要对信号y(n)进行带宽扩展,如果需要,转入步骤3),否则,直接将输入信号y(n)进行输出;步骤3)对信号y(n)的进行带宽扩展,然后输出。作为上述方法的一种改进,所述步骤1)具体为:设输入采样率为SRin,输出采样率为SRout;当满足SRout=SRin条件时,输出信号y(n)为输入语音信号x(n);当满足SRout=2*SRin条件时,对输入语音信号x(n)进行上二采样和低通滤波处理,得到采样率加倍而带宽不变的信号y(n)。作为上述方法的一种改进,所述步骤2)具体包括:步骤2-1)计算信号y(n)的帧能量值E;步骤2-2)将信号y(n)采用截止频率为FL的低通滤波器进行处理,得到滤波后的信号,计算该信号y(n)的帧能量值ELW,然后,计算能量比例RL=ELW/E,将RL与第一阈值R1进行比较,若大于第一阈值R1,则判定该带宽成分存在,然后,转入步骤2-3);否则,直接将信号y(n)进行输出;其中,FL表示较低带宽频率值;步骤2-3)将信号y(n)采用上下截止频率分别为FL和FH的带通滤波器进行处理,得到滤波后的信号,计算该信号的帧能量值EBW,然后计算能量比例RB=EBW/E,将RB与第二阈值R2进行比较,若大于第二阈值R2,则判定该带宽成分存在,然后转入步骤2-4);否则,转入步骤3),进行当前采样率下FL~FH的带宽扩展;其中,FH表示较高带宽频率值;步骤2-4)将信号y(n)采用截止频率为FH,FH<FMAX的高通滤波器进行处理,得到滤波后的信号;计算该信号的帧能量值EHW,然后计算能量比例RH=EHW/E,将RH与第三阈值R3进行比较,若大于第三阈值R3,则判定该带宽成分存在,直接将信号y(n)进行输出;否则,转入步骤3),进行当前采样率下FH~FMAX的带宽扩展处理;FMAX表示在某一固定采样率下语音信号所能达到的最大带宽频率值。作为上述方法的一种改进,所述FL和FH是根据信号输出采样率和需求设定的经验值。作为上述方法的一种改进,所述第一阈值R1、第二阈值R2和第三阈值R3采用概率统计方法进行确定。作为上述方法的一种改进,所述步骤3)之前还包括:根据不同采样率和带宽的训练样本数据,采用线性预测分析、高斯混合模型、隐马尔可夫模型或深度神经网络,训练出固定采样率下针对带宽FL~FH范围进行扩展的中频带宽扩展模型和固定采样率下针对带宽FH~FMAX范围进行扩展的高频带宽扩展模型。作为上述方法的一种改进,所述步骤3)具体包括:若y(n)已包含0~FL带宽成分但不包含FL~FH带宽成分,采用中频带宽扩展模型进行扩展;若y(n)已包含0~FL带宽成分和FL~FH带宽成分但不包含FH~FMAX带宽成分,则采用高频带宽扩展模型进行扩展;最后,将带宽扩展后的信号进行输出。一种基于自适应带宽判断的带宽扩展系统,包括存储器、处理器和存储在存储器上的并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述方法的步骤。本专利技术的优势在于:本专利技术的方法及系统不仅可以保证原始输入语音信号的质量,而且在可变采样率、可变带宽条件下,能够稳健地实现对语音带宽的扩展,从而获得更加饱满、音质更加清晰透亮的宽带或超宽带语音信号。附图说明图1为本专利技术的基于自适应带宽判断的带宽扩展方法的流程图;图2为本专利技术的采样率转换框图;图3为本专利技术的基于滤波器和能量比例的带宽判断原理框图;图4为本专利技术的基于源-本文档来自技高网
...
一种基于自适应带宽判断的带宽扩展方法及系统

【技术保护点】
1.一种基于自适应带宽判断的带宽扩展方法,所述方法包括:步骤1)根据设置的语音信号的输入采样率和输出采样率,对输入语音信号x(n)进行采样率转换,输出信号y(n),其采样率为输出采样率;步骤2)计算信号y(n)的帧能量值,依次对信号y(n)进行低通、带通和高通滤波处理,计算处理后信号与信号y(n)的帧能量值的比值,将比值与相应阈值进行比较,从而判定信号的有效频带宽度是否存在,并根据判定结果进一步判定是否需要对信号y(n)进行带宽扩展,如果需要,转入步骤3),否则,直接将输入信号y(n)进行输出;步骤3)对信号y(n)的进行带宽扩展,然后输出。

【技术特征摘要】
1.一种基于自适应带宽判断的带宽扩展方法,所述方法包括:步骤1)根据设置的语音信号的输入采样率和输出采样率,对输入语音信号x(n)进行采样率转换,输出信号y(n),其采样率为输出采样率;步骤2)计算信号y(n)的帧能量值,依次对信号y(n)进行低通、带通和高通滤波处理,计算处理后信号与信号y(n)的帧能量值的比值,将比值与相应阈值进行比较,从而判定信号的有效频带宽度是否存在,并根据判定结果进一步判定是否需要对信号y(n)进行带宽扩展,如果需要,转入步骤3),否则,直接将输入信号y(n)进行输出;步骤3)对信号y(n)的进行带宽扩展,然后输出。2.根据权利要求1所述的基于自适应带宽判断的带宽扩展方法,其特征在于,所述步骤1)具体为:设输入采样率为SRin,输出采样率为SRout;当满足SRout=SRin条件时,输出信号y(n)为输入语音信号x(n);当满足SRout=2*SRin条件时,对输入语音信号x(n)进行上二采样和低通滤波处理,得到采样率加倍而带宽不变的信号y(n)。3.根据权利要求1所述的基于自适应带宽判断的带宽扩展方法,其特征在于,所述步骤2)具体包括:步骤2-1)计算信号y(n)的帧能量值E;步骤2-2)将信号y(n)采用截止频率为FL的低通滤波器进行处理,得到滤波后的信号,计算该信号y(n)的帧能量值ELW,然后,计算能量比例RL=ELW/E,将RL与第一阈值R1进行比较,若大于第一阈值R1,则判定该带宽成分存在,然后,转入步骤2-3);否则,直接将信号y(n)进行输出;其中,FL表示较低带宽频率值;步骤2-3)将信号y(n)采用上下截止频率分别为FL和FH的带通滤波器进行处理,得到滤波后的信号,计算该信号的帧能量值EBW,然后计算能量比例RB=EBW/E,将RB与第二阈值R2进行比较,若大于第二阈值R2,则判定该带宽成分存在,然后转入步骤2-4);否则,...

【专利技术属性】
技术研发人员:白海钏张鹏远颜永红郭亮王天宝
申请(专利权)人:中国科学院声学研究所腾讯科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1