输出音量调节方法和装置制造方法及图纸

技术编号:13380444 阅读:21 留言:0更新日期:2016-07-21 12:01
本发明专利技术实施例提供一种输出音量调节方法和装置。该方法包括:获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号,输入信号包括环境噪声信号和语音信号;获取输入信号对应的频域信号,以及输出音量信号对应的频域信号;基于最小统计的噪声功率谱估计算法,得到与输入信号对应的频域信号中环境噪声信号的噪声功率谱数据;根据噪声功率谱数据与输出谱增益的对应关系,确定与环境噪声信号的噪声功率谱数据对应的输出谱增益;利用输出谱增益对所述输出音量信号对应的频域信号进行调节;并对调节后的频域信号进行反傅里叶变换,得到调节后的输出音量信号,能够准确跟踪稳态或非平稳的嗓声的变化,可以有效地调节输出音量。

【技术实现步骤摘要】
输出音量调节方法和装置
本专利技术实施例涉及语音处理
,尤其涉及一种输出音量调节方法和装置。
技术介绍
4G(第四代移动通信技术)的出现,为我们带来了高速、便捷的移动互联网,人们在各种场合都会使用语音通信设备,例如,智能手机,不仅仅用来打电话,更多的时间是在上网、听音乐、看视频和玩游戏。日常生活中,嘈杂环境下,例如地铁、公交车上,需要手动调高语音通信设备的输出音量,隔绝嘈杂的环境噪声,才能听清楚对方在讲什么,或是享受美妙的音乐;而在离开嘈杂的环境后,由于周围环境变得安静了,又需要手动调低手机输出音量,保护听力,并获得舒适感。现有的输出音量调节技术,一般是对环境噪声进行估计,然后根据环境噪声自动调节输出音量。其中,对环境噪声进行估计,一般包括:判断语音通信设备中语音采集装置的输入信号是否存在语音信号,也即进行语音激活检测(Voice-active-detection,VAD);检测无语音信号段对应的输入信号的环境噪声,作为语音信号段对应的输入信号的环境噪声。上述输出音量调节技术的缺陷在于:随着环境噪声的增加,估计的环境噪声的误差逐渐增大,由于无法准确跟踪环境噪声的变化,导致无法有效地调节输出音量。
技术实现思路
本专利技术实施例提供一种输出音量调节方法和装置,以提高跟踪语音通信设备中语音采集装置的输入信号中的环境噪声信号的变化的准确度,并有效地调节输出音量。第一方面,本专利技术实施例提供了一种输出音量调节方法,包括:获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号,其中,所述输入信号包括环境噪声信号和语音信号;获取输入信号对应的频域信号,以及输出音量信号对应的频域信号;基于最小统计的噪声功率谱估计算法,对输入信号对应的频域信号进行噪声功率谱估计,得到与输入信号对应的频域信号中环境噪声信号的噪声功率谱数据;根据预先存储的噪声功率谱数据与输出谱增益的对应关系,确定与所述环境噪声信号的噪声功率谱数据对应的输出谱增益;利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节;并对所述调节后的频域信号进行反傅里叶变换,得到调节后的输出音量信号。第二方面,本专利技术实施例提供了一种输出音量调节装置,包括:时域信号获取模块,用于获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号,其中,所述输入信号包括环境噪声信号和语音信号;频域信号获取模块,用于获取输入信号对应的频域信号,以及输出音量信号对应的频域信号;噪声估计模块,用于基于最小统计的噪声功率谱估计算法,对输入信号对应的频域信号进行噪声功率谱估计,得到与输入信号对应的频域信号中环境噪声信号的噪声功率谱数据;输出谱增益确定模块,用于根据预先存储的噪声功率谱数据与输出谱增益的对应关系,确定与所述环境噪声信号的噪声功率谱数据对应的输出谱增益;音量调节模块,用于利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节;并对所述调节后的频域信号进行反傅里叶变换,得到调节后的输出音量信号。本专利技术实施例提供的输出音量调节方法和装置,在获取到语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号,并得到输入信号对应的频域信号,以及输出音量信号对应的频域信号之后,基于最小统计的噪声功率谱估计算法,在语音激活,也即有语音信号,和停顿,也即无语音信号处,通过时变光滑系数持续跟踪带噪语音功率谱,在有限窗内,进行基于最小统计的无偏噪声功率谱估计,由于噪声估计是通过在有限窗内搜索带噪语音功率谱密度的最小值,所以对噪声的平稳性没有太高要求,能够对稳态或非平稳的嗓声的进行准确估计,从而可以有效地调节输出音量。附图说明为了更清楚地说明本专利技术,下面将对本专利技术中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1a为本专利技术实施例一提供的一种输出音量调节方法的流程图;图1b为本专利技术实施例提供的输出音量调节方法中一种获取输入信号对应的频域信号的流程图;图1c为本专利技术实施例提供的输出音量调节方法中一种获取输出音量信号对应的频域信号的流程图;图1d为本专利技术实施例提供的输出音量调节方法中一种基于最小统计的噪声功率谱估计算法,对输入信号对应的频域信号进行噪声功率谱估计,得到与输入信号对应的频域信号中环境噪声信号的噪声功率谱数据的流程图;图2为本专利技术实施例二提供的一种输出音量调节方法的流程图;图3为本专利技术实施例三提供的一种调节输出音量方法的流程图;图4为本专利技术实施例四提供的一种输出音量调节装置的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施例中的技术方案作进一步详细描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定,基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。实施例一请参阅图1a,为本专利技术实施例一提供的一种输出音量调节方法的流程图。本专利技术实施例的方法可以由配置以硬件和/或软件实现的输出音量调节装置来执行,该实现装置典型的是配置于能够提供语音通信服务的终端中,需要说明的是,所述终端除了提供语音通信服务外,还可以提供音乐、视频和游戏等服务,相应的,该实现装置也可以配置于能够提供语音通信服务、音乐、视频和游戏等服务的终端中,用于调节语音通信过程中的输出音量,或者用于调节听音乐或看视频过程中的输出音量,或者在玩游戏过程中,调节游戏对应的输出音量,本实施例对此不进行限制。本实施例以语音通信设备为例进行说明。该方法包括:步骤110~步骤150。步骤110、获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号,其中,所述输入信号包括环境噪声信号和语音信号。所述语音信号区别于环境噪声信号,所述语音信号通常为有效信号,可以是语音通信过程中,所述语音通信设备所属的用户输入的语音,也可以是所述语音通信设备播放的音乐中的音频信号,或播放的视频中的音频信号,或者是所述语音通信设备当前显示的游戏中的音频信号。相应的,所述输出音量信号可以是语音通信过程中,所述语音通信设备输出的音量,也可以是所述语音通信设备播放的音乐中的音频信号的音量,或播放的视频中的音频信号的音量,或者是所述语音通信设备当前显示的游戏中的音频信号的音量。步骤120、获取输入信号对应的频域信号,以及输出音量信号对应的频域信号。可以通过短时语音分析处理,从所述输入信号中获取输入信号对应的频域信号,以及通过短时语音分析处理,从所述输出音量信号中获取输出音量信号对应的频域信号。请参阅图1b,为本实施例提供的一种获取输入信号对应的频域信号的流程图。具体包括:步骤121~步骤124。步骤121、对所述输入信号进行预处理,以滤除所述输入信号中的工频干扰信号以及低频干扰信号。其中,工频一般指市电频率,在我国是50Hz。步骤122、根据所述输入信号的短时相关性,对经预处理后的输入信号进行分帧处理。本步骤中,具体可以将本文档来自技高网...

【技术保护点】
一种输出音量调节方法,其特征在于,包括:获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号,其中,所述输入信号包括环境噪声信号和语音信号;获取输入信号对应的频域信号,以及输出音量信号对应的频域信号;基于最小统计的噪声功率谱估计算法,对输入信号对应的频域信号进行噪声功率谱估计,得到与输入信号对应的频域信号中环境噪声信号的噪声功率谱数据;根据预先存储的噪声功率谱数据与输出谱增益的对应关系,确定与所述环境噪声信号的噪声功率谱数据对应的输出谱增益;利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节;并对所述调节后的频域信号进行反傅里叶变换,得到调节后的输出音量信号。

【技术特征摘要】
1.一种输出音量调节方法,其特征在于,包括:获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号,其中,所述输入信号包括环境噪声信号和语音信号;获取输入信号对应的频域信号,以及输出音量信号对应的频域信号;采用下述公式对所述输入信号对应的频域信号进行实时递归处理,得到D个带噪语音功率谱密度:P(λ,k)=α(λ,k)P(λ-1,k)+[1-α(λ,k)]|X(λ,k)|2其中,X(λ,k)为输入信号对应的频域信号,λ用于频域,与时域的时间参数对应,k为频值;α(λ,k)为实时递归平滑因子,通过最小均方误差算法计算得到;P(λ,k)为经所述实时递归处理后的带噪语音功率谱密度;D为有限窗总长;将有限窗总长D分成U个子窗,在U个子窗内分别查找获得每个子窗的带噪语音功率谱密度最小值;对于各子窗,对该子窗的带噪语音功率谱密度最小值进行偏差修正,得到无偏噪声功率估计值,作为与输入信号对应的频域信号中位于该子窗内的环境噪声信号的噪声功率谱数据;根据预先存储的噪声功率谱数据与输出谱增益的对应关系,确定与所述环境噪声信号的噪声功率谱数据对应的输出谱增益;利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节;并对所述调节后的频域信号进行反傅里叶变换,得到调节后的输出音量信号。2.根据权利要求1所述的方法,其特征在于,获取输入信号对应的频域信号,包括:对所述输入信号进行预处理,以滤除所述输入信号中的工频干扰信号以及低频干扰信号;根据所述输入信号的短时相关性,对经预处理后的输入信号进行分帧处理;对经所述分帧处理后的输入信号的各帧信号分别进行加窗处理,并进行重叠存储,得到输入信号的各帧加窗信号;对各帧加窗信号进行快速傅里叶变换处理,得到输入信号对应的频域信号。3.根据权利要求1所述的方法,其特征在于,获取输出音量信号对应的频域信号,包括:对所述输出音量信号进行预处理,以滤除所述输出音量信号中的工频干扰信号以及低频干扰信号;根据所述输出音量信号的短时相关性,对经预处理后的输出音量信号进行分帧处理;对经所述分帧处理后的输出音量信号的各帧信号分别进行加窗处理,并进行重叠存储,得到输出音量信号的各帧加窗信号;对经所述加窗处理后的与输出音量信号对应的各帧加窗信号进行快速傅里叶变换处理,得到输出音量信号对应的频域信号。4.根据权利要求1-3任一所述的方法,其特征在于,利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节,包括:利用所述输出谱增益,采用下述公式对所述输出音量信号对应的频域信号进行调节:其中,G(λ,k)为所述输出谱增益;Y(λ,k)为所述输出音量信号对应的频域信号,λ用于频域,与时域的时间参数对应,k为频值;Yadj(λ,k)为所述输出音量信号经调节后对应的频域信号。5.根据权利要求1-3任一所述的方法,其特征在于,在根据预先存储的噪声功率谱数据与输出谱增益的对应关系,确定与所述环境噪声信号的噪声功率谱数据对应的输出谱增益之后,所述方法还包括:根据预先得到的用户听力曲线,对与所述噪声功率谱数据对应的输出谱增益进行调整,所述用户听力曲线根据在安静环境下,用户可分辨的设定数量的不同频率的声音对应的最小幅值得到,所述设定数量的不同频率选取自输入信号对应的频域信号的不同频点;利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节,具体包括:利用调整后的输出谱增益对输出音量信号对应的频域信号进行调节。6.根据权利要求5所述的方法,其特征在于,根据预先得到的用户听力曲线,对与所述噪声功率谱数据对应的输出谱增益进行调整,包括:根据预先得到的用户听力曲线,采用下述公式对与所述噪声功率谱数据对应的输出谱增益进行调整:其中,θG为门限值;ξ(k)为所述用户听力曲线;Gmod为调整系数,取值>1;G(λ,k)为所述输出谱增益;Gadj(λ,k)为调整后的输出谱增益。7.根据权利要求5所述的方法,其特征在于,利用调整后的输出谱增益对输出音量信号对应的频域信号进行调节,包括:利用调整后的输出谱增益,采用下述公式对输出音量信号对应的频域信号进行调节:其中,Gadj(λ,k)为所述调整后的输出谱增益;Y(λ,k)为所述输出音量信号对应的频域信号,λ用于频域,与时域的时间参数对应,k为频值;Yadj(λ,k)为所述输出音量信号经调节后对应的频域信号。8.一种...

【专利技术属性】
技术研发人员:宋颖
申请(专利权)人:联芯科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1