输出音量调节方法和装置制造方法及图纸

技术编号：13380444 阅读：21 留言：0更新日期：2016-07-21 12:01

本发明专利技术实施例提供一种输出音量调节方法和装置。该方法包括：获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号，输入信号包括环境噪声信号和语音信号；获取输入信号对应的频域信号，以及输出音量信号对应的频域信号；基于最小统计的噪声功率谱估计算法，得到与输入信号对应的频域信号中环境噪声信号的噪声功率谱数据；根据噪声功率谱数据与输出谱增益的对应关系，确定与环境噪声信号的噪声功率谱数据对应的输出谱增益；利用输出谱增益对所述输出音量信号对应的频域信号进行调节；并对调节后的频域信号进行反傅里叶变换，得到调节后的输出音量信号，能够准确跟踪稳态或非平稳的嗓声的变化，可以有效地调节输出音量。

全部详细技术资料下载

【技术实现步骤摘要】
输出音量调节方法和装置
本专利技术实施例涉及语音处理
，尤其涉及一种输出音量调节方法和装置。
技术介绍
4G(第四代移动通信技术)的出现，为我们带来了高速、便捷的移动互联网，人们在各种场合都会使用语音通信设备，例如，智能手机，不仅仅用来打电话，更多的时间是在上网、听音乐、看视频和玩游戏。日常生活中，嘈杂环境下，例如地铁、公交车上，需要手动调高语音通信设备的输出音量，隔绝嘈杂的环境噪声，才能听清楚对方在讲什么，或是享受美妙的音乐；而在离开嘈杂的环境后，由于周围环境变得安静了，又需要手动调低手机输出音量，保护听力，并获得舒适感。现有的输出音量调节技术，一般是对环境噪声进行估计，然后根据环境噪声自动调节输出音量。其中，对环境噪声进行估计，一般包括：判断语音通信设备中语音采集装置的输入信号是否存在语音信号，也即进行语音激活检测(Voice-active-detection，VAD)；检测无语音信号段对应的输入信号的环境噪声，作为语音信号段对应的输入信号的环境噪声。上述输出音量调节技术的缺陷在于：随着环境噪声的增加，估计的环境噪声的误差逐渐增大，由于无法准确跟踪环境噪声的变化，导致无法有效地调节输出音量。
技术实现思路
本专利技术实施例提供一种输出音量调节方法和装置，以提高跟踪语音通信设备中语音采集装置的输入信号中的环境噪声信号的变化的准确度，并有效地调节输出音量。第一方面，本专利技术实施例提供了一种输出音量调节方法，包括：获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号，其中，所述输入信号包括环境噪声信号和语音信号；获取输入信号对应的频域信...

【技术保护点】
一种输出音量调节方法，其特征在于，包括：获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号，其中，所述输入信号包括环境噪声信号和语音信号；获取输入信号对应的频域信号，以及输出音量信号对应的频域信号；基于最小统计的噪声功率谱估计算法，对输入信号对应的频域信号进行噪声功率谱估计，得到与输入信号对应的频域信号中环境噪声信号的噪声功率谱数据；根据预先存储的噪声功率谱数据与输出谱增益的对应关系，确定与所述环境噪声信号的噪声功率谱数据对应的输出谱增益；利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节；并对所述调节后的频域信号进行反傅里叶变换，得到调节后的输出音量信号。

【技术特征摘要】
1.一种输出音量调节方法，其特征在于，包括：获取语音通信设备的语音采集装置的输入信号以及语音通信设备的输出音量信号，其中，所述输入信号包括环境噪声信号和语音信号；获取输入信号对应的频域信号，以及输出音量信号对应的频域信号；采用下述公式对所述输入信号对应的频域信号进行实时递归处理，得到D个带噪语音功率谱密度：P(λ,k)＝α(λ,k)P(λ-1,k)+[1-α(λ,k)]|X(λ,k)|2其中，X(λ,k)为输入信号对应的频域信号，λ用于频域，与时域的时间参数对应，k为频值；α(λ,k)为实时递归平滑因子，通过最小均方误差算法计算得到；P(λ,k)为经所述实时递归处理后的带噪语音功率谱密度；D为有限窗总长；将有限窗总长D分成U个子窗，在U个子窗内分别查找获得每个子窗的带噪语音功率谱密度最小值；对于各子窗，对该子窗的带噪语音功率谱密度最小值进行偏差修正，得到无偏噪声功率估计值，作为与输入信号对应的频域信号中位于该子窗内的环境噪声信号的噪声功率谱数据；根据预先存储的噪声功率谱数据与输出谱增益的对应关系，确定与所述环境噪声信号的噪声功率谱数据对应的输出谱增益；利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节；并对所述调节后的频域信号进行反傅里叶变换，得到调节后的输出音量信号。2.根据权利要求1所述的方法，其特征在于，获取输入信号对应的频域信号，包括：对所述输入信号进行预处理，以滤除所述输入信号中的工频干扰信号以及低频干扰信号；根据所述输入信号的短时相关性，对经预处理后的输入信号进行分帧处理；对经所述分帧处理后的输入信号的各帧信号分别进行加窗处理，并进行重叠存储，得到输入信号的各帧加窗信号；对各帧加窗信号进行快速傅里叶变换处理，得到输入信号对应的频域信号。3.根据权利要求1所述的方法，其特征在于，获取输出音量信号对应的频域信号，包括：对所述输出音量信号进行预处理，以滤除所述输出音量信号中的工频干扰信号以及低频干扰信号；根据所述输出音量信号的短时相关性，对经预处理后的输出音量信号进行分帧处理；对经所述分帧处理后的输出音量信号的各帧信号分别进行加窗处理，并进行重叠存储，得到输出音量信号的各帧加窗信号；对经所述加窗处理后的与输出音量信号对应的各帧加窗信号进行快速傅里叶变换处理，得到输出音量信号对应的频域信号。4.根据权利要求1-3任一所述的方法，其特征在于，利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节，包括：利用所述输出谱增益，采用下述公式对所述输出音量信号对应的频域信号进行调节：其中，G(λ,k)为所述输出谱增益；Y(λ,k)为所述输出音量信号对应的频域信号，λ用于频域，与时域的时间参数对应，k为频值；Yadj(λ,k)为所述输出音量信号经调节后对应的频域信号。5.根据权利要求1-3任一所述的方法，其特征在于，在根据预先存储的噪声功率谱数据与输出谱增益的对应关系，确定与所述环境噪声信号的噪声功率谱数据对应的输出谱增益之后，所述方法还包括：根据预先得到的用户听力曲线，对与所述噪声功率谱数据对应的输出谱增益进行调整，所述用户听力曲线根据在安静环境下，用户可分辨的设定数量的不同频率的声音对应的最小幅值得到，所述设定数量的不同频率选取自输入信号对应的频域信号的不同频点；利用所述输出谱增益对所述输出音量信号对应的频域信号进行调节，具体包括：利用调整后的输出谱增益对输出音量信号对应的频域信号进行调节。6.根据权利要求5所述的方法，其特征在于，根据预先得到的用户听力曲线，对与所述噪声功率谱数据对应的输出谱增益进行调整，包括：根据预先得到的用户听力曲线，采用下述公式对与所述噪声功率谱数据对应的输出谱增益进行调整：其中，θG为门限值；ξ(k)为所述用户听力曲线；Gmod为调整系数，取值>1；G(λ,k)为所述输出谱增益；Gadj(λ,k)为调整后的输出谱增益。7.根据权利要求5所述的方法，其特征在于，利用调整后的输出谱增益对输出音量信号对应的频域信号进行调节，包括：利用调整后的输出谱增益，采用下述公式对输出音量信号对应的频域信号进行调节：其中，Gadj(λ,k)为所述调整后的输出谱增益；Y(λ,k)为所述输出音量信号对应的频域信号，λ用于频域，与时域的时间参数对应，k为频值；Yadj(λ,k)为所述输出音量信号经调节后对应的频域信号。8.一种...

【专利技术属性】
技术研发人员：宋颖，
申请(专利权)人：联芯科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人