本发明专利技术属于声学处理领域,提供了一种调节语音音量的方法和装置,以自适应地调节语音音量,使得在任何环境下用户都能听清语音内容。所述方法包括:获取单位时间帧上数字声音数据的能量值;根据所述单位时间帧上数字声音数据的能量值,判断当前的声音是否为语音;若所述当前声音为语音且音量低于预设音量阈值,则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。由于本发明专利技术的技术方案是直接去调节语音的音量而并非去抑制噪音音量,因此,本发明专利技术提供的技术方案调节语音的效果更好,使得用户在嘈杂的环境下亦能听清语音内容。
【技术实现步骤摘要】
一种调节语音音量的方法和装置
本专利技术属于声学处理领域,尤其涉及一种调节语音音量的方法和装置。
技术介绍
手机作为一种大众化电子产品,已经成为生活的必需品,其移动性为人们提供了很大的方便。由于手机的移动性,使得用户可以在各种环境中使用手机,例如比较安静的环境或比较嘈杂的环境。然而,当用户在不同的环境中使用手机进行通话时,环境噪声对用户的干扰不同。在比较嘈杂的环境中进行通话时,手机的通话音量可能让用户很难听清楚,而在比较安静的环境中进行通话时,手机的通话音量可能又显得过大。现有的一种调节语音音量的方法是计算总声音数据的能量和语音数据的能量,将总声音数据的能量减去语音数据的能量,获得环境噪音数据的能量,再根据环境噪音数据的能量去调节语音数据的能量。上述现有的调节语音音量的方法实际上是通过抑制环境噪音数据的能量来实现调节语音数据的能量的目的,这种方式的效果有时会欠佳,例如,即使抑制了环境噪音数据的能量,但语音数据的能量仍然很小的话,则用户仍然听不清楚语音的内容。
技术实现思路
本专利技术的目的在于提供一种调节语音音量的方法和装置,以自适应地调节语音音量,使得在任何环境下用户都能听清语音内容。本专利技术第一方面提供一种调节语音音量的方法,所述方法包括:获取单位时间帧上数字声音数据的能量值;根据所述单位时间帧上数字声音数据的能量值,判断当前的声音是否为语音;若所述当前声音为语音且音量低于预设音量阈值,则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。本专利技术第二方面提供一种调节语音音量的装置,所述装置包括:获取模块,用于获取单位时间帧上数字声音数据的能量值;判断模块,用于根据所述单位时间帧上数字声音数据的能量值,判断当前的声音是否为语音;调节模块,用于若所述当前声音为语音且音量低于预设音量阈值,则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。从上述本专利技术技术方案可知,本专利技术的技术方案是在判断当前声音是为语音后,对语音的音量进行调节,与现有技术通过抑制环境噪音数据的能量来实现调节语音数据的能量的目的相比,由于本专利技术的技术方案是直接去调节语音的音量而并非去抑制噪音音量,因此,本专利技术提供的技术方案调节语音的效果更好,使得用户在嘈杂的环境下亦能听清语音内容。附图说明图1是本专利技术实施例一提供的调节语音音量的方法的实现流程示意图;图2是本专利技术实施例二提供的调节语音音量的装置的结构示意图;图3是本专利技术实施例三提供的调节语音音量的装置的结构示意图;图4是本专利技术实施例四提供的调节语音音量的装置的结构示意图;图5是本专利技术实施例五提供的调节语音音量的装置的结构示意图;图6-a是本专利技术实施例六提供的调节语音音量的装置的结构示意图;图6-b是本专利技术实施例七提供的调节语音音量的装置的结构示意图;图6-c是本专利技术实施例八提供的调节语音音量的装置的结构示意图;图6-d是本专利技术实施例八提供的调节语音音量的装置的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例提供一种调节语音音量的方法,所述方法包括:获取单位时间帧上数字声音数据的能量值;根据所述单位时间帧上数字声音数据的能量值,判断当前声音是否为语音;若所述当前声音为语音且音量低于预设音量阈值,则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。本专利技术实施例还提供相应的调节语音音量的装置。以下分别进行详细说明。请参阅附图1,是本专利技术实施例一提供的调节语音音量的方法的实现流程示意图,主要包括以下步骤S101至步骤S103,详细说明如下:S101,获取单位时间帧上数字声音数据的能量值。在本专利技术实施例中,在获取单位时间帧上数字声音数据的能量值之前,所述方法还包括将来自麦克的模拟声音数据转换为数字声音数据并调节数字声音数据的增益,例如,模数转换模块即模数转换器(ADC)将来自麦克的模拟声音数据转换为数字声音数据,并且,模数转换模块中的接口接收软件提供的增益(Gain),从而调节数字声音数据的增益。作为本专利技术一个实施例,获取单位时间帧上数字声音数据的能量值可通过如下步骤S1011至S1013实现:S1011,对数字声音数据进行快速离散傅立叶变换,获得单位时间内的频谱数据。具体可以是将连续的数字声音数据按照单位时间数据帧置入控制器的硬件傅立叶计算单元中进行快速离散傅立叶变换,获得单位时间内的频谱数据。需要说明的是,由于在本专利技术实施例中,傅立叶计算单元通过硬件实现,因此,对数字声音数据进行快速离散傅立叶变换,获得单位时间内的频谱数据的计算速度相当快,且稳定性好。S1012,计算频谱数据的平方以获得各个频点的能量谱。S1013,将各个频点的能量谱求和后转换为功率得到单位时间帧上数字声音数据的能量值。S102,根据经步骤S101获取的单位时间帧上数字声音数据的能量值,判断当前声音是否为语音。由于人的声音具有连续性,即,当声音连续时间超过设定的阈值,例如,超过100ms,则可认为该声音为人的声音即语音,当连续一定时间,例如,超过300ms无声则认为没人说话。因此,根据经步骤S101获取的单位时间帧上数字声音数据的能量值,判断当前声音是否为语音具体可以是:计算连续预设时间内当前数字声音数据的能量最大值与能量最小值之差,若连续预设时间内当前数字声音数据的能量最大值与能量最小值之差大于预设能量阈值,则确定当前声音为语音。S103,若当前声音为语音且音量低于预设音量阈值,则调节语音的音量直至语音的音量不低于预设音量阈值。在本专利技术一个实施例中,调节语音的音量直至语音的音量不低于预设音量阈值可以是:将所述语音的音量与预设音量阈值比较,若所述语音的音量小于所述预设音量阈值,则向模数转换模块反馈增益,以使模数转换模块根据增益增大语音的音量直至语音的音量不低于所述预设音量阈值。如前所述,本专利技术实施例的模数转换模块实际是一个模数转换器(ADC)除了用于将来自麦克的模拟声音数据转换为数字声音数据之外,其中的接口还接收软件提供的增益(Gain);从接口读取软件提供的当前增益后,若语音音量偏小,则将增益增大,再将增大的增益值写入接口,ADC将该增益设置为对应芯片内部运算放大器的增益值,从而调节数字声音数据的增益。从上述附图1示例的调节语音音量的方法可知,是在判断当前声音是为语音后,对语音的音量进行调节,与现有技术通过抑制环境噪音数据的能量来实现调节语音数据的能量的目的相比,由于本专利技术实施例提供的方法是直接去调节语音的音量而并非去抑制噪音音量,因此,本专利技术实施例提供的方法调节语音的效果更好,使得用户在嘈杂的环境下亦能听清语音内容。请参阅附图2,是本专利技术实施例二提供的调节语音音量的装置的结构示意图。为了便于说明,附图2仅示出了与本专利技术实施例相关的部分。附图2示例的调节语音音量的装置可以是附图1示例的调节语音音量的方法的执行主体。附图2示例的调节语音音量的装置主要包括获取模块201、判断模块202和调节模块203,其中:获取模块201,用于获取单位时间帧上数字声音数据的能量值;判断模块202,用于根据单位时间帧上数字声音数据的能量值,判断当前的声音是否为本文档来自技高网...

【技术保护点】
一种调节语音音量的方法,其特征在于,所述方法包括:获取单位时间帧上数字声音数据的能量值;根据所述单位时间帧上数字声音数据的能量值,判断当前声音是否为语音;若所述当前声音为语音且音量低于预设音量阈值,则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。
【技术特征摘要】
1.一种调节语音音量的方法,其特征在于,所述方法包括:获取单位时间帧上数字声音数据的能量值;根据所述单位时间帧上数字声音数据的能量值,判断当前声音是否为语音;若所述当前声音为语音且音量低于预设音量阈值,则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。2.如权利要求1所述的方法,其特征在于,所述获取单位时间帧上数字声音数据的能量值,包括:对所述数字声音数据进行快速离散傅立叶变换,获得所述单位时间内的频谱数据;计算所述频谱数据的平方以获得各个频点的能量谱;将所述各个频点的能量谱求和后转换为功率得到单位时间帧上数字声音数据的能量值。3.如权利要求1所述的方法,其特征在于,所述根据所述单位时间帧上数字声音数据的能量值,判断当前声音是否为语音包括:计算连续预设时间内当前数字声音数据的能量最大值与能量最小值之差;若所述连续预设时间内当前数字声音数据的能量最大值与能量最小值之差大于预设能量阈值,则确定所述当前声音为语音。4.如权利要求1所述的方法,其特征在于,所述调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值包括:将所述语音的音量与所述预设音量阈值比较;若所述语音的音量小于所述预设音量阈值,则向模数转换模块反馈增益,以使所述模数转换模块根据所述增益增大所述语音的音量直至所述语音的音量不低于所述预设音量阈值。5.如权利要求1至4任意一项所述的方法,其特征在于,所述获取单位时间帧上数字声音数据的能量值之前,所述方法还包括:将来自麦克的模拟声音数据转换为所述数字声音数据并调节所述数字声音数据的增益。...
【专利技术属性】
技术研发人员:申奎奎,
申请(专利权)人:建荣半导体深圳有限公司,建荣集成电路科技珠海有限公司,珠海煌荣集成电路科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。