一种调节语音音量的方法和装置制造方法及图纸

技术编号：15624959 阅读：171 留言：0更新日期：2017-06-14 06:09

本发明专利技术属于声学处理领域，提供了一种调节语音音量的方法和装置，以自适应地调节语音音量，使得在任何环境下用户都能听清语音内容。所述方法包括：获取单位时间帧上数字声音数据的能量值；根据所述单位时间帧上数字声音数据的能量值，判断当前的声音是否为语音；若所述当前声音为语音且音量低于预设音量阈值，则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。由于本发明专利技术的技术方案是直接去调节语音的音量而并非去抑制噪音音量，因此，本发明专利技术提供的技术方案调节语音的效果更好，使得用户在嘈杂的环境下亦能听清语音内容。

全部详细技术资料下载

【技术实现步骤摘要】
一种调节语音音量的方法和装置
本专利技术属于声学处理领域，尤其涉及一种调节语音音量的方法和装置。
技术介绍
手机作为一种大众化电子产品，已经成为生活的必需品，其移动性为人们提供了很大的方便。由于手机的移动性，使得用户可以在各种环境中使用手机，例如比较安静的环境或比较嘈杂的环境。然而，当用户在不同的环境中使用手机进行通话时，环境噪声对用户的干扰不同。在比较嘈杂的环境中进行通话时，手机的通话音量可能让用户很难听清楚，而在比较安静的环境中进行通话时，手机的通话音量可能又显得过大。现有的一种调节语音音量的方法是计算总声音数据的能量和语音数据的能量，将总声音数据的能量减去语音数据的能量，获得环境噪音数据的能量，再根据环境噪音数据的能量去调节语音数据的能量。上述现有的调节语音音量的方法实际上是通过抑制环境噪音数据的能量来实现调节语音数据的能量的目的，这种方式的效果有时会欠佳，例如，即使抑制了环境噪音数据的能量，但语音数据的能量仍然很小的话，则用户仍然听不清楚语音的内容。
技术实现思路
本专利技术的目的在于提供一种调节语音音量的方法和装置，以自适应地调节语音音量，使得在任何环境下用...

【技术保护点】
一种调节语音音量的方法，其特征在于，所述方法包括：获取单位时间帧上数字声音数据的能量值；根据所述单位时间帧上数字声音数据的能量值，判断当前声音是否为语音；若所述当前声音为语音且音量低于预设音量阈值，则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。

【技术特征摘要】
1.一种调节语音音量的方法，其特征在于，所述方法包括：获取单位时间帧上数字声音数据的能量值；根据所述单位时间帧上数字声音数据的能量值，判断当前声音是否为语音；若所述当前声音为语音且音量低于预设音量阈值，则调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值。2.如权利要求1所述的方法，其特征在于，所述获取单位时间帧上数字声音数据的能量值，包括：对所述数字声音数据进行快速离散傅立叶变换，获得所述单位时间内的频谱数据；计算所述频谱数据的平方以获得各个频点的能量谱；将所述各个频点的能量谱求和后转换为功率得到单位时间帧上数字声音数据的能量值。3.如权利要求1所述的方法，其特征在于，所述根据所述单位时间帧上数字声音数据的能量值，判断当前声音是否为语音包括：计算连续预设时间内当前数字声音数据的能量最大值与能量最小值之差；若所述连续预设时间内当前数字声音数据的能量最大值与能量最小值之差大于预设能量阈值，则确定所述当前声音为语音。4.如权利要求1所述的方法，其特征在于，所述调节所述语音的音量直至所述语音的音量不低于所述预设音量阈值包括：将所述语音的音量与所述预设音量阈值比较；若所述语音的音量小于所述预设音量阈值，则向模数转换模块反馈增益，以使所述模数转换模块根据所述增益增大所述语音的音量直至所述语音的音量不低于所述预设音量阈值。5.如权利要求1至4任意一项所述的方法，其特征在于，所述获取单位时间帧上数字声音数据的能量值之前，所述方法还包括：将来自麦克的模拟声音数据转换为所述数字声音数据并调节所述数字声音数据的增益。...

【专利技术属性】
技术研发人员：申奎奎，
申请(专利权)人：建荣半导体深圳有限公司，建荣集成电路科技珠海有限公司，珠海煌荣集成电路科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人