The embodiment of the present invention provides a method and device for adjusting the volume of music. The method includes: acquiring the time-domain waveform of the music to be played and the time-domain waveform of the noise of the playing environment; using the pre-trained neural network according to the time-domain waveform of the music to be played and the time-domain waveform of the noise, obtaining the volume setting of the music to be played; and using the volume setting to adjust the volume of the music to be played. Thus, the embodiments of the present invention can automatically adjust the volume of the music to be played by the pre-trained neural network including the music style neural network, the noise category identification neural network and the volume adjustment neural network, which takes into account the factors affecting the user's current volume preference, such as the noise category and the music style of the environment, and so on. It simplifies the user's operation and improves the user experience.
【技术实现步骤摘要】
对音乐进行音量调节的方法及设备
本专利技术实施例涉及声音领域,并且更具体地,涉及一种对音乐进行音量调节的方法及设备。
技术介绍
音质是人对音频质量的主观评价。一般地音质被划分成几十个指标,音量(loudness)也称为响度,是其中一项重要的指标。音量的大小会影响人对音乐信息的接收质量。音量的设置一般与环境音有关,例如在嘈杂的环境中的音乐音量一般高于在安静的环境中的音乐音量。目前的音量的设置主要是由用户自己调节的,这样给用户带来了操作复杂度,影响了用户的体验。另外现存的一些自动音量调节技术,一般只考虑了环境噪声参数,因此音量自动调节能力有限,实际上个人用户对音量的偏好与很多因素有关,如音乐的类别,人们听不同风格类型音乐时,可能会设置不同的音量,不同类型的环境噪声也会对音量设置造成不同的影响,其他的因素还有个人的偏好和个人的听力、音频播放设备参数等,音量模型必须全面考虑这些因素才能达到更好的性能。
技术实现思路
本专利技术实施例提供了一种对音乐的音量进行自动调节的方法及设备,可以基于深度学习实现对音乐的音量进行调节,简化了用户操作,从而提升了用户的体验。第一方面,提供了一 ...
【技术保护点】
1.一种对音乐进行音量调节的方法,其特征在于,包括:获取待播放音乐的时域波形以及播放环境的噪声的时域波形;根据所述待播放音乐的时域波形以及所述噪声的时域波形,使用预先训练好的神经网络,得到所述待播放音乐的音量设置;使用所述音量设置调节所述待播放音乐的音量。
【技术特征摘要】
1.一种对音乐进行音量调节的方法,其特征在于,包括:获取待播放音乐的时域波形以及播放环境的噪声的时域波形;根据所述待播放音乐的时域波形以及所述噪声的时域波形,使用预先训练好的神经网络,得到所述待播放音乐的音量设置;使用所述音量设置调节所述待播放音乐的音量。2.根据权利要求1所述的方法,其特征在于,还包括:将所述预先训练好的神经网络作为基线模型;重复执行以下步骤,直到特定用户的再次调节指令的次数小于预设值:对在播放音乐,使用所述基线模型得到相应的音量设置;获取所述特定用户对所述相应的音量设置的再次调节指令;若所述特定用户的再次调节指令的次数达到预设值,则将所述特定用户调节后的音量作为训练样本,在所述基线模型的参数基础上进行学习,得到更新后的模型,并用所述更新后的模型替换基线模型。3.根据权利要求1所述的方法,其特征在于,所述预先训练好的神经网络包括:音乐风格神经网络、噪声类别辨识神经网络以及音量调节神经网络。4.根据权利要求3所述的方法,其特征在于,所述得到所述待播放音乐的音量设置的过程包括:根据所述待播放音乐的时域波形,使用所述音乐风格神经网络,得到所述待播放音乐的风格向量;根据所述噪声的时域波形,使用所述噪声类别辨识神经网络,得到所述噪声的类别;根据所述待播放音乐的时域波形得到所述待播放音乐的能量特征;根据所述噪声的时域波形得到所述噪声的能量特征;将所述待播放音乐的风格向量、所述噪声的类别、所述待播放音乐的能量特征、所述噪声的能量特征输入至所述音量调节神经网络,得到所述待播放音乐的音量设置。5.根据权利要求4所述的方法,其特征在于,得到所述待播放音乐的风格向量的过程包括:对所述待播放音乐的时域波形进行分帧,并对分帧后的每帧进行特征提取,得到所述待播放音乐的特征;将所述待播放音乐的特征输入至所述音乐风格神经网络,得到所述该待播放音乐的风格向量。6.根据权利要求4所述的方法,其特征在于,得到所述噪声的类别的过程包括:对所述噪声的时域波形进行分帧,并对分帧后的每帧进行特征提取,得到所述噪声的特征;将所述噪声的特征输入至所述噪声类别辨识神经网络,得到所述噪声的类别。7.根据权利要求4所述的方法,其特征在于,所述待播放音乐的能量特征包括所述待播放音乐的平均幅度,得到所述待播放音乐的能量特征的过程包括:计算所述待播...
【专利技术属性】
技术研发人员:姚青山,秦宇,喻浩文,卢峰,
申请(专利权)人:安克创新科技股份有限公司,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。