音质转换的模型训练方法、提升音质的方法、装置及介质制造方法及图纸

技术编号:34432194 阅读:21 留言:0更新日期:2022-08-06 16:11
本申请公开了一种音质转换的模型训练方法、提升音质的方法、装置及介质,属于音频编解码技术领域。该方法主要包括:根据高码率与低码率分别对高音质音频进行特征提取获取训练高音质谱系数与训练低音质谱系数;将训练低音质谱系数输入预设的神经网络模型输出转换高音质谱系数,计算高音质谱系数与转换高音质谱系数的差值;根据差值训练神经网络模型获得音质转换模型。通过提供音质转换模型无需对低音质音频进行额外的编解码,在蓝牙无线设备装置自身的解码装置中加入音质转换模型,将质量不佳的低音质音频转换为高音质音频输出,使得即使在地铁、飞机场等干扰较多的场合,无线链路质量不佳的状况下,也能获取音质较高的音频,提高用户体验感。提高用户体验感。提高用户体验感。

【技术实现步骤摘要】
音质转换的模型训练方法、提升音质的方法、装置及介质


[0001]本申请涉及音频编解码
,特别涉及一种音质转换的模型训练方法、提升音质的方法、装置及介质。

技术介绍

[0002]由于在音频播放前,手机、平板电脑、蓝牙发射器等蓝牙发射端与蓝牙耳机等蓝牙接收端之间通信的相关参数,根据该蓝牙发射端与该蓝牙接收端所在环境得无线链路的质量确定,其中相关参数包括但不限于音频压缩的码率;无线链路的质量与相关参数的大小呈正相关,即无线链路的质量高,则为音频压缩设置较高的码率,无线链路的质量低,则为音频压缩设置较低的码率;较高的码率则意味着该蓝牙发射端与该蓝牙接收端在传输音频的过程中,音质的损失较小。
[0003]然而,由于所述的环境不同,对应的无限链路质量的高低不同;其中,在蓝牙通信设备较多的环境中,例如地铁、飞机场、火车站等人员密集、蓝牙设备较多的场所,无线链路的质量较低,导致蓝牙接收端播放的音频的音质降低,影响用户体验。
[0004]在相关技术中涉及音质受损的场景多为在不同声道中转换音频时,使得音频的音质受损,或多个蓝牙设备同时与同一辆车辆进行蓝牙传输时导致的音质受损的情况,因此其解决的技术问题也是针对于上述的特定场景而言的音质提升,而对上述场景所适用的音质提升的方法并不适用与本方案所在的场景,直接套用在本方案所使用的场景中,并不能有效的实现音质提升的效果。因此,需要一种适用于本方案的音质提升的方法。

技术实现思路

[0005]针对现有技术存在的在蓝牙通信设备较多的环境中,无线链路的质量较低,导致蓝牙接收端播放的音频的音质降低,影响用户体验的问题,本申请主要提供一种音质转换的模型训练方法、提升音质的方法、装置及介质。
[0006]为了实现上述目的,本申请采用的一个技术方案是:提供一种音质转换的模型训练方法,其包括:根据预设的高码率与预设的低码率分别对预设的高音质音频进行特征提取,获取高音质音频分别对应的训练高音质谱系数与训练低音质谱系数;将训练低音质谱系数输入预设的神经网络模型获取转换高音质谱系数,计算训练高音质谱系数与转换高音质谱系数之间的差值;以及根据差值对神经网络模型进行训练,获得音质转换模型。
[0007]本申请采用的另一个技术方案是:提供一种提升音质的方法,其包括:利用标准的LC3解码器对蓝牙接收器接收到的低音质码流进行解码,直至变换域噪声整形模块输出低音质码流对应的低音质谱系数,其中低音质码流为码率小于预设码率的码流;将低音质谱系数输入预训练的音质转换模型中,输出低音质谱系数对应的高音质谱系数,其中音质转换模型的预训练过程包括,根据预设的高码率与预设的低码率分别对预设的高音质音频进行特征提取,获取预设的高音质音频分别对应的训练高音质谱系数与训练低音质谱系数;将训练低音质谱系数输入预设的神经网络模型获取转换高音质谱系数,计算训练高音质谱
系数与转换高音质谱系数之间的差值,以及根据差值对神经网络模型进行训练,获得音质转换模型;以及利用标准的LC3解码器对高音质谱系数对应的高音质码流进行剩余的解码步骤,获取低音质码流对应的高音质音频。
[0008]本申请采用的另一个技术方案是:提供一种提升音质的装置,其包括:低音质谱系数获取模块,其用于利用标准的LC3解码器,对蓝牙接收器接收到的低音质码流进行解码,直至变换域噪声整形模块输出低音质码流对应的低音质谱系数,其中低音质码流为码率小于预设码率的码流;音质提升模块,其用于将低音质谱系数输入预训练的音质转换模型中,输出低音质谱系数对应的高音质谱系数,其中音质转换模型的预训练过程包括,特征提取模块,根据预设的高码率与预设的低码率分别对预设的高音质音频进行特征提取,获取预设的高音质音频分别对应的训练高音质谱系数与训练低音质谱系数; 神经网络模块,其用于将训练低音质谱系数输入预设的神经网络模型获取转换高音质谱系数;差值计算模块,其用于计算训练高音质谱系数与转换高音质谱系数之间的差值,以及模型获取模块,根据差值对神经网络模型进行训练,获得音质转换模型;以及高音质音频获取模块,其用于利用标准的LC3解码器,对高音质谱系数进行剩余的解码步骤,获取低音质码流对应的高音质音频。
[0009]本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行方案一中的音质转换的模型训练方法或方案三种的提升音质的方法。
[0010]本申请采用的另一个技术方案是:提供一种计算机设备,其包括:至少一个处理器;以及与至少一个处理器进行通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的计算机指令,至少一个处理器操作计算机指令以执行方案一中的音质转换的模型训练方法或方案三种的提升音质的方法。
[0011]本申请的技术方案可以达到的有益效果是:通过提供一种音质转换模型,无需对低音质音频进行额外的编解码,通过在蓝牙无线设备装置自身的解码装置中加入上述音质转换模型,将质量不佳的低音质音频转换为高音质音频输出,以低复杂度实现即使在地铁、飞机场、火车站等蓝牙设备较多,导致干扰较多的场合,无线链路质量不佳的状况下,也能获取音质较高的音频,提高用户体验感。
附图说明
[0012]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0013]图1是本申请一种音质转换的模型训练方法的一个可选实施方式的示意图;图2是本申请一种提升音质的方法的一个可选实施方式的示意图;图3是本申请一种提升音质的装置的一个可选实施方式的示意图。
[0014]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0015]下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
[0016]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0017]由于在音频播放前,手机、平板电脑、蓝牙发射器等蓝牙发射端与蓝牙耳机等蓝牙接收端之间通信的相关参数,根据该蓝牙发射本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音质转换的模型训练方法,其特征在于,包括:根据预设的高码率与预设的低码率分别对预设的高音质音频进行特征提取,获取所述高音质音频分别对应的训练高音质谱系数与训练低音质谱系数;将所述训练低音质谱系数输入预设的神经网络模型获取转换高音质谱系数,计算所述训练高音质谱系数与所述转换高音质谱系数之间的差值;以及根据所述差值对所述神经网络模型进行训练,获得音质转换模型。2.根据权利要求1所述的音质转换的模型训练方法,其特征在于,所述根据预设的高码率与预设的低码率分别对预设的高音质音频进行特征提取,获取所述高音质音频分别对应的训练高音质谱系数与训练低音质谱系数,进一步包括:根据所述高码率与所述低码率分别对所述高音质音频进行编码,获取所述高音质音频分别对应的训练高音质码流与训练低音质码流,其中,所述低码率小于所述高码率;利用标准的LC3解码器对所述训练高音质码流与所述训练低音质码流分别进行解码,直至变换域噪声整形模块输出所述训练高音质谱系数与所述训练低音质谱系数。3.根据权利要求1所述的音质转换的模型训练方法,其特征在于,所述将所述训练低音质谱系数输入预设的神经网络模型获取转换高音质谱系数,计算所述训练高音质谱系数与所述转换高音质谱系数之间的差值,进一步包括:所述神经网络模型将所述训练低音质谱系数转换为第N转换高音质谱系数,其中所述转换高音质谱系数包括所述第N转换高音质谱系数,所述N为大于0的自然数;计算所述第N转换高音质谱系数与所述训练高音质谱系数的第N差值,其中所述差值包括所述第N差值。4.根据权利要求3所述的音质转换的模型训练方法,其特征在于,所述根据所述差值对所述神经网络模型进行训练,获得音质转换模型,进一步包括:将所述第N差值与预设差值进行对比;若所述第N差值大于所述预设差值,则对所述神经网络模型中的相关参数进行调整,获取所述音质转换模型;若所述第N差值小于或等于所述预设差值,则将所述神经网络模型确定为所述音质转换模型。5.根据权利要求4所述的音质转换的模型训练方法,其特征在于,所述对所述神经网络模型中的相关参数进行调整,获取所述神经网络模型,进一步包括:根据所述第N差值对所述相关参数进行调整,获取第N更新神经网络模型;将所述训练低音质谱系输入所述第N更新神经网络模型,获取所述训练低音质谱系数对应的第N+1转换高音质谱系数;计算所述训练高音质谱系数与所述第N+1转换高音质谱系数之间的第N+1差值;所述第N+1差值小于或等于所述预设差值,则将所述N+1更新神经网络模型确定为所述音质转换模型。6.根据权利要求5所述的音质转换的模型训练方法,其特征在于,根据若所述第N差值大于所述预设差值,还包括:记录所述神经网络模型的训练次数N;...

【专利技术属性】
技术研发人员:李强王尧叶东翔朱勇
申请(专利权)人:北京百瑞互联技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1