一种码率确定模型训练方法、码率确定方法及装置制造方法及图纸

技术编号:26175246 阅读:56 留言:0更新日期:2020-10-31 14:07
本公开关于一种码率确定模型训练方法、码率确定方法及装置,该方法包括:获取音频样本数据集合;获取每个音频信号的特征信息和音频信号对应的目标编码码率;将获取的所述特征信息输入待训练的码率确定模型中,得到待训练的码率确定模型输出的编码码率;根据待训练的码率确定模型输出的编码码率和所述目标编码码率,获取待训练的码率确定模型的损失值;根据损失值调整待训练的码率确定模型的模型参数,直至损失值低于预设阈值时,将待训练的码率确定模型作为训练好的码率确定模型。这样,后续步骤中,在对待编码音频信号进行编码时,通过该码率确定模型可以得到合适大小的编码码率,并能够保证编码后的音频信号的音频质量。

【技术实现步骤摘要】
一种码率确定模型训练方法、码率确定方法及装置
本申请涉及音视频
,特别是涉及一种码率确定模型训练方法、码率确定方法及装置。
技术介绍
随着移动互联网的发展,在终端上使用音频成为了越来越多用户的需求,为了节省传输资源和存储资源,音频信号在传输及存储中需要被编码。音频编码技术可以分为无损编码,即终端可以通过解码器完美恢复原始音频信号;另一种编码方式为有损编码,即终端通过解码器解码后的音频信号被不同程度的压缩。相关技术中,在对音频信号进行编码时,通常会指定一个码率,编码器可以按照指定码率进行编码,为了保证编码后的音频信号的质量,通常会指定一个高码率来对音频信号进行编码。这样,在传输编码后的音频信号时,会需要较高的传输带宽;并且,在存储编码后的音频信号时,会需要较大的存储空间,进而导致了传输资源和存储资源的浪费。
技术实现思路
为了解决相关技术中存在的因音频信号的编码码率高,而导致传输以及存储编码后的音频信号时,造成传输资源及存储资源浪费的技术问题,本公开提供了一种码率确定模型训练方法、码率确定方法及装置,本公开的技术方案如下:根据本公开实施例的第一方面,提供了一种码率确定模型训练方法,所述方法包括:获取音频样本数据集合,所述音频样本数据集合中包括不同类型的音频信号;获取每个所述音频信号的特征信息和所述音频信号对应的目标编码码率,所述特征信息与所述音频信号的类型相关联,所述目标编码码率为所述音频信号满足目标音频质量时的最低编码码率;将获取的所述特征信息输入待训练的码率确定模型中,得到所述待训练的码率确定模型输出的编码码率;根据所述待训练的码率确定模型输出的编码码率和所述目标编码码率,获取所述待训练的码率确定模型的损失值;根据所述损失值调整所述待训练的码率确定模型的模型参数,直至所述损失值低于预设阈值时,将所述待训练的码率确定模型作为训练好的码率确定模型。可选的,获取所述音频信号对应的目标编码码率,包括:根据预设码率对所述音频信号进行编码以得到编码后的音频信号;根据所述音频信号和所述编码后的音频信号,计算所述编码后的音频信号的质量损失值;当所述质量损失值小于质量损失阈值,且所述质量损失值为最小的质量损失值时,将所述预设码率确定为所述音频信号对应的目标编码码率。可选的,所述当所述质量损失值小于质量损失阈值,且所述质量损失值为最小的质量损失值时,将所述预设码率确定为所述音频信号对应的目标编码码率,包括:当所述质量损失值小于质量损失阈值时,减小所述预设码率,并根据减小后的预设码率对所述音频信号进行编码以得到编码后的音频信号,直到所述音频质量损失值大于所述质量损失阈值;将前一个减小后的预设码率作为目标编码码率。可选的,所述获取每个所述音频信号的特征信息,包括:获取每个所述音频信号在时频域的振幅信息和相位信息,根据所述振幅信息和/或相位信息确定所述音频信号的特征信息。可选的,所述获取每个所述音频信号的特征信息和所述音频信号对应的目标编码码率,包括:获取每个所述音频信号的每一帧信号的特征信息和所述音频信号的每一帧信号对应的目标编码码率;或,获取每个所述音频信号中的每一帧信号的特征信息,将各帧信号的特征信息的平均值作为所述音频信号的特征信息,且获取与所述音频信号的特征信息对应的目标编码码率。根据本公开实施例的第二方面,提供了一种码率确定方法,所述方法包括:获取待编码音频信号的特征信息;将所述待编码音频信号的特征信息输入第一方面所述的码率确定模型,得到所述待编码音频信号对应的编码码率,以按照所述待编码音频信号对应的编码码率对所述待编码音频信号进行编码。可选的,所述获取待编码音频信号的特征信息,包括:获取所述待编码音频信号在时频域的振幅信息和相位信息,根据所述振幅信息和/或相位信息确定所述待编码音频信号的特征信息。可选的,所述获取待编码音频信号的特征信息,包括:获取待编码音频信号的每一帧信号的特征信息;或,获取待编码音频信息中的每一帧信号的特征信息,将各帧信号的特征信号的平均值作为所述待编码音频信号的特征信息。根据本公开实施例的第三方面,提供了一种码率确定模型训练装置,所述装置包括:音频信号获取模块,被配置为执行获取音频样本数据集合,所述音频样本数据集合中包括不同类型的音频信号;信息及码率获取模块,被配置为执行获取每个所述音频信号的特征信息和所述音频信号对应的目标编码码率,所述特征信息与所述音频信号的类型相关联,所述目标编码码率为所述音频信号满足目标音频质量时的最低编码码率;编码码率获取模块,被配置为执行将获取的所述特征信息输入待训练的码率确定模型中,得到所述待训练的码率确定模型输出的编码码率;损失值获取模块,被配置为执行根据所述待训练的码率确定模型输出的编码码率和所述目标编码码率,获取所述待训练的码率确定模型的损失值;模型参数调整模块,被配置为执行根据所述损失值调整所述待训练的码率确定模型的模型参数,直至所述损失值低于预设阈值时,将所述待训练的码率确定模型作为训练好的码率确定模型。可选的,所述信息及码率获取模块,包括:音频信号编码单元,被配置为执行根据预设码率对所述音频信号进行编码以得到编码后的音频信号;质量损失值计算单元,被配置为执行根据所述音频信号和所述编码后的音频信号,计算所述编码后的音频信号的质量损失值;目标编码码率确定单元,被配置为执行当所述质量损失值小于质量损失阈值,且所述质量损失值为最小的质量损失值时,将所述预设码率确定为所述音频信号对应的目标编码码率。可选的,所述目标编码码率确定单元,具体被配置为执行:当所述质量损失值小于质量损失阈值时,减小所述预设码率,并根据减小后的预设码率对所述音频信号进行编码以得到编码后的音频信号,直到所述音频质量损失值大于所述质量损失阈值;将前一个减小后的预设码率作为目标编码码率。可选的,所述信息及码率获取模块,具体被配置为执行:获取每个所述音频信号在时频域的振幅信息和相位信息,根据所述振幅信息和/或相位信息确定所述音频信号的特征信息。可选的,所述信息及码率获取模块,具体被配置为执行:获取每个所述音频信号的每一帧信号的特征信息和所述音频信号的每一帧信号对应的目标编码码率;或,获取每个所述音频信号中的每一帧信号的特征信息,将各帧信号的特征信息的平均值作为所述音频信号的特征信息,且获取与所述音频信号的特征信息对应的目标编码码率。根据本公开实施例的第四方面,提供了一种码率确定装置,所述装置包括:特征信息获取模块,被配置为执行获取待编码音频信号的特征信息;编码码率确定模块,被配置为执行将所述待编码音频信号的特征信息输入第三方面所述的码率确定模型,得到所述待编码音频信号对应的编码码率,以按照所述待编码音频信号对应的编码码率对本文档来自技高网...

【技术保护点】
1.一种码率确定模型训练方法,其特征在于,所述方法包括:/n获取音频样本数据集合,所述音频样本数据集合中包括不同类型的音频信号;/n获取每个所述音频信号的特征信息和所述音频信号对应的目标编码码率,所述特征信息与所述音频信号的类型相关联,所述目标编码码率为所述音频信号满足目标音频质量时的最低编码码率;/n将获取的所述特征信息输入待训练的码率确定模型中,得到所述待训练的码率确定模型输出的编码码率;/n根据所述待训练的码率确定模型输出的编码码率和所述目标编码码率,获取所述待训练的码率确定模型的损失值;/n根据所述损失值调整所述待训练的码率确定模型的模型参数,直至所述损失值低于预设阈值时,将所述待训练的码率确定模型作为训练好的码率确定模型。/n

【技术特征摘要】
1.一种码率确定模型训练方法,其特征在于,所述方法包括:
获取音频样本数据集合,所述音频样本数据集合中包括不同类型的音频信号;
获取每个所述音频信号的特征信息和所述音频信号对应的目标编码码率,所述特征信息与所述音频信号的类型相关联,所述目标编码码率为所述音频信号满足目标音频质量时的最低编码码率;
将获取的所述特征信息输入待训练的码率确定模型中,得到所述待训练的码率确定模型输出的编码码率;
根据所述待训练的码率确定模型输出的编码码率和所述目标编码码率,获取所述待训练的码率确定模型的损失值;
根据所述损失值调整所述待训练的码率确定模型的模型参数,直至所述损失值低于预设阈值时,将所述待训练的码率确定模型作为训练好的码率确定模型。


2.根据权利要求1所述的方法,其特征在于,获取所述音频信号对应的目标编码码率,包括:
根据预设码率对所述音频信号进行编码以得到编码后的音频信号;
根据所述音频信号和所述编码后的音频信号,计算所述编码后的音频信号的质量损失值;
当所述质量损失值小于质量损失阈值,且所述质量损失值为最小的质量损失值时,将所述预设码率确定为所述音频信号对应的目标编码码率。


3.根据权利要求2所述的方法,其特征在于,所述当所述质量损失值小于质量损失阈值,且所述质量损失值为最小的质量损失值时,将所述预设码率确定为所述音频信号对应的目标编码码率,包括:
当所述质量损失值小于质量损失阈值时,减小所述预设码率,并根据减小后的预设码率对所述音频信号进行编码以得到编码后的音频信号,直到所述音频质量损失值大于所述质量损失阈值;
将前一个减小后的预设码率作为目标编码码率。


4.一种码率确定方法,其特征在于,所述方法包括:
获取待编码音频信号的特征信息;
将所述待编码音频信号的特征信息输入权利要求1至3任一项所述的码率确定模型,得到所述待编码音频信号对应的编码码率,以按照所述待编码音频信号对应的编码码率对所述待编码音频信号进行编码。


5.一种码率确定模型训练装置,其特征在于,所述装置...

【专利技术属性】
技术研发人员:郑羲光董培张晨
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1