音乐神经网络模型预训练方法及电子设备和存储介质技术

技术编号：30091902 阅读：16 留言：0更新日期：2021-09-18 08:54

本申请公开了一种音乐神经网络模型预训练方法、电子设备和存储介质，该方法包括：对原始音频特征向量中的待掩码特征子向量进行掩码处理得到掩码特征子向量，并将原始音频特征向量中的待掩码特征子向量替换为掩码特征子向量；将掩码特征向量输入待训练神经网络中预测预测音频特征子向量；对待掩码特征子向量中的原始音频特征进行离散化处理得到离散化待掩码特征子向量，并将离散化待掩码特征子向量作为正样本与多个负样本进行拼接得到拼接音频特征向量；基于预测音频特征子向量和拼接音频特征向量构建损失函数，调整待训练神经网络中的参数直至损失函数收敛，得到预训练完成的音乐神经网络模型，提高了下游任务中神经网络模型的训练速度和性能。模型的训练速度和性能。模型的训练速度和性能。

全部详细技术资料下载

【技术实现步骤摘要】
音乐神经网络模型预训练方法及电子设备和存储介质

[0001]本申请涉及音乐
，更具体地说，涉及音乐神经网络模型预训练方法及电子设备和计算机可读存储介质。

技术介绍

[0002]对于音乐领域的神经网络模型，在相关技术中，基于原始音频进行预训练，即将原始音频转化为频谱，对部分频谱进行掩码，然后通过编码器
‑
解码器的方法对被掩码音频进行预测，进而进行神经网络模型的预训练。编码器
‑
解码器的目的在于重建被掩码掉的音频，但是在下游任务中，如分类任务中，模型通常不需要音频的全部信息来进行预测，基于上述方式预训练完成的神经网络模型进行训练，影响训练速度和训练完成的神经网络模型的性能较差。
[0003]因此，如何提高下游任务中神经网络模型训练的速度和训练完成的神经网络模型的性能是本领域技术人员需要解决的技术问题。

技术实现思路

[0004]本申请的目的在于提供一种音乐神经网络模型预训练方法及一种电子设备和一种计算机可读存储介质，提高了下游任务中神经网络模型训练的速度和训练完成的神经网络模型的性能。
[0005]为实现上述目的，本申请第一方面提供了一种音乐神经网络模型预训练方法，包括：
[0006]获取原始音频特征向量，对所述原始音频特征向量中的待掩码特征子向量进行掩码处理得到掩码特征子向量，并将所述原始音频特征向量中的待掩码特征子向量替换为所述掩码特征子向量；
[0007]将所述掩码特征向量输入待训练神经网络中，以预测所述掩码特征子向量对应的预...

【技术保护点】

【技术特征摘要】
1.一种音乐神经网络模型预训练方法，其特征在于，包括：获取原始音频特征向量，对所述原始音频特征向量中的待掩码特征子向量进行掩码处理得到掩码特征子向量，并将所述原始音频特征向量中的待掩码特征子向量替换为所述掩码特征子向量；将所述掩码特征向量输入待训练神经网络中，以预测所述掩码特征子向量对应的预测音频特征子向量；对所述待掩码特征子向量中的原始音频特征进行离散化处理得到离散化待掩码特征子向量，并将所述离散化待掩码特征子向量作为正样本与多个负样本进行拼接得到拼接音频特征向量；基于所述预测音频特征子向量和所述拼接音频特征向量构建损失函数，并基于所述损失函数的当前值调整所述待训练神经网络中的参数，直至所述损失函数收敛，得到预训练完成的音乐神经网络模型。2.根据权利要求1所述音乐神经网络模型预训练方法，其特征在于，对所述原始音频特征向量中的待掩码特征子向量进行掩码处理得到掩码特征子向量，包括：基于预设概率分布和预设长度确定掩码特征数量，并在所述原始音频特征向量中确定待掩码特征子向量；其中，所述待掩码特征子向量中原始音频特征为所述掩码特征数量；对所述待掩码特征子向量进行掩码处理得到掩码特征子向量。3.根据权利要求1所述音乐神经网络模型预训练方法，其特征在于，对所述待掩码特征子向量中的原始音频特征进行离散化处理得到离散化待掩码特征子向量，包括：基于预设分类规则生成目标维度的离散化向量表；其中，所述目标维度为所述待掩码特征子向量中原始音频特征的维度；基于所述预设分类规则确定所述待掩码特征子向量中每个原始音频特征对应的类别，以生成所述待掩码特征子向量对应的类别向量；将所述类别向量与所述离散化向量表的乘积确定为离散化待掩码特征子向量。4.根据权利要求3所述音乐神经网络模型预训练方法，其特征在于，所述基于所述预设分类规则确定所述待掩码特征子向量中每个原始音频特征对应的类别，以生成所述待掩码特征子向量对应的类别向量，包括：利用全连接层基于预设分类规则确定所述待掩码特征子向量中每...

【专利技术属性】
技术研发人员：李宇峰，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人