音频数据处理方法、装置、设备、存储介质及产品制造方法及图纸

技术编号：35570243 阅读：13 留言：0更新日期：2022-11-12 15:54

本申请实施例提供了一种音频数据处理方法、装置、设备、存储介质及产品，包括：获取样本多轨音频数据以及N个音频片段分别对应的标注音频特征信息；根据音频片段N1的标注音频特征信息，确定音频片段N1的预测音频特征信息；采用初始音频生成模型根据音频片段集合中的音频片段的标注音频特征信息，预测音频片段N

全部详细技术资料下载

【技术实现步骤摘要】
音频数据处理方法、装置、设备、存储介质及产品

[0001]本申请涉及音频处理
，尤其涉及一种音频数据处理方法、装置、设备、存储介质及产品。

技术介绍

[0002]音频，如音乐，用于人们的日常休闲娱乐。例如，对于音乐来说，音乐的曲谱都是作曲家自己手动进行创作。由一些歌手基于该曲谱和歌词进行演唱，并在演唱的过程中进行录制，从而生成该歌曲。然而该方式不够自动化智能化。

技术实现思路

[0003]本申请实施例提供了一种音频数据处理方法、装置、设备及存储介质，可以实现音频数据的自动化智能化生成。
[0004]第一方面，本申请实施例提供了一种音频数据处理方法，包括：
[0005]获取样本多轨音频数据以及N个音频片段分别对应的标注音频特征信息；所述样本多轨音频数据包括至少两个演奏乐器生成的所述N个音频片段；N为大于或等于1的整数；
[0006]根据音频片段N1的标注音频特征信息，确定所述音频片段N1的预测音频特征信息；所述音频片段N1为所述N个音频片段中播放时间最早的音频片段；
[0007]采用初始音频生成模型根据音频片段集合中的音频片段的标注音频特征信息，预测音频片段N
i
的预测音频特征信息；所述音频片段N
i
属于所述N个音频片段中除所述音频片段N1以外的音频片段，i为大于1且小于或等于N的正整数；所述音频片段集合包括所述N个音频片段中播放时间位于所述音频片段N
i
之前的所有音频片段；
[0008]若获取到所述N个...

【技术保护点】

【技术特征摘要】
1.一种音频数据处理方法，其特征在于，包括：获取样本多轨音频数据以及N个音频片段分别对应的标注音频特征信息；所述样本多轨音频数据包括至少两个演奏乐器生成的所述N个音频片段；N为大于或等于1的整数；根据音频片段N1的标注音频特征信息，确定所述音频片段N1的预测音频特征信息；所述音频片段N1为所述N个音频片段中播放时间最早的音频片段；采用初始音频生成模型根据音频片段集合中的音频片段的标注音频特征信息，预测音频片段N
i
的预测音频特征信息；所述音频片段N
i
属于所述N个音频片段中除所述音频片段N1以外的音频片段，i为大于1且小于或等于N的正整数；所述音频片段集合包括所述N个音频片段中播放时间位于所述音频片段N
i
之前的所有音频片段；若获取到所述N个音频片段分别对应的预测音频特征信息，则根据所述N个音频片段分别对应的标注音频特征信息，以及所述N个音频片段分别对应的预测音频特征信息，对所述初始音频生成模型进行调整，将调整后的初始音频生成模型确定为用于生成目标多轨音频数据的目标音频生成模型。2.根据权利要求1所述的方法，其特征在于，所述获取N个音频片段分别对应的标注音频特征信息，包括：对所述样本多轨音频数据进行节拍检测，得到所述样本多轨音频数据的M个音频小节；M大于或等于1的整数；对音频小节M
j
进行音符识别，得到所述音频小节M
j
对应的音频片段，以及所述音频小节M
j
对应的音频片段的基本音频属性；j为小于或等于M的正整数，所述音频小节M
j
内的一个音符与一个音频片段对应，所述M个音频小节对应的音频片段的数量为N个；根据所述音频小节M
j
对应的音频片段的基本音频属性，确定所述音频小节M
j
对应的音频片段的标注音频特征信息。3.根据权利要求2所述的方法，所述音频小节M
j
对应的目标音频片段的基本音频属性包括所述目标音频片段的音符类型、发音强度、发音时长、音色、音频节拍；所述目标音频片段为所述音频小节M
j
对应的音频片段中的任一音频片段；所述根据所述音频小节M
j
对应的音频片段的基本音频属性，确定所述音频小节M
j
对应的音频片段的标注音频特征信息，包括：对所述音频小节M
j
对应的所有音频片段的发音强度进行分布检测，确定所述音频小节M
j
对应的发音强度分布特征；根据所述音频小节M
j
对应的发音强度分布特征，确定所述目标音频片段的音频节拍类别；根据所述音频小节M
j
对应的所有音频片段的音符类型，确定所述目标音频片段的和弦特征；所述音频小节M
j
对应的不同音频片段之间的和弦特征相同；根据所述目标音频片段的音色，确定所述目标音频片段对应的演奏乐器类别；根据所述音频小节M
j
对应的所有音频片段的发音时长，以及所述音频小节M
j
对应的所有音频片段的音频节拍，确定所述目标音频片段的发音速度；所述音频小节M
j
对应的不同音频片段之间的发音速度均相同；将所述目标音频片段对应的音频节拍类别、和弦特征、演奏乐器类别、音符类型、发音强度、发音时长、发音速度，确定为所述目标音频片段的标注音频特征信息。
4.根据权利要求3所述的方法，其特征在于，所述根据所述目标音频片段的音色，确定所述目标音频片段对应的演奏乐器类别，包括：根据所述目标音...

【专利技术属性】
技术研发人员：袁微，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人