音频样本生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：24938239 阅读：36 留言：0更新日期：2020-07-17 20:59

本申请公开了一种音频样本生成方法、装置、计算机设备及存储介质，涉及音频技术领域。该方法包括：根据音频属性特征对音频库中的音频进行聚类，得到音频类簇，音频属性特征包括至少两个不同维度的属性特征；根据音频类簇中的音频生成候选音频对，候选音频对中包含两段音频；根据音频库中音频的历史播放记录，确定候选音频对中的音频正样本对和音频负样本对，音频正样本对中的音频属于同一音频类簇，音频负样本对中的音频属于不同音频类簇。通过融合音频多维度的属性特征进行聚类，并基于用户的音频播放记录筛选正负样本对，使生成音频样本对能够从多角度反映音频之间的相似性，在实现自动生成音频样本对的同时，提高了生成的音频样本对的质量。

全部详细技术资料下载

【技术实现步骤摘要】
音频样本生成方法、装置、计算机设备及存储介质
本申请实施例涉及音频
，特别涉及一种音频样本生成方法、装置、计算机设备及存储介质。
技术介绍
音乐推荐是音频播放应用程序中的常用功能，能够根据用户的喜好向用户推荐音乐。在一种实现音乐推荐的方式中，音频播放应用程序的后台服务器通过音频匹配模型，对曲库中的音乐进行匹配，从而确定出匹配程度较高的音乐，进而根据匹配结果进行音乐推荐。在使用音频匹配模型进行音频匹配之前，需要使用音频样本进行模型训练，而模型训练质量与音频样本密切相关。相关技术中，通过常用人工标注的方式生成音频样本，即由专门人员确定出相似度较高的音乐，以及相似度较低的音乐。然而，采用上述方式生成的音频样本的效率较低，且质量较差(过于主观)，进而导致模型训练质量较差，影响后续利用音频匹配模型进行音频匹配的准确性。
技术实现思路
本申请实施例提供了一种音频样本生成方法、装置、计算机设备及存储介质，可以提高音频样本的生成效率以及质量，从而提高利用音频样本训练得到的模型的质量。所述技术方案如下：一方面，本申请实施例提供了一种音频样本生成方法，所述方法包括：根据音频属性特征对音频库中的音频进行聚类，得到音频类簇，所述音频属性特征包括至少两个不同维度的属性特征，且不同音频类簇中音频的特征相似度低于同一音频类簇中音频的特征相似度；根据所述音频类簇中的音频生成候选音频对，所述候选音频对中包含两段音频，且所述两段音频属于同一音频类簇或不同音频类簇；根据所述...

【技术保护点】
1.一种音频样本生成方法，其特征在于，所述方法包括：/n根据音频属性特征对音频库中的音频进行聚类，得到音频类簇，所述音频属性特征包括至少两个不同维度的属性特征，且不同音频类簇中音频的特征相似度低于同一音频类簇中音频的特征相似度；/n根据所述音频类簇中的音频生成候选音频对，所述候选音频对中包含两段音频，且所述两段音频属于同一音频类簇或不同音频类簇；/n根据所述音频库中音频的历史播放记录，确定所述候选音频对中的音频正样本对和音频负样本对，其中，所述音频正样本对中的音频属于同一音频类簇，所述音频负样本对中的音频属于不同音频类簇。/n

【技术特征摘要】
1.一种音频样本生成方法，其特征在于，所述方法包括：
根据音频属性特征对音频库中的音频进行聚类，得到音频类簇，所述音频属性特征包括至少两个不同维度的属性特征，且不同音频类簇中音频的特征相似度低于同一音频类簇中音频的特征相似度；
根据所述音频类簇中的音频生成候选音频对，所述候选音频对中包含两段音频，且所述两段音频属于同一音频类簇或不同音频类簇；
根据所述音频库中音频的历史播放记录，确定所述候选音频对中的音频正样本对和音频负样本对，其中，所述音频正样本对中的音频属于同一音频类簇，所述音频负样本对中的音频属于不同音频类簇。

2.根据权利要求1所述的方法，其特征在于，所述根据所述音频类簇中的音频生成候选音频对，包括：
根据同一音频类簇中的音频生成第一候选音频对，并根据所述不同音频类簇中的音频生成第二候选音频对；
所述根据所述音频库中音频的历史播放记录，确定所述候选音频对中的音频正样本对和音频负样本对，包括：
根据所述历史播放记录，从所述第一候选音频对中确定所述音频正样本对；
根据所述历史播放记录，从所述第二候选音频对中确定所述音频负样本对。

3.根据权利要求2所述的方法，其特征在于，所述根据所述历史播放记录，从所述第一候选音频对中确定所述音频正样本对，包括：
获取所述历史播放记录中的音频播放序列，所述音频播放序列用于表征用户帐号下音频的先后播放顺序，且不同音频播放序列对应不同用户帐号；
对所述音频播放序列进行划分，得到音频共现集合，所述音频共现集合中包含至少两段连续播放的音频，且不同音频共现集合中包含的音频不同；
根据所述音频共现集合，从所述第一候选音频对中确定所述音频正样本对。

4.根据权利要求3所述的方法，其特征在于，所述根据所述音频共现集合，从所述第一候选音频对中确定所述音频正样本对，包括：
获取所述第一候选音频对在所述音频共现集合中的第一共现次数；
根据所述第一共现次数和所述音频共现集合的集合数，确定所述第一候选音频对的第一评分；
根据所述第一评分的第一评分分布以及正样本数量，确定第一评分区间，所述第一评分分布为所述第一评分的降序分布，且属于所述第一评分区间的所述第一候选音频对位于所述第一评分分布的前半部；
将属于所述第一评分区间的所述第一候选音频对确定为所述音频正样本对。

5.根据权利要求2所述的方法，其特征在于，所述根据所述历史播放记录，从所述第二候选音频对中确定所述音频负样本对，包括：
获取所述历史播放记录中的音频播放序列，所述音频播放序列用于表征用户帐号下音频的先后播放顺序，且不同音频播放序列对应不同用户帐号；
对所述音频播放序列进行划分，得到音频共现集合，所述音频共现集合中包含至少两段连续播放的音频，且不同音频共现集合中包含的音频不同；
根据所述音频共现集合，从所述第二候选音频对中确定所述音频负样本对。

6.根据权利要求5所述的方法，其特征在于，所述根据所述音频共现集合，从所述第二候...

【专利技术属性】
技术研发人员：缪畅宇，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人