音频样本生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:24938239 阅读:36 留言:0更新日期:2020-07-17 20:59
本申请公开了一种音频样本生成方法、装置、计算机设备及存储介质,涉及音频技术领域。该方法包括:根据音频属性特征对音频库中的音频进行聚类,得到音频类簇,音频属性特征包括至少两个不同维度的属性特征;根据音频类簇中的音频生成候选音频对,候选音频对中包含两段音频;根据音频库中音频的历史播放记录,确定候选音频对中的音频正样本对和音频负样本对,音频正样本对中的音频属于同一音频类簇,音频负样本对中的音频属于不同音频类簇。通过融合音频多维度的属性特征进行聚类,并基于用户的音频播放记录筛选正负样本对,使生成音频样本对能够从多角度反映音频之间的相似性,在实现自动生成音频样本对的同时,提高了生成的音频样本对的质量。

【技术实现步骤摘要】
音频样本生成方法、装置、计算机设备及存储介质
本申请实施例涉及音频
,特别涉及一种音频样本生成方法、装置、计算机设备及存储介质。
技术介绍
音乐推荐是音频播放应用程序中的常用功能,能够根据用户的喜好向用户推荐音乐。在一种实现音乐推荐的方式中,音频播放应用程序的后台服务器通过音频匹配模型,对曲库中的音乐进行匹配,从而确定出匹配程度较高的音乐,进而根据匹配结果进行音乐推荐。在使用音频匹配模型进行音频匹配之前,需要使用音频样本进行模型训练,而模型训练质量与音频样本密切相关。相关技术中,通过常用人工标注的方式生成音频样本,即由专门人员确定出相似度较高的音乐,以及相似度较低的音乐。然而,采用上述方式生成的音频样本的效率较低,且质量较差(过于主观),进而导致模型训练质量较差,影响后续利用音频匹配模型进行音频匹配的准确性。
技术实现思路
本申请实施例提供了一种音频样本生成方法、装置、计算机设备及存储介质,可以提高音频样本的生成效率以及质量,从而提高利用音频样本训练得到的模型的质量。所述技术方案如下:一方面,本申请实施例提供了一种音频样本生成方法,所述方法包括:根据音频属性特征对音频库中的音频进行聚类,得到音频类簇,所述音频属性特征包括至少两个不同维度的属性特征,且不同音频类簇中音频的特征相似度低于同一音频类簇中音频的特征相似度;根据所述音频类簇中的音频生成候选音频对,所述候选音频对中包含两段音频,且所述两段音频属于同一音频类簇或不同音频类簇;根据所述音频库中音频的历史播放记录,确定所述候选音频对中的音频正样本对和音频负样本对,其中,所述音频正样本对中的音频属于同一音频类簇,所述音频负样本对中的音频属于不同音频类簇。另一方面,本申请实施例提供了一种音频样本生成装置,所述装置包括:聚类模块,用于根据音频属性特征对音频库中的音频进行聚类,得到音频类簇,所述音频属性特征包括至少两个不同维度的属性特征,且不同音频类簇中音频的特征相似度低于同一音频类簇中音频的特征相似度;生成模块,用于根据所述音频类簇中的音频生成候选音频对,所述候选音频对中包含两段音频,且所述两段音频属于同一音频类簇或不同音频类簇;确定模块,用于根据所述音频库中音频的历史播放记录,确定所述候选音频对中的音频正样本对和音频负样本对,其中,所述音频正样本对中的音频属于同一音频类簇,所述音频负样本对中的音频属于不同音频类簇。另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的音频样本生成方法。另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所述的音频样本生成方法。另一方面,提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如上述方面所述的音频样本生成方法。本申请实施例提供的技术方案带来的有益效果至少包括:本申请实施例中,首先根据不同维度的音频属性特征,对音频库中具有相似特征的音频进行聚类得到音频类簇,然后对属于相同或不同音频类簇进行组合,得到若干候选音频对,进而基于音频的历史播放记录,从候选音频对中筛选出音频正样本对和音频负样本对,用于后续模型训练;通过融合音频多维度的属性特征进行聚类,并基于用户的音频播放记录筛选正负样本对,使生成音频样本对能够从多角度反映音频之间的相似性(包括音频本身属性和用户收听习惯),在实现自动生成音频样本对的同时,提高了生成的音频样本对的质量,进而提高了后续基于音频样本进行模型训练的质量。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请一个示例性实施例提供的音频样本生成方法的原理示意图;图2示出了本申请一个示例性实施例提供的实施环境的示意图;图3示出了本申请另一个示例性实施例提供的实施环境的示意图;图4示出了本申请一个示例性实施例提供的音频样本生成方法的流程图;图5示出了本申请另一个示例性实施例提供的音频样本生成方法的流程图;图6是一个示例性实施例提供的音频特征获取过程的实施示意图;图7是一个示例性实施例提供的音频样本生成过程的实施示意图;图8是一个示例性实施例提供的筛选音频正样本对过程的流程图;图9是一个示例性实施例提供的划分音频共现集合过程的实施示意图;图10是一个示例性实施例提供的第一评分分布的示意图;图11是一个示例性实施例提供的筛选音频负样本对过程的流程图;图12是本申请一个示例性实施例提供音频样本生成装置的结构框图;图13示出了本申请一个示例性实施例提供的计算机设备的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。为了方便理解,下面对本申请实施例中涉及的名词进行说明。聚类:一种将具有相似特征(或特性)的对象进行聚集的过程被称为聚类,而经过聚类得到的具有相似特征(或特性)的对象集合则被称为类簇。本申请实施例中的聚类过程则是指根据音频在至少两个属性维度上的特征,对相似音频进行聚集的过程。常用的聚类算法包括K均值(K-Means)聚类算法、均值漂移聚类算法、基于密度的聚类算法、谱聚类算法、层次聚类算法、最大期望(Expectation-Maximization,EM)聚类算法、高斯混合模型(MixtureOfGaussian,MOG)聚类算法。样本:指用于模型训练和测试的对象,该对象包含标注信息,该标注信息为模型输出结果的参考值(或称为真值或监督值),其中,标注信息为1的样本为正样本,标注信息为0的样本为负样本。本申请实施例中的样本指用于训练音频匹配模型的音频样本,且该音频样本采用样本对的形式,即音频样本中包含两段音频。可选的,当音频样本(对)的标注信息为1时,表明音频样本对中的两段音频为相似音频,即音频正样本对;当音频样本(对)的标注信息为0时,表明音频样本对中的两段音频不是相似音频,即音频负样本对。数据分布:本申请实施例中数据分布是指根据不同评分(或评分区间)下音频对的数量分布情况。在一个示意性的例子中,根据各个音频对的评分,确定出10个评分区间,并统计各个评分区间内音频对的数量,从而得到评分的数据分布。为了提高音频样本(用于训练音频匹配模型)的样本质量以及样本生成效率,如图1所示,本申请实施例提供的音频本文档来自技高网...

【技术保护点】
1.一种音频样本生成方法,其特征在于,所述方法包括:/n根据音频属性特征对音频库中的音频进行聚类,得到音频类簇,所述音频属性特征包括至少两个不同维度的属性特征,且不同音频类簇中音频的特征相似度低于同一音频类簇中音频的特征相似度;/n根据所述音频类簇中的音频生成候选音频对,所述候选音频对中包含两段音频,且所述两段音频属于同一音频类簇或不同音频类簇;/n根据所述音频库中音频的历史播放记录,确定所述候选音频对中的音频正样本对和音频负样本对,其中,所述音频正样本对中的音频属于同一音频类簇,所述音频负样本对中的音频属于不同音频类簇。/n

【技术特征摘要】
1.一种音频样本生成方法,其特征在于,所述方法包括:
根据音频属性特征对音频库中的音频进行聚类,得到音频类簇,所述音频属性特征包括至少两个不同维度的属性特征,且不同音频类簇中音频的特征相似度低于同一音频类簇中音频的特征相似度;
根据所述音频类簇中的音频生成候选音频对,所述候选音频对中包含两段音频,且所述两段音频属于同一音频类簇或不同音频类簇;
根据所述音频库中音频的历史播放记录,确定所述候选音频对中的音频正样本对和音频负样本对,其中,所述音频正样本对中的音频属于同一音频类簇,所述音频负样本对中的音频属于不同音频类簇。


2.根据权利要求1所述的方法,其特征在于,所述根据所述音频类簇中的音频生成候选音频对,包括:
根据同一音频类簇中的音频生成第一候选音频对,并根据所述不同音频类簇中的音频生成第二候选音频对;
所述根据所述音频库中音频的历史播放记录,确定所述候选音频对中的音频正样本对和音频负样本对,包括:
根据所述历史播放记录,从所述第一候选音频对中确定所述音频正样本对;
根据所述历史播放记录,从所述第二候选音频对中确定所述音频负样本对。


3.根据权利要求2所述的方法,其特征在于,所述根据所述历史播放记录,从所述第一候选音频对中确定所述音频正样本对,包括:
获取所述历史播放记录中的音频播放序列,所述音频播放序列用于表征用户帐号下音频的先后播放顺序,且不同音频播放序列对应不同用户帐号;
对所述音频播放序列进行划分,得到音频共现集合,所述音频共现集合中包含至少两段连续播放的音频,且不同音频共现集合中包含的音频不同;
根据所述音频共现集合,从所述第一候选音频对中确定所述音频正样本对。


4.根据权利要求3所述的方法,其特征在于,所述根据所述音频共现集合,从所述第一候选音频对中确定所述音频正样本对,包括:
获取所述第一候选音频对在所述音频共现集合中的第一共现次数;
根据所述第一共现次数和所述音频共现集合的集合数,确定所述第一候选音频对的第一评分;
根据所述第一评分的第一评分分布以及正样本数量,确定第一评分区间,所述第一评分分布为所述第一评分的降序分布,且属于所述第一评分区间的所述第一候选音频对位于所述第一评分分布的前半部;
将属于所述第一评分区间的所述第一候选音频对确定为所述音频正样本对。


5.根据权利要求2所述的方法,其特征在于,所述根据所述历史播放记录,从所述第二候选音频对中确定所述音频负样本对,包括:
获取所述历史播放记录中的音频播放序列,所述音频播放序列用于表征用户帐号下音频的先后播放顺序,且不同音频播放序列对应不同用户帐号;
对所述音频播放序列进行划分,得到音频共现集合,所述音频共现集合中包含至少两段连续播放的音频,且不同音频共现集合中包含的音频不同;
根据所述音频共现集合,从所述第二候选音频对中确定所述音频负样本对。


6.根据权利要求5所述的方法,其特征在于,所述根据所述音频共现集合,从所述第二候...

【专利技术属性】
技术研发人员:缪畅宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1