【技术实现步骤摘要】
一种潜力爆款歌曲挖掘方法、装置、设备及介质
[0001]本申请涉及音乐处理
,特别涉及一种潜力爆款歌曲挖掘方法、装置、设备、介质。
技术介绍
[0002]在音乐应用中,通常会进行潜力爆款歌曲挖掘,以便吸引更多的用户以及提高用户粘性等。目前的潜力爆款歌曲挖掘方法主要是,利用歌曲音频信息等进行挖掘潜力爆款歌曲,以及应用黑马用户进行挖掘的黑马算法。但是上述两种方法都存在较多相关的潜力爆款歌曲不能被检出的问题,也即,对潜力爆款歌曲的召回率较低。
技术实现思路
[0003]有鉴于此,本申请的目的在于提供一种潜力爆款歌曲挖掘方法、装置、设备、介质,能够提高对潜力爆款歌曲的召回率。其具体方案如下:
[0004]第一方面,本申请公开了一种潜力爆款歌曲挖掘方法,包括:
[0005]获取候选歌曲的第一评论数据及参考爆款歌曲的第二评论数据;
[0006]分别对所述第一评论数据和所述第二评论数据进行处理,筛选出第一优良评论数据和第二优良评论数据;
[0007]分别对所述第一优良评论数据对应的第一 ...
【技术保护点】
【技术特征摘要】
1.一种潜力爆款歌曲挖掘方法,其特征在于,包括:获取候选歌曲的第一评论数据及参考爆款歌曲的第二评论数据;分别对所述第一评论数据和所述第二评论数据进行处理,筛选出第一优良评论数据和第二优良评论数据;分别对所述第一优良评论数据对应的第一向量和所述第二优良评论数据对应的第二向量进行全样本空间上的各向同性变换,得到第一处理后向量和第二处理后向量;分别利用所述第一处理后向量和所述第二处理后向量确定所述候选歌曲的候选歌曲向量和所述参考爆款歌曲的参考向量;确定所述候选歌曲向量与所述参考向量之间的相似度,并根据所述相似度确定所述候选歌曲是否为潜力爆款歌曲。2.根据权利要求1所述的潜力爆款歌曲挖掘方法,其特征在于,所述分别对所述第一评论数据和所述第二评论数据进行处理,筛选出第一优良评论数据和第二优良评论数据,包括:将所述第一评论数据输入到预先训练完成的BERT模型中,得到所述BERT模型输出的第一分类结果,并将所述第一分类结果中的优质评论数据和良好评论数据作为所述第一优良评论数据;将所述第二评论数据输入到所述BERT模型中,得到所述BERT模型输出的第二分类结果,并将所述第二分类结果中的优质评论数据和良好评论数据作为所述第二优良评论数据。3.根据权利要求2所述的潜力爆款歌曲挖掘方法,其特征在于,对所述第一优良评论数据对应的第一向量进行全样本空间上的各向同性变换,得到第一处理后向量,包括:将所述第一优良评论数据经过所述BERT模型的最后一层时的CLS向量作为所述第一向量,其中,所述第一向量中包括不同评论对应的向量;确定所述第一向量中各条评论对应的向量的平均向量;利用所述平均向量和第一运算公式确定协方差矩阵,其中,所述第一运算公式为:V表示所述协方差矩阵,N表示所述第一向量对应的评论的总条数,x
i
表示所述第一向量中第i条评论对应的向量,x
i
为1
×
m维的向量,(
·
)
T
表示矩阵的转置运算,u表示所述平均向量;根据第二运算公式对所述协方差矩阵做奇异值分解,确定出第一矩阵和第二矩阵,其中,所述第二运算公式为:V=UQU
T
,U表示第一矩阵,Q表示第二矩阵;利用所述第一矩阵、所述第二矩阵和第三运算公式确定变换矩阵,其中,所述第三运算公式为:W表示所述变换矩阵,(
·...
【专利技术属性】
技术研发人员:吴跃,
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。