一种基于深度学习的音乐个性化分类推荐方法技术

技术编号:20221816 阅读:135 留言:0更新日期:2019-01-28 20:18
本发明专利技术公开了一种基于深度学习的音乐个性化分类推荐方法,包括对乐库中用户操作多的音乐建立向量模型来推荐相似音乐,同时训练一个深度网络模型分析音乐频谱图使用户操作数少的音乐也能有效地按用户喜好分类推荐。本方法主要利用了用户操作反馈和音乐频谱,能有效地避免人工建立复杂的音乐标签,同时对不同操作数的音乐区分操作,可以解决音乐新加入乐库的冷启动问题。

【技术实现步骤摘要】
一种基于深度学习的音乐个性化分类推荐方法
本专利技术涉及计算机
,具体涉及一种基于深度学习的音乐个性化分类推荐方法。
技术介绍
在互联网技术的迅速发展,人们可以通过手机等等终端享受音乐。网络上存有海量的音乐数据,为了方便用户发现合适的歌,传统音乐曲库需要人工为音乐本身录入流派,年代,作者等标签,然后再给用户推荐相同标签的歌曲。然而,在实践中发现,以曲库录入的标签需要专业人工录入,进行结构化,工作量巨大。且同一首音乐,不同的听众也会有不同的感受,根据曲库固定的标签对音乐进行分类没有考虑到大部分用户自身的实际收听感受,推荐不够灵活和准确。近年来,出现了深度学习的方法,其在特征学习方面有突出的贡献。与传统的机器学习方法不同,深度学习其网络可以根据输入自动学习特征,适于解决大数据分析问题。
技术实现思路
为了克服现有音乐推荐技术中存在的数据标签模型构造成本高的问题,推荐结果不过灵活和准确,提供一种基于深度学习的音乐个性化分类推荐方法,在大数据下按用户喜好分类推荐音乐的方法。本专利技术至少通过如下技术方案之一实现。通过记录用户收听过程中对音乐表示收听感受的操作,例如“收藏”、“喜欢”等,生成每个用户的喜欢音乐列表。在音乐列表中,邻近的音乐表示了用户对音乐由相似的喜好。把局部的音乐列表作为深度神经网络的输入,可以把大数据下用户表现出相似喜好的音乐映射到向量空间中相近的位置。对音乐向量进行聚类可以获得多个按用户喜好分类的音乐集合。同时,因为音乐的频谱可以有效的表示出音乐的一些特征,通过训练深度神经网络学习音乐的频谱特征分类音乐,获得音乐所属的用户喜好类别,再把音乐推荐给有同类喜好的用户。本专利技术采用如下技术方案。一种基于深度学习的音乐个性化分类推荐方法,包括如下步骤:S1获得表示用户喜好的歌曲列表;S2筛选出收听操作数多的高频次音乐列表,训练音乐向量模型;S3对音乐向量模型进行用户喜好聚类;S4训练深度网络对频谱图进行用户喜好分类;S5计算具体用户的喜好类别并为其推荐同类相似歌曲;进一步的,所述S1具体为:记录用户收听音乐过程中表示收听感受的操作,例如表示喜好的操作“收藏”、“喜欢”等,由此获得该用户一组喜欢的歌曲列表。进一步的,所述S2具体如下:S2.1统计所有音乐的操作频次,筛选出高频次音乐集合VH和低频次音乐集合VL。筛选出每个用户列表中属于VH的高频次音乐构成列表l,作为音乐向量模型的训练数据;S2.2给定一个音乐列表l,由音乐s1,s2,…,sT构成,以概率形式表示为其中的Contexti表示的音乐si的上下文,基于一段时间内用户喜好的音乐相似的假设,此处视为列表内该音乐前后w首音乐,w根据实验效果调整得出。首先将每首音乐按均匀分布初始化为统一维度的向量,然后构建一个只有一个隐层的全连接神经网络神经网络,输入为音乐向量,输出为Contexti包含的2w个音乐向量。根据所述概率模型,设计一个三层的神经网络学习音乐之间的关系;将每首音乐按均匀分布初始化为统一维度的向量,第一层输入层为Contexti包含的音乐向量,第二层投影层将音乐向量相加,第三层输出层为音乐向量;S2.3以xi输入为例,对应一组训练样本,xi为输入,为正样本,其余为k-1个负样本,根据歌曲出现频率随机采样负样本。目标函数为噪声对比估计函数(noise-contrastiveestimation(NCE)):其中,为正例的概率,为负例的概率,目标函数的意义是尽可能让真实的正例目标词获得高概率,而k个负例噪声词获得低概率。使用随机梯度上升训练S2.2中的神经网络模型,并得到相应的VH音乐向量。所述S3具体为:对S2获得的音乐向量进行T-SNE降维。然后使用常见聚类方法,如KMeans方法,对降维后的歌曲聚集成k簇,表示k个依据用户喜好划分的音乐种类。所述S4具体为:由于用户操作记录少的音乐通过S2的步骤获得描述自身的音乐向量模型不够准确,为提高准确性,将利用频谱图和S3中的聚类结果进行音乐分析,包括如下步骤:S4.1将音乐文件统一混音为单声道进行分析,对音频信号进行短时傅里叶变换获得频谱,然后将普通的频率标度转化为更适应人耳感知的梅尔频率标度,映射关系如下式所示:mel(f)=2595*log(1+f/700)每首音乐可以获得宽度固定,长度与音乐时间正相关的梅尔频谱图;S4.2构造卷积神经网络模型,典型的卷积神经网络包括输入层、卷积层、子采样层、全连接层和输出层;如图3构建卷积神经网络结构。为S3中获得的音乐分类构建训练集和测试集,为训练集中的音乐按照S4中的方法生成频谱图并切割成合适大小的片段输入网络以进行训练至参数稳定。测试集中每首歌曲按同样方法生成一组频谱图片段输入,统计每个片段通过网络后输出的分类,计数最大的判别为音乐的分类。进一步的,所述S5具体为:综合前几步结果,由S2可以获得VH高频次音乐集合的音乐向量,且根据S3至S4,可以获得VL低频次音乐集合所属的用户喜好分类;参考用户喜欢列表中最新加入列表的n首音乐,对n首音乐中存在高频次子列表,即子列表的音乐包含于高频次音乐集合VH中,则按S2获得的向量模型寻找其最近的m首音乐作为推荐,其中m,n按实际推荐效果选择合适的参数。对其余低频音乐,则按S4获得的分类为其推荐分类中的音乐。与现有技术相比,本专利技术的有益效果和优点如下:(1)本专利技术能自动对音乐按用户喜好分类,减少了推荐系统中人工建立分类标签的工作。(2)本专利技术结合了用户喜好和歌曲本身音频特征,在大数据下能有效的建立歌曲间的相似关系使推荐更为准确。(3)本专利技术针对冷启动的情形做了优化,在新入乐库的音乐未有足够用户喜好数据支撑时,通过深度学习分析频谱依然能找到相似的音乐进行推荐。附图说明图1是本专利技术的工作流程图;图2是实施例中音乐生成的梅尔频谱图片段;图3是实施例基于深度卷积神经网络的框架图。具体实施方式下面结合实施例及附图,对本专利技术作进一步地详细说明,但本专利技术的实施方式不限于此,需指出的是,以下若有未特别详细说明之过程或符号,均是本领域技术人员可参照现有技术实现或理解的(如概率模型)。实施例一种基于深度学习的音乐个性化分类推荐方法,包括如下步骤:S1通过音乐播放客户端上传并记录每个用户收听音乐过程中表示收听感受的操作,例如对某些音乐点击“喜欢”、“收藏”等按钮,由此获得表示该用户喜好的音乐列表。S2筛选出收听操作数多的高频次音乐列表,用大量(理论上越多越好)用户的高频次音乐列表训练音乐向量模型,具体包含如下步骤:S2.1后台根据S1中上传的所有用户对音乐的操作统计每首音乐被“喜欢”的频次,设定阈值MIN_LIKE,筛选出喜欢频次高于MIN_LIKE的高频次音乐集合VH,频次低于MIN_LIKE的音乐归为低频音乐集合VL。筛选出每个用户列表中的高频次音乐构成列表l作为音乐向量模型的训练数据;S2.2给定一个音乐列表l,由音乐s1,s2,…,sT构成,其概率模型可表示为其中的Contexti表示的音乐si的上下文,基于一段时间内用户喜好的音乐相似的假设,此处可视为列表内该音乐前后w首音乐,w根据实验效果调整得出。根据上述概率模型,设计一个三层的神经网络学习音乐之间的关系。将每首音乐按均匀分布初始化为统一维度的向量,第一层输入层为Co本文档来自技高网...

【技术保护点】
1.一种基于深度学习的音乐个性化分类推荐方法,其特征在于,包括如下步骤:S1记录每个用户收听音乐过程中表示收听感受的操作,获得表示用户喜好的歌曲列表;S2筛选出收听操作数多的高频次音乐列表,用适量多用户的高频次音乐列表训练音乐向量模型;S3对音乐向量模型进行用户喜好聚类;S4为收听操作数少的歌曲生成音乐频谱图;S5训练深度网络对频谱图进行用户喜好分类;S6通过用户喜好的歌曲列表计算具体用户的喜好类别并为其推荐同类相似歌曲。

【技术特征摘要】
1.一种基于深度学习的音乐个性化分类推荐方法,其特征在于,包括如下步骤:S1记录每个用户收听音乐过程中表示收听感受的操作,获得表示用户喜好的歌曲列表;S2筛选出收听操作数多的高频次音乐列表,用适量多用户的高频次音乐列表训练音乐向量模型;S3对音乐向量模型进行用户喜好聚类;S4为收听操作数少的歌曲生成音乐频谱图;S5训练深度网络对频谱图进行用户喜好分类;S6通过用户喜好的歌曲列表计算具体用户的喜好类别并为其推荐同类相似歌曲。2.根据权利要求1所述的一种基于深度学习的音乐个性化分类推荐方法,其特征在于,所述S1还包括对用户的操作细分,建立操作分级区分用户对歌曲的喜欢程度,从大到小为:“分享”>“收藏”>“试听”>“跳过”;并分别建立“分享”音乐列表、“收藏”音乐列表;然后根据不同的列表进行其余步骤,给用户进行更有层次音乐筛选和推荐。3.根据权利要求1所述的一种基于深度学习的音乐个性化分类推荐方法,其特征在于,所述S2中,筛选出收听操作数多的高频次音乐列表,用大量用户的高频次音乐列表训练音乐向量模型,具体包含如下步骤:S2.1统计所有音乐的操作频次,筛选出高频次音乐集合VH和低频次音乐集合VL;筛选出每个用户列表中属于VH的高频次音乐构成列表l,作为音乐向量模型的训练数据;S2.2给定一个音乐列表l,由音乐s1,s2,…,sT构成,T为音乐列表l包含的音乐总数,其概率模型可表示为其中的Contexti表示的音乐si的上下文,视为列表内该音乐前后w首音乐,w能根据实验效果调整得出,i的取值为1~T;首先将每首音乐按均匀分布初始化为统一维度的向量,然后构建一个只有一个隐层的全连接神经网络神经网络,输入为音乐向量,输出为Contexti包含的2w个音乐向量;S2.3以xi输入为例,对应一组训练样本,xi为输入,为正样本,其余为k-1个负样本,根据歌曲出现频率随机采样负样本;目标函数为噪声对比估计函数(noise-contrastiveestimation(NCE)):其中,为正例的概率,为负例的概率,目标函数的含义是尽可能让真实的正例目标词获得高概率...

【专利技术属性】
技术研发人员:王一歌叶展鹏韦岗
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1