当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于特征递增的混合型个性化音乐推荐方法技术

技术编号:21891953 阅读:21 留言:0更新日期:2019-08-17 14:31
本发明专利技术公开了一种基于特征递增的混合型个性化音乐推荐方法。本发明专利技术首先对歌词和评论文本进行情感分析,得到歌曲的情感向量;然后使用聚类算法对目标用户的听歌记录进行分类,得出目标用户的听歌喜好类别;再结合目标用户的社交关注关系,综合计算出目标用户对候选推荐歌曲的一个喜好程度值,最终实现个性化音乐推荐,本专利考虑目标用户的社交关注关系更易发现目标用户不太熟悉但具有潜在兴趣的歌曲,提高音乐推荐的准确率。

A Hybrid Personalized Music Recommendation Method Based on Incremental Features

【技术实现步骤摘要】
一种基于特征递增的混合型个性化音乐推荐方法
本专利技术涉及一种基于特征递增的混合型个性化音乐推荐方法,属于社交网络和推荐系统领域。
技术介绍
现有音乐推荐系统中有基于内容的推荐方法,例如Sánchez-Moreno等人在2016年发表的文章中,通过基于歌曲的歌手来实现歌曲属性的表示,因为每个歌手都有自己的一个曲风,然后再使用KNN算法基于歌手实现对相似用户的选取,然后将相似用户常听的歌曲而目标用户未听的歌曲进行推荐;有基于模型的推荐方法,例如Pacula在2009年发表的文章中,使用矩阵分解基于用户的隐式反馈来实现音乐推荐;有基于用户的推荐方法,例如Deng等人在2015年发表的文章中,通过基于在相同情感下喜欢听相同歌曲的特征,找到相似用户,再根据从博客文本中挖掘出用户的情感,从相似用户的听歌记录中找到推荐项;有基于混合模型的推荐方法,例如Bu等人在2010年发表的文章中,通过将基于内容的推荐和协同过滤结合构建混合型的推荐方法,利用音乐音频信息与用户社交关系来实现的推荐。目前在音乐推荐系统中有些利用用户的社交关系和音乐音频信息进行混合型的推荐,但是这种方法没有考虑到音乐的另一重要属性,即歌词文本信息,这种方法只是考虑到了音乐的曲风,而没有考虑到音乐的情感;其中也有利用音乐的歌词文本来进行情感分析,将音乐进行基于情感倾向的分类,但是这种方法没有考虑到用户在听完歌曲后的一些感想,即忽略了评论文本中的情感,而评论文本中的情感往往可以帮助挖掘出歌曲中隐藏的情感,进而影响到歌曲情感倾向的准确度;其次是没有对用户的社交关系进行考虑,即忽略了用户社交关系图中用户感兴趣的人群,从而导致难以发现用户具有潜在兴趣的歌曲(比如,用户可能对感兴趣的人所喜欢的歌曲有好感)。名词解释:THULAC:由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包,具有中文分词和词性标注功能。其是由目前世界上规模最大的人工分词和词性标注中文语料库(约含5800万字)训练而成,在标准数据集ChineseTreebank(CTB5)上分词的F1值可达97.3%,词性标注的F1值可达到92.9%,且每秒可处理约15万字。SenticNet:该知识库提供了一组语义、情感、极性关联的100000个自然语言概念,其中情感指的是四个情感维度Pleasantness(愉悦度),Attention(注意力),Sensitivity(灵敏度),andAptitude(倾向性)上的情感值。scorevj值:该值跟用户v在一段时间内对歌曲j的聆听次数有关,表示用户v对歌曲j的喜好程度值,0≤scorevj≤100,计算方法(1)如下:
技术实现思路
为解决上述问题,本专利技术提供了一种基于特征递增的混合型个性化音乐推荐方法。本专利技术首先对歌词和评论文本进行情感分析,得到歌曲的情感向量;然后使用聚类算法对目标用户的听歌记录进行分类,得出目标用户的听歌喜好类别;再结合目标用户的社交关注关系,综合计算出目标用户对候选推荐歌曲的一个喜好程度值,最终实现个性化音乐推荐,本专利考虑目标用户的社交关注关系更易发现目标用户不太熟悉但具有潜在兴趣的歌曲,提高音乐推荐的准确率。为达到上述技术效果,本专利技术的技术方案是:一种基于特征递增的混合型个性化音乐推荐方法,包括如下步骤:步骤一、数据收集与预处理:收集歌曲的歌词以及评论文本、用户的听歌记录和用户关注关系数据,并进行预处理;步骤二、文本分词:使用词法分析工具对歌词L和评论C文本进行分词,得到词语表示的文本;步骤三、音乐情感矩阵构建:首先用情感词典对分词后的歌词L和评论C文本进行情感词匹配,找到情感词;再根据情感词在四个情感维度上对应的情感值,构建四个情感矩阵Edj,其中d表示情感维度,j表示歌曲;步骤四、音乐情感向量构建:使用SVD奇异值分解算法对情感矩阵Edj进行降维处理,得到歌曲j在情感维度上的四个情感矩阵edj,并将基于情感维度上的四个情感矩阵edj进行合并得到歌曲j的情感向量ej,其中d表示情感维度,j表示歌曲;步骤五、计算目标用户的听歌喜好类别以及权重:首先采用聚类算法对目标用户u的听歌记录R中歌曲的情感向量ej进行分类处理,得到目标用户u的听歌喜好类别Cui;然后根据类别Cui中的样本个数mui与目标用户u的样本总数Mu的比值计算每个类别Cui的权重wui;其中u表示目标用户,i表示第几个类别,j表示歌曲;步骤六、候选推荐歌曲的选取以及相似度的计算:首先基于目标用户u的关注关系,找到目标用户感兴趣的其他用户v,从用户v的听歌记录中选取用户v喜好但目标用户u未听的歌曲作为候选推荐歌曲h;然后对候选推荐歌曲基于歌词以及评论文本进行情感分析,得到候选推荐歌曲的情感向量eh;再结合目标用户u的听歌记录R的分类结果,使用高斯函数计算候选推荐歌曲h与目标用户u的听歌喜好类别Cui之间的相似度ShCui;步骤七:推荐歌曲的计算:基于候选推荐歌曲h与目标用户u的听歌喜好类别Cui之间的相似度ShCui和目标用户u的听歌喜好类别Cui的权重wui计算目标用户u对候选推荐歌曲h的喜好程度值guh,当guh大于阈值t时,就将候选推荐歌曲h加入推荐列表CL中,否则放弃候选推荐歌曲h,步骤八、重复步骤六和步骤七直到寻找到音乐推荐项或设定数量的音乐推荐项。进一步的改进,所述步骤一中数据收集与预处理为:首先从网易云音乐平台上爬取音乐信息以及评论信息、用户的听歌记录和用户关注关系;然后使用SQL语句对数据进行处理,整理形成数据集,数据集含有三张数据表,三张数据表分别为歌曲信息表、用户听歌记录表和用户关注关系表;所述歌曲信息表包括歌曲id、歌名、歌手、歌词和评论文本、用户听歌记录表包括用户id、用户名、歌曲id、歌名和歌曲score值,用户关注关系表包括用户一id、用户二id、关注关系。进一步的改进,所述词法分析工具为THULAC工具;所述情感词典为SenticNet情感词典。进一步的改进,所述步骤三中音乐情感矩阵的构建方法为:首先每首歌取频率最高的前n-1条评论加歌词文本作为一个文本就为n个文本;然后将分词后的歌词和评论文本分别与情感词典进行情感词匹配;再将匹配到的情感词较大的数目作为标准,设为k,情感词数目不足k的,使用0进行填充;然后根据每个文本中的情感词在四个情感维度上的情感值构建四个情感矩阵Edj;其中四个情感维度分别为愉悦度、注意力、灵敏度、倾向度,这四个情感维度来源于SenticNet情感词典,Edj为k*n维的矩阵,d表示情感维度,j表示歌曲。进一步的改进,所述步骤四中音乐情感向量构建方法为:首先使用SVD奇异值分解算法对情感矩阵Edj进行矩阵降维,将k*n维的矩阵降维成1*n维的矩阵,公式(1)和(2)如下:Edj=UdjΣdj(Vdj)T(1)其中Edj为k*n维的音乐情感矩阵,Udj为k*k维的酉矩阵,即Udj(Udj)T=I,I为单位矩阵;Σdj为k*n维的奇异值矩阵,奇异值矩阵即除主对角线上的其余元素都为0,主对角线上的元素是奇异值,奇异值是按大到小排列的,如σ11>σ22>σ33>...;VdjT为n*n维的酉矩阵;σuu表示奇异值;edj=(Udj(1))TEdj(2)由于σ11是最大的奇本文档来自技高网
...

【技术保护点】
1.一种基于特征递增的混合型个性化音乐推荐方法,其特征在于,包括如下步骤:步骤一、数据收集与预处理:收集歌曲的歌词以及评论文本、用户的听歌记录和用户关注关系数据,并进行预处理;步骤二、文本分词:使用词法分析工具对歌词L和评论C文本进行分词,得到词语表示的文本;步骤三、音乐情感矩阵构建:首先用情感词典对分词后的歌词L和评论C文本进行情感词匹配,找到情感词;再根据情感词在四个情感维度上对应的情感值,构建四个情感矩阵Edj,其中d表示情感维度,j表示歌曲;步骤四、音乐情感向量构建:使用SVD奇异值分解算法对情感矩阵Edj进行降维处理,得到歌曲j在情感维度上的四个情感矩阵edj,并将基于情感维度上的四个情感矩阵edj进行合并得到歌曲j的情感向量ej,其中d表示情感维度,j表示歌曲;步骤五、计算目标用户的听歌喜好类别以及权重:首先采用聚类算法对目标用户u的听歌记录R中歌曲的情感向量ej进行分类处理,得到目标用户u的听歌喜好类别Cui;然后根据类别Cui中的样本个数mui与目标用户u的样本总数Mu的比值计算每个类别Cui的权重wui;其中u表示目标用户,i表示第几个类别,j表示歌曲;步骤六、候选推荐歌曲的选取以及相似度的计算:首先基于目标用户u的关注关系,找到目标用户感兴趣的其他用户v,从用户v的听歌记录中选取用户v喜好但目标用户u未听的歌曲作为候选推荐歌曲h;然后对候选推荐歌曲基于歌词以及评论文本进行情感分析,得到候选推荐歌曲的情感向量eh;再结合目标用户u的听歌记录R的分类结果,使用高斯函数计算候选推荐歌曲h与目标用户u的听歌喜好类别Cui之间的相似度ShCui;步骤七:推荐歌曲的计算:基于候选推荐歌曲h与目标用户u的听歌喜好类别Cui之间的相似度ShCui和目标用户u的听歌喜好类别Cui的权重wui计算目标用户u对候选推荐歌曲h的喜好程度值guh,当guh大于阈值t时,就将候选推荐歌曲h加入推荐列表CL中,否则放弃候选推荐歌曲h,步骤八、重复步骤六和步骤七直到寻找到音乐推荐项或设定数量的音乐推荐项。...

【技术特征摘要】
1.一种基于特征递增的混合型个性化音乐推荐方法,其特征在于,包括如下步骤:步骤一、数据收集与预处理:收集歌曲的歌词以及评论文本、用户的听歌记录和用户关注关系数据,并进行预处理;步骤二、文本分词:使用词法分析工具对歌词L和评论C文本进行分词,得到词语表示的文本;步骤三、音乐情感矩阵构建:首先用情感词典对分词后的歌词L和评论C文本进行情感词匹配,找到情感词;再根据情感词在四个情感维度上对应的情感值,构建四个情感矩阵Edj,其中d表示情感维度,j表示歌曲;步骤四、音乐情感向量构建:使用SVD奇异值分解算法对情感矩阵Edj进行降维处理,得到歌曲j在情感维度上的四个情感矩阵edj,并将基于情感维度上的四个情感矩阵edj进行合并得到歌曲j的情感向量ej,其中d表示情感维度,j表示歌曲;步骤五、计算目标用户的听歌喜好类别以及权重:首先采用聚类算法对目标用户u的听歌记录R中歌曲的情感向量ej进行分类处理,得到目标用户u的听歌喜好类别Cui;然后根据类别Cui中的样本个数mui与目标用户u的样本总数Mu的比值计算每个类别Cui的权重wui;其中u表示目标用户,i表示第几个类别,j表示歌曲;步骤六、候选推荐歌曲的选取以及相似度的计算:首先基于目标用户u的关注关系,找到目标用户感兴趣的其他用户v,从用户v的听歌记录中选取用户v喜好但目标用户u未听的歌曲作为候选推荐歌曲h;然后对候选推荐歌曲基于歌词以及评论文本进行情感分析,得到候选推荐歌曲的情感向量eh;再结合目标用户u的听歌记录R的分类结果,使用高斯函数计算候选推荐歌曲h与目标用户u的听歌喜好类别Cui之间的相似度ShCui;步骤七:推荐歌曲的计算:基于候选推荐歌曲h与目标用户u的听歌喜好类别Cui之间的相似度ShCui和目标用户u的听歌喜好类别Cui的权重wui计算目标用户u对候选推荐歌曲h的喜好程度值guh,当guh大于阈值t时,就将候选推荐歌曲h加入推荐列表CL中,否则放弃候选推荐歌曲h,步骤八、重复步骤六和步骤七直到寻找到音乐推荐项或设定数量的音乐推荐项。2.如权利要求1所述的基于特征递增的混合型个性化音乐推荐方法,其特征在于,所述步骤一中数据收集与预处理为:首先从网易云音乐平台上爬取音乐信息以及评论信息、用户的听歌记录和用户关注关系;然后使用SQL语句对数据进行处理,整理形成数据集,数据集含有三张数据表,三张数据表分别为歌曲信息表、用户听歌记录表和用户关注关系表;所述歌曲信息表包括歌曲id、歌名、歌手、歌词和评论文本、用户听歌记录表包括用户id、用户名、歌曲id、歌名和歌曲score值,用户关注关系表包括用户一id、用户二id、关注关系。3.如权利要求1所述的基于特征递增的混合型个性化音乐推荐方法,其特征在于,所述词法分析工具为THULAC工具;所述情感词典为SenticNet情感词典。4.如权利要求1所述的基于特征递增的混合型个性化音乐推荐方法,其特征在于,所述步骤三中音乐情感矩阵的构建方法为:首先每首歌取频率最高的前n-1条评论加歌词文本作为一个文本就为n个文本;然后将分词后的歌词和评论文本分别与情感词典进行情感词匹配;再将匹配到的情感词较大的数目作为标准,设为k,情感词数目不足k的,使用0进行填充;然后根据每个文本中的情感词在四个情感维度上的情感值构建四个情感矩阵Edj;其中四个情感维度分别为愉悦度、注意力、灵敏度、倾向度,这四个情感维度来源于SenticNet情感词典,Edj为k*n维的矩阵,d表示情感维度,j表示歌曲。5.如权利要求4所述的基于特征递增的混合型个性化音乐推荐方法,其特征在于,所述步骤四中音...

【专利技术属性】
技术研发人员:姜文君刘桂梅任德盛王国军
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1