一种基于评论主题分布匹配的音乐推荐系统技术方案

技术编号:22565018 阅读:22 留言:0更新日期:2019-11-16 11:58
本发明专利技术公开了一种基于评论主题分布匹配的音乐推荐系统,包括相互连接的音乐信息管理模块、用户信息管理模块、主题匹配模块、推荐组织模块,音乐信息管理模块负责音乐信息更新与存储音乐的附属信息,并向主题匹配模块提供所需的特定音乐信息;用户信息管理模块负责用户信息更新与存储用户的附属信息,并向主题匹配模块提供所需的特定用户信息;主题匹配模块负责计算当前用户主题分布、搜寻音乐信息库中与当前用户匹配的音乐;推荐模块负责筛选出正向评论的音乐,并组织推荐列表。本发明专利技术可在用户行为数据少的情况下通过分析用户对音乐的评论和行为数据为用户主动推荐音乐,为用户量少的音乐提供商提供一种准确度高的个性化推荐系统。

A music recommendation system based on distribution matching of comment topics

The invention discloses a music recommendation system based on the distribution and matching of comment topics, which includes a music information management module, a user information management module, a topic matching module and a recommendation organization module. The music information management module is responsible for the updating of music information and storing the auxiliary information of music, and providing the required specific music information to the topic matching module; user information The management module is responsible for updating the user information and storing the user's auxiliary information, and providing the specific user information to the theme matching module; the theme matching module is responsible for calculating the current user's theme distribution, searching the music matching with the current user in the music information database; the recommendation module is responsible for filtering out the music of the positive comment, and organizing the recommendation list. The invention can actively recommend music for the user by analyzing the user's comments and behavior data on the music when the user's behavior data is small, and provides a personalized recommendation system with high accuracy for the music provider with small number of users.

【技术实现步骤摘要】
一种基于评论主题分布匹配的音乐推荐系统
本专利技术涉及一种基于评论主题分布匹配的音乐推荐系统,属于推荐系统

技术介绍
进入21世纪以来,随着互联网的发展,信息过载的为题越来越突出。无论是信息的生产者还是信息的消费者都会碰上这个问题,对于信息生成者而言,自己的信息无法扩散出去意味着无法获得收益,而对于信息消费者而言,在瀚如烟海的信息中盲目寻找会白白消耗掉个人精力。在这种背景下,推荐系统应运而生,与搜索引擎不同,搜索引擎是用户主动寻找信息,输入关键词即可返回相应的信息,但是同一搜索引擎返回的信息是一样的,这个信息对A可能有用,但对B来说就是无用的,无法做到个性化。推荐系统是一种主动向用户推送信息的系统,根据用户往期的行为通过一定手段推算出用户的爱好,根据这个爱好向用户推送信息即可达到个性化推送,不同的人得到的推荐结果往往是不一样的。目前对个性化推荐是数据挖掘领域的研究热点之一,各类算法层出不穷。目前,所有的在线音乐提供商都会用推荐系统为其用户做推荐,多数的厂商拥有的音乐资源在种类和曲目上都非常齐全,但用户往往聚集在几个名气大的厂商那里,原因之一就是名气大的厂商往往有很长的运营时间从而积累了大量的用户行为,在个性化推荐方面可以依托积累的大量数据进行分析推荐,获得较好的推荐效果,对于用户量较少或者刚刚涉足音乐的厂商则因为用户行为数据太少而无法进行精准推荐。
技术实现思路
针对上述问题,本专利技术旨在提供一种基于评论主题分布匹配的音乐推荐系统;本专利技术可在用户行为数据少的情况下通过分析用户对音乐的评论和行为数据为用户主动式的推荐音乐,为用户量少的音乐提供商提供一种准确度高的个性化推荐系统。本专利技术的上述技术目的采用以下技术方案来实现:一种基于评论主题分布匹配的音乐推荐系统,包括:相互连接的音乐信息管理模块、用户信息管理模块、主题匹配模块、推荐组织模块;所述音乐信息管理模块负责音乐信息更新与存储音乐的附属信息,并向所述主题匹配模块提供所需的特定音乐信息;所述用户信息管理模块负责用户信息更新与存储用户的附属信息,并向所述主题匹配模块提供所需的特定用户信息;所述主题匹配模块负责计算当前用户主题分布、搜寻音乐信息库中与当前用户匹配的音乐;所述推荐模块负责筛选出正向评论的音乐,并组织推荐列表。进一步地:所述音乐信息管理模块包括音乐信息更新单元、音乐存储单元、音乐评论存储单元、音乐评论主题分布存储单元;所述用户信息管理模块包括用户信息更新单元、用户往期数据存储单元;所述主题匹配模块包括用户主题分布计算单元、主题分布比较单元;所述推荐模块包括过滤单元、排序单元、反馈单元。进一步地:所述音乐信息更新单元用来更新音乐的附属信息,更新对象包括音乐评论、音乐评论的主题分布和音乐评论的情感倾向;所述音乐存储单元为一个存储音乐条目的数据库,存储音乐的名称、音乐的存储位置;所述音乐评论存储单元用于存储音乐的评论信息,一首音乐对应多条评论;所述音乐评论主题分布存储单元用于存储音乐的评论主题分布和音乐情感倾向,其数据由音乐更新单元进行计算与维护。进一步地:所述音乐信息更新单元包括评论更新单元、评论主题分布计算单元和评论情感分析单元;所述评论更新单元用于及时把用户对音乐的评论更新到所述音乐评论存储单元,所述评论主题分布计算单元用于更新所述音乐评论主题分布单元中的数据,每当用户对某首音乐新评论累计达200条时启动该单元,选取最新的600条评论组成评论集进行计算,使用LDA主题模型对每条评论进行主题抽取,并求出整个评论集的主题概率分布,并用新的概率分布替换所述音乐评论主题分布存储单元中与其对应的概率分布;所述评论情感分析单元用于计算音乐的情感倾向,分为正向和负向两种情况,正向代表该音乐的词和曲可以让人接受,负向则代表不能接受,该情感倾向有该音乐的评论计算而得,每当用户对某首音乐新评论累计达200条时启动该单元,选取最新的600条评论组成评论集进行计算,使用谷歌开源框架tensorflow的LSTM进行该项工作,并用新的情感情感倾向替换所述音乐评论主题分布存储单元中与其对应的情感倾向。进一步地:所述用户信息更新单元用于更新所述用户往期数据单元中的数据,包括听歌历史记录与每首歌的收听时长,用户每听一首歌便运行一次该单元进行数据更新存储;所述用户往期数据存储单元用于存储用户往期听歌记录、每首歌播放时长和推荐反馈标识,所述推荐反馈标识用于标记该音乐是否为推荐而播放,是推荐而来标记为1,否则为0。进一步地:所述用户主题分布计算单元用于计算用户的主题分布;所述主题分布比较单元用于搜寻所述音乐存储单元中与当前用户主题分布相似的音乐,并将搜寻出来的音乐集合成结果候选集。进一步地:所述用户主题分布计算单元计算具体过程为:a,在用户往期数据存储单元中获取当前用户所有往期听歌曲目与各曲目收听时长;b,删除曲目收听时长短于1分钟的曲目;c,选取前30首不同的且为最新收听的音乐组成收听音乐集,其中对于重复收听的音乐,每三次及以下记为一首,对于重复的音乐,最多记四首,比如,对于曲目列表{A,A,B,C,A,A,D,D,E,E,E},其选出的曲目为{A,A,B,C,D,E},对于推荐反馈标识为1的曲目,记为两次,比如对于曲目列表{A,B,C},其中A的推荐反馈标识为1,则选出的曲目为{A,A,B,C};d,根据收听音乐集中的曲目从所述音乐评论存储单元中获取与收听音乐集中的曲目相关的评论,将所有曲目的评论组成评论集;e,使用LDA主题模型对每条评论进行主题抽取,并求出整个评论集的主题概率分布,得到的概率分布即为当前用户的主题概率分布。进一步地:所述搜寻其过程为:a,遍历音乐存储单元;b,删除当前用户已听过的音乐及已经推荐过的音乐组成一个临时集合,c,该集合中每首音乐与当前用户主题分布一一使用比较算法进行比较,找到合适的音乐便将其送入结果候选集。进一步地:所述比较算法具体为:相似度其中Px表示音乐x的主题分布,D(Pu||Pv)表示音乐u的主题分布与音乐v的主题分布之间的KL散度,相似度corru,v越大,u与v之间相似度越大。进一步地:所述过滤单元用于过滤出音乐情感倾向为正向的音乐,将过滤出的音乐组成推荐候选集;所述排序单元用于对所述推荐候选集中的音乐进行排序,其具体过程为:计算每首音乐的流行度p(v):其中,N(v)为一天之内播放过音乐v的用户数量,N为用户总数;计算加权相似度new_corru,v:其中α为调节参数,经实验确定最佳值为32;得出加权相似度后根据加权相似度从到小排列,取前20首音乐作为推荐结果。本专利技术的有益效果为:在用户行为数据较少的情况下实现了较好的音乐推荐效果,提升了用户体验。附图说明图1为本专利技术的结构框架图;图2为本专利技术的工作方式流程图。具体实施方式结合以下实施例对本专利技术作进一步描述。如图1至图2所示,本实施例的一种基于评论主本文档来自技高网...

【技术保护点】
1.一种基于评论主题分布匹配的音乐推荐系统,特征在于,包括:相互连接的音乐信息管理模块、用户信息管理模块、主题匹配模块、推荐组织模块;/n所述音乐信息管理模块负责音乐信息更新与存储音乐的附属信息,并向所述主题匹配模块提供所需的特定音乐信息;所述用户信息管理模块负责用户信息更新与存储用户的附属信息,并向所述主题匹配模块提供所需的特定用户信息;所述主题匹配模块负责计算当前用户主题分布、搜寻音乐信息库中与当前用户匹配的音乐;所述推荐模块负责筛选出正向评论的音乐,并组织推荐列表。/n

【技术特征摘要】
1.一种基于评论主题分布匹配的音乐推荐系统,特征在于,包括:相互连接的音乐信息管理模块、用户信息管理模块、主题匹配模块、推荐组织模块;
所述音乐信息管理模块负责音乐信息更新与存储音乐的附属信息,并向所述主题匹配模块提供所需的特定音乐信息;所述用户信息管理模块负责用户信息更新与存储用户的附属信息,并向所述主题匹配模块提供所需的特定用户信息;所述主题匹配模块负责计算当前用户主题分布、搜寻音乐信息库中与当前用户匹配的音乐;所述推荐模块负责筛选出正向评论的音乐,并组织推荐列表。


2.根据权利要求1所述的一种基于评论主题分布匹配的音乐推荐系统,其特征在于:所述音乐信息管理模块包括音乐信息更新单元、音乐存储单元、音乐评论存储单元、音乐评论主题分布存储单元;所述用户信息管理模块包括用户信息更新单元、用户往期数据存储单元;所述主题匹配模块包括用户主题分布计算单元、主题分布比较单元;所述推荐模块包括过滤单元、排序单元、反馈单元。


3.根据权利要求2所述的一种基于评论主题分布匹配的音乐推荐系统,其特征在于:所述音乐信息更新单元用来更新音乐的附属信息,更新对象包括音乐评论、音乐评论的主题分布和音乐评论的情感倾向;所述音乐存储单元为一个存储音乐条目的数据库,存储音乐的名称、音乐的存储位置;所述音乐评论存储单元用于存储音乐的评论信息,一首音乐对应多条评论;所述音乐评论主题分布存储单元用于存储音乐的评论主题分布和音乐情感倾向,其数据由音乐更新单元进行计算与维护。


4.根据权利要求3所述的一种基于评论主题分布匹配的音乐推荐系统,其特征在于:所述音乐信息更新单元包括评论更新单元、评论主题分布计算单元和评论情感分析单元;所述评论更新单元用于及时把用户对音乐的评论更新到所述音乐评论存储单元,所述评论主题分布计算单元用于更新所述音乐评论主题分布单元中的数据,每当用户对某首音乐新评论累计达200条时启动该单元,选取最新的600条评论组成评论集进行计算,使用LDA主题模型对每条评论进行主题抽取,并求出整个评论集的主题概率分布,并用新的概率分布替换所述音乐评论主题分布存储单元中与其对应的概率分布;所述评论情感分析单元用于计算音乐的情感倾向,分为正向和负向两种情况,正向代表该音乐的词和曲可以让人接受,负向则代表不能接受,该情感倾向有该音乐的评论计算而得,每当用户对某首音乐新评论累计达200条时启动该单元,选取最新的600条评论组成评论集进行计算,使用谷歌开源框架tensorflow的LSTM进行该项工作,并用新的情感情感倾向替换所述音乐评论主题分布存储单元中与其对应的情感倾向。


5.根据权利要求2所述的一种基于评论主题分布匹配的音乐推荐系统,其特征在于:所述用户信息更新单元用于更新所述用户往期数据单元中的数据,包括听歌历史记录与每首歌的收听时长,用户每听一首歌便运行一次该单元...

【专利技术属性】
技术研发人员:李卫疆罗潘虎
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利