当前位置: 首页 > 专利查询>四川大学专利>正文

基于状态转移的奖励值音乐推荐算法制造技术

技术编号:18445050 阅读:74 留言:0更新日期:2018-07-14 10:26
本发明专利技术公开了一种基于状态转移的奖励值音乐推荐算法,与现有技术相比,本发明专利技术针对当前音乐推荐算法的不足,本发明专利技术以巧妙引入奖励值的概念,将音乐顺序纳入研究范围,将用户选择怎样的音乐列表视作马尔可夫决策过程,推荐音乐列表的每一首音乐,都视作决策过程中状态的变化,因此,不同状态会对当前局面产生不同的奖励值,算法选择奖励值最大的状态序列,在此即为奖励值最大的音乐列表。同时,将用户个人历史数据与整体用户数据做均衡,优化推荐效果,创新地加入音乐流行度和用户从众度,提出了基于状态转移的奖励值算法,具有推广使用的价值。

Music recommendation algorithm based on state transfer

The invention discloses an award value music recommendation algorithm based on state transfer. Compared with the existing technology, the invention aims at the deficiency of the current music recommendation algorithm. The invention introduces the concept of reward value ingeniously, integrates the music sequence into the study range, and considers the music list selected by the user as a Markov decision process. Every piece of music that recommends the music list is regarded as a change in the state of the decision process. Therefore, different states will produce different reward values for the current situation, and the algorithm chooses the most rewarding state sequence, which is the list of the most rewarding values. At the same time, the user's personal history data and the whole user data are balanced, the recommendation effect is optimized, the music popularity and the user's herd are added creatively, and the reward value algorithm based on state transfer is proposed, which has the value of popularizing.

【技术实现步骤摘要】
基于状态转移的奖励值音乐推荐算法
本专利技术涉及计算机及音频
,尤其涉及一种基于状态转移的奖励值音乐推荐算法。
技术介绍
听音乐已成为大众娱乐的一种重要方式,随着“信息过载”问题的日益严重,各大公司平台纷纷推出了针对音乐的推荐系统,现有传统的推荐系统并不能保证用户体验,用户对精准推荐的需求仍是强烈。随着互联网技术的发展以及个人智能设备的普及,“信息过载”[1]问题日益严重。据估计,Facebook每日有3000万张以上的照片从后台被上传,后台日志数据每天就能生成300TB;国内的某电子商务网站,每天达成的交易在千万笔级别,每日日志文件超过50TB[2,3]。面对如此情况,各大平台纷纷推出搜索功能,但在某些情况下,用户并没有明确的搜索对象,例如,想看一部电影或者听几首歌,但没有明确要看哪一部或者听哪一首,这时,搜索技术就不能满足用户此时需求,在此情景下,推荐算法应运而生,极大便利了用户在此类情景下的信息选择。推荐算法在社交、电子商务、影音娱乐、新闻筛选等领域得到了广泛应用,并在市场范围内有不俗的表现[4]。目前的推荐算法,无论是基于内容的推荐、协同过滤亦或是混合推荐,利用用户的历史数据,分析用户的喜好,找到邻近用户,预测用户未来的选择。LiebmanE等人[5]在强化学的框架中,基于音乐的35维特征向量提出一种搜索方法,每一个声学特征又被量化为100段,加入了音乐列表奖励机制,根据反馈值推荐音乐列表。该方法将每一类特征统一量化为100段,可能导致某些维度上会出现数据稀疏性问题,同时该模型忽略了特征权重;Sánchez-MorenoD等人[6]将播放计数引入到CF算法中,建立用户的模糊集群,该算法基于用户播放次数和艺术家特点来度量用户喜好,这种度量准则不够全面。总体来讲,前人音乐推荐算法存在以下四个方面的问题:一,基于内容的推荐单一地考虑用户的偏好与用户偏好相近的音乐,并未对用户整体喜好与整个音乐库的分布联系起来,导致难有新的喜好的认知发现。二,对特征离散化较为固定,没有对每一维特征做分析;三,过度依赖音乐评分信息,每位用户对项目的认知不同,对项目的打分标准就不同;四,用户冷启动和项目冷启动。参考文献[1]ZhouZ,LiuM,ZhangF,etal.AdataprocessingframeworkforIoTbasedonlinemonitoringsystem[C]//IEEE,InternationalConferenceonComputerSupportedCooperativeWorkinDesign.IEEE,2013:686-691.[2]ChenW,NiuZ,ZhaoX,etal.Ahybridrecommendationalgorithmadaptedine-learningenvironments[J].WorldWideWeb,2014,17(2):271-284.[3]CrespoRG,MartínezOS,LovelleJMC,etal.RecommendationSystembasedonuserinteractiondataappliedtointelligentelectronicbooks[J].ComputersinHumanBehavior,2011,27(4):1445-1449.[4]张玉洁,杜雨露,孟祥武.组推荐系统及其应用研究[J].计算机学报,2016,39(4):745-764.[5]LiebmanE,SaartsechanskyM,StoneP.DJ-MC:AReinforcement-LearningAgentforMusicPlaylistRecommendation[J].ComputerScience,2014.[6]Sánchez-MorenoD,GonzálezABG,VicenteMDM,etal.Acollaborativefilteringmethodformusicrecommendationusingplayingcoefficientsforartistsandusers[J].ExpertSystemswithApplications,2016,66:234-244.[7]TrevarthenC,Delafield-ButtJT,B.PsychobiologyofMusicalGesture:InnateRhythm,HarmonyandMelodyinMovementsofNarration[J].NewPerspectivesonMusic&Gesture,2011,6(6):754-764.[8]VenturaMD.TheInfluenceoftheRhythmwiththePitchonMelodicSegmentation[M]//IntelligentDataAnalysisandApplications.SpringerInternationalPublishing,2015:191-201.[9]Sina.浅说Davies-Bouldin指数.http://blog.sina.com.cn,2012.[10]ThierryBertin-Mahieux,DanielP.W.Ellis,BrianWhitman,andPaulLamere.TheMillionSongDataset.InProceedingsofthe12thInternationalSocietyforMusicInformationRetrievalConference(ISMIR2011),2011.ChenS,MooreJL,TurnbullD,etal.Playlistpredictionviametricembedding[C]//ACMKnowledgeDiscoveryandDataMining.2012:714-722.
技术实现思路
本专利技术的目的就在于为了解决上述问题而提供一种基于状态转移的奖励值音乐推荐算法。本专利技术通过以下技术方案来实现上述目的:本专利技术算法如下:输入:用户u的历史播放列表HL,音乐集中歌曲的流行度,音乐集M,音乐集M大小T,推荐列表长度X,聚类个数C,定时器clock输出:推荐音乐列表L*;(1)初始化用户偏好及音乐特征向量权重(2)计算两个状态转移概率矩阵(3)将音乐集M筛减成M*并聚类;(4)生成候选列表L;(5)针对列表L对用户偏好在线更新,得到(6)计算L中每首音乐到各个聚类中心cj的欧式距离ο(song,ci)(7)ifR(L)>maxR(L)thenmaxR(L)=R(L)L*=LEndifUntilclock=0(8)返回L*。本专利技术的有益效果在于:本专利技术是一种基于状态转移的奖励值音乐推荐算法,与现有技术相比,本专利技术针对当前音乐推荐算法的不足,本专利技术以巧妙引入奖励值的概念,将音乐顺序纳入研究范围,将用户选择怎样的音乐列表视作马尔可夫决策过程,推荐音乐列表的每一首音乐,都视作决策过程中状态的变化,因此,不同状态会对当前局面产生不同的奖励值,算法选择奖励值最大的状态序列,在此即为奖励值最大的音乐列表。同时,将用户个人历史数据与整体用户数据做均衡,优化推荐效果,创新地加入音乐流行度和用本文档来自技高网
...

【技术保护点】
1.一种基于状态转移的奖励值音乐推荐算法,其特征在于,算法如下:输入:用户u的历史播放列表HL,音乐集中歌曲的流行度,音乐集M,音乐集M大小T,推荐列表长度X,聚类个数C,定时器clock输出:推荐音乐列表L*;(1)初始化用户偏好及音乐特征向量权重(2)计算两个状态转移概率矩阵(3)将音乐集M筛减成M*并聚类;(4)生成候选列表L;(5)针对列表L对用户偏好在线更新,得到

【技术特征摘要】
1.一种基于状态转移的奖励值音乐推荐算法,其特征在于,算法如下:输入:用户u的历史播放列表HL,音乐集中歌曲的流行度,音乐集M,音乐集M大小T,推荐列表长度X,聚类个数C,定时器clock输出:推荐音乐列表L*;(1)初始化用户偏好及音乐特征向量权重(2)计算两个状态转移概率矩阵(3...

【专利技术属性】
技术研发人员:琚生根孙界平谭斌夏欣刘勇王霞刘若晨
申请(专利权)人:四川大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1