【技术实现步骤摘要】
一种基于主题模型与用户群组的新闻推荐方法及系统
本专利技术涉及互联网
,特别涉及一种基于主题模型与用户群组的新闻推荐方法、系统及计算机可读存储介质。
技术介绍
随着互联网技术的发展,新闻行业正经历着巨变,越来越多的人甚至机器参与到新闻创作之中,不分时间和地点,新闻资讯正日趋海量化。为了让用户更容易地找到自己感兴趣的新闻资讯,新闻推荐系统应运而生。现有技术中,在新闻推荐系统里最常用的新闻推荐方法,如基于内容的推荐方法和隐含语义推荐方法,由于所产生的推荐内容缺乏新颖性,很难帮助用户发现新的内容;而基于用户的协同过滤方法尽管能够为用户推荐新颖的内容,但由于新增用户加入后需要进行大量的计算来更新用户相似性表,对于目前用户数与新增用户数均较大的新闻推荐系统而言已经不十分适用。因此,如何提供一种适用于目前用户数与新增用户数均较大的新闻推荐系统的新闻推荐方法,解决推荐内容缺乏新颖性的问题,使用户可以看到历史兴趣之外的内容开拓眼界,是现今急需解决的问题。
技术实现思路
本专利技术的目的是提供一种基于主题模型与用户群组的新闻推荐方法、系统及计算机可读存储介质,以通过隐含语义推荐方 ...
【技术保护点】
一种基于主题模型与用户群组的新闻推荐方法,其特征在于,包括:获取新闻数据;利用预设主题模型,生成每个新闻数据各自对应的主题分布;根据用户行为日志与所述预设主题模型,生成每个用户的兴趣向量;根据每个新闻数据各自对应的主题分布和每个用户的兴趣向量,利用隐含语义推荐方法生成每个用户各自对应的第一推荐列表;根据每个用户的兴趣向量,将每个用户聚类到对应的用户群组;根据每个用户对应的用户群组,利用用户群组推荐方法生成每个用户各自对应的第二推荐列表;根据每个用户各自对应的第一推荐列表和第二推荐列表,生成最终推荐列表。
【技术特征摘要】
1.一种基于主题模型与用户群组的新闻推荐方法,其特征在于,包括:获取新闻数据;利用预设主题模型,生成每个新闻数据各自对应的主题分布;根据用户行为日志与所述预设主题模型,生成每个用户的兴趣向量;根据每个新闻数据各自对应的主题分布和每个用户的兴趣向量,利用隐含语义推荐方法生成每个用户各自对应的第一推荐列表;根据每个用户的兴趣向量,将每个用户聚类到对应的用户群组;根据每个用户对应的用户群组,利用用户群组推荐方法生成每个用户各自对应的第二推荐列表;根据每个用户各自对应的第一推荐列表和第二推荐列表,生成最终推荐列表。2.根据权利要求1所述的基于主题模型与用户群组的新闻推荐方法,其特征在于,所述利用预设主题模型,生成每个新闻数据各自对应的主题分布,包括:对所述新闻数据进行预处理,生成每个新闻数据各自对应的关键词序列;根据每个新闻数据各自对应的关键词序列,利用LDA主题模型生成每个新闻数据各自对应的主题分布。3.根据权利要求1所述的基于主题模型与用户群组的新闻推荐方法,其特征在于,所述根据用户行为日志与所述预设主题模型,生成每个用户的兴趣向量,包括:将全部用户的兴趣向量的平均值确定为每个新增用户的兴趣向量;其中,新增用户为所述用户行为日志中未记录历史行为的新加入的用户。4.根据权利要求3所述的基于主题模型与用户群组的新闻推荐方法,其特征在于,所述根据每个用户的兴趣向量,将每个用户聚类到对应的用户群组,包括:根据每个新增用户的兴趣向量,将每个新增用户分配到对应的用户群组。5.一种基于主题模型与用户群组的新闻推荐系统,其特征在于,包括:获取模块,用于获取新闻数据;主题分布生成模块,用于利用预设主题模型...
【专利技术属性】
技术研发人员:曾琳铖曦,蒋宁,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。