The invention provides a recommendation method and device for niche projects. It includes: obtaining the topic distribution of each project in M known projects and N niche projects according to the description content; randomly extracting one topic from each project based on the topic distribution to determine the theme of each project; gathering the known projects and niche projects with the same theme to get N clusters; and building a topic-based cluster. Hierarchical Bayesian linear regression model for each aggregation group; model parameters of the hierarchical Bayesian linear regression model for each aggregation group are obtained; the correlation between niche items and all users in each aggregation group is obtained based on the regression model, and the niche items are recommended to the preset number of users with larger correlation. This example can make full use of user information when data is sparse, which is beneficial to improve the conversion rate of niche project recommendation. In addition, the embodiment of the invention provides a method recommended by a niche project, which can distinguish a niche project from a long tail project.
【技术实现步骤摘要】
利基项目推荐方法及装置
本专利技术涉及数据处理
,尤其涉及一种基于贝叶斯回归模型的利基项目推荐方法及装置。
技术介绍
随着电商的应用,越来越多的消费者选择利用网络购物。对于消费者而言,越来越多的用户希望电商能够提供更多的个性化服务和产品。对于提供商而言,越来越多的提供商希望提供个性化服务和产品以增加用户粘性以及增加销售量。为此,现有的电商提供了推荐系统,以向不同消费者推荐不同的服务和产品。目前,现有的推荐系统通常采用以下推荐算法:基于内容的推荐算法、协同过滤推荐算法和混合推荐算法。其中,基于内容的推荐算法是基于目标用户过去偏好的类似项目做推荐;协同过滤算法基于与用户有相似兴趣的用户偏好项目做推荐;混合推荐算法是组合了两种或更多种推荐技术的算法从而克服单一算法的限制。到目前为止,很少有利基项目推荐算法且算法没有区分利基项目与长尾项目的不同。
技术实现思路
针对现有技术中的缺陷,本专利技术提供了一种利基项目推荐方法及装置,用于解决相关技术中存在的技术问题。第一方面,本专利技术实施例提供了一种利基项目推荐方法,所述方法包括:根据M个已知项目和N个利基项目的描述内容获取所述M个已知项目和所述N个利基项目中每个项目的主题分布;其中M、N为正整数;基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题;聚集具有相同主题的已知项目和利基项目,得到N个聚集组;根据所述N个聚集组中每个聚集组,基于主题建立每个聚集组的分层贝叶斯线性回归模型;获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;基于回归模型获取所述每个聚集组中利基项目与所有用户的相 ...
【技术保护点】
1.一种利基项目推荐方法,其特征在于,所述方法包括:根据M个已知项目和N个利基项目的描述内容获取所述M个已知项目和所述N个利基项目中每个项目的主题分布;其中M、N为正整数;基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题;聚集具有相同主题的已知项目和利基项目,得到N个聚集组;根据所述N个聚集组中每个聚集组,基于主题建立每个聚集组的分层贝叶斯线性回归模型;获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;基于回归模型获取所述每个聚集组中利基项目与所有用户的相关度,向相关度较大的预设数量位用户推荐所述利基项目。
【技术特征摘要】
1.一种利基项目推荐方法,其特征在于,所述方法包括:根据M个已知项目和N个利基项目的描述内容获取所述M个已知项目和所述N个利基项目中每个项目的主题分布;其中M、N为正整数;基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题;聚集具有相同主题的已知项目和利基项目,得到N个聚集组;根据所述N个聚集组中每个聚集组,基于主题建立每个聚集组的分层贝叶斯线性回归模型;获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;基于回归模型获取所述每个聚集组中利基项目与所有用户的相关度,向相关度较大的预设数量位用户推荐所述利基项目。2.根据权利要求1所述的利基项目推荐方法,其特征在于,基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题包括:基于每个项目的主题分布中文档-主题的概率值的大小顺序排序;选取概率值最大的中文档-主题作为每个项目的主题。3.根据权利要求1所述的利基项目推荐方法,其特征在于,聚集具有相同主题的已知项目和利基项目包括:针对所述N个利基项目中每个利基项目,获取每个利基项目的主题;基于所述每个利基项目的主题分别匹配所述M个已知项目的主题;若匹配通过,则聚集具有相同主题的利基项目和已知项目,得到个聚集后的项目组。4.根据权利要求1所述的利基项目推荐方法,其特征在于,获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数包括:获取所述每个聚集组的分层贝叶斯线性回归模型的初始化分布参数;重复执行最大期望EM算法中E步骤和M步骤,获取所述EM算法收敛时所述分层贝叶斯线性回归模型的分布参数值作为其模型参数。5.一种利基项目推荐装置,其特征在于,所述装置包括:主题分布获取模块,用于根据M个已...
【专利技术属性】
技术研发人员:刘业政,朱婷婷,熊强,李玲菲,杜非,姜元春,孙见山,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。