利基项目推荐方法及装置制造方法及图纸

技术编号:19009862 阅读:25 留言:0更新日期:2018-09-22 09:38
本发明专利技术提供一种利基项目推荐方法及装置。包括:根据描述内容获取M个已知项目和N个利基项目中每个项目的主题分布;基于主题分布从每个项目中随机抽取一个主题确定为所述每个项目的主题;聚集具有相同主题的已知项目和利基项目,得到N个聚集组;基于主题建立每个聚集组的分层贝叶斯线性回归模型;获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;基于回归模型获取所述每个聚集组中利基项目与所有用户的相关度,向相关度较大的预设数量位用户推荐所述利基项目。本实施例能够数据稀疏的情况下充分利用用户信息,有利于提高利基项目推荐的转换率。另外,本发明专利技术实施例提供了一种利基项目推荐的方法,能够区分出利基项目和长尾项目。

Recommendation method and device for niche projects

The invention provides a recommendation method and device for niche projects. It includes: obtaining the topic distribution of each project in M known projects and N niche projects according to the description content; randomly extracting one topic from each project based on the topic distribution to determine the theme of each project; gathering the known projects and niche projects with the same theme to get N clusters; and building a topic-based cluster. Hierarchical Bayesian linear regression model for each aggregation group; model parameters of the hierarchical Bayesian linear regression model for each aggregation group are obtained; the correlation between niche items and all users in each aggregation group is obtained based on the regression model, and the niche items are recommended to the preset number of users with larger correlation. This example can make full use of user information when data is sparse, which is beneficial to improve the conversion rate of niche project recommendation. In addition, the embodiment of the invention provides a method recommended by a niche project, which can distinguish a niche project from a long tail project.

【技术实现步骤摘要】
利基项目推荐方法及装置
本专利技术涉及数据处理
,尤其涉及一种基于贝叶斯回归模型的利基项目推荐方法及装置。
技术介绍
随着电商的应用,越来越多的消费者选择利用网络购物。对于消费者而言,越来越多的用户希望电商能够提供更多的个性化服务和产品。对于提供商而言,越来越多的提供商希望提供个性化服务和产品以增加用户粘性以及增加销售量。为此,现有的电商提供了推荐系统,以向不同消费者推荐不同的服务和产品。目前,现有的推荐系统通常采用以下推荐算法:基于内容的推荐算法、协同过滤推荐算法和混合推荐算法。其中,基于内容的推荐算法是基于目标用户过去偏好的类似项目做推荐;协同过滤算法基于与用户有相似兴趣的用户偏好项目做推荐;混合推荐算法是组合了两种或更多种推荐技术的算法从而克服单一算法的限制。到目前为止,很少有利基项目推荐算法且算法没有区分利基项目与长尾项目的不同。
技术实现思路
针对现有技术中的缺陷,本专利技术提供了一种利基项目推荐方法及装置,用于解决相关技术中存在的技术问题。第一方面,本专利技术实施例提供了一种利基项目推荐方法,所述方法包括:根据M个已知项目和N个利基项目的描述内容获取所述M个已知项目和所述N个利基项目中每个项目的主题分布;其中M、N为正整数;基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题;聚集具有相同主题的已知项目和利基项目,得到N个聚集组;根据所述N个聚集组中每个聚集组,基于主题建立每个聚集组的分层贝叶斯线性回归模型;获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;基于回归模型获取所述每个聚集组中利基项目与所有用户的相关度,向相关度较大的预设数量位用户推荐所述利基项目。可选地,基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题包括:基于每个项目的主题分布中文档-主题的概率值的大小顺序排序;选取概率值最大的中文档-主题作为每个项目的主题。可选地,聚集具有相同主题的已知项目和利基项目包括:针对所述N个利基项目中每个利基项目,获取每个利基项目的主题;基于所述每个利基项目的主题分别匹配所述M个已知项目的主题;若匹配通过,则聚集具有相同主题的利基项目和已知项目,得到个聚集后的项目组。可选地,获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数包括:获取所述每个聚集组的分层贝叶斯线性回归模型的初始化分布参数;重复执行最大期望EM算法中E步骤和M步骤,获取所述EM算法收敛时所述分层贝叶斯线性回归模型的分布参数值作为其模型参数。第二方面,本专利技术实施例提供了一种利基项目推荐装置,所述装置包括:主题分布获取模块,用于根据M个已知项目和N个利基项目的描述内容获取所述M个已知项目和所述N个利基项目中每个项目的主题分布;其中M、N为正整数;项目主题确定模块,用于基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题;聚集组获取模块,用于聚集具有相同主题的已知项目和利基项目,得到N个聚集组;回归模型建立模块,用于根据所述N个聚集组中每个聚集组,基于主题建立每个聚集组的分层贝叶斯线性回归模型;模型参数获取模块,用于获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;推荐用户确定模块,用于基于回归模型获取所述每个聚集组中利基项目与所有用户的相关度,确定相关度较大的预设数量位用户为所述利基项目的推荐用户。可选地,所述项目主题确定模块包括:概率值排序单元,用于基于每个项目的主题分布中文档-主题的概率值的大小顺序排序;项目主题选取单元,用于选取概率值最大的中文档-主题作为每个项目的主题。可选地,所述聚集组获取模块包括:主题获取单元,用于针对所述N个利基项目中每个利基项目,获取每个利基项目的主题;主题匹配单元,用于基于所述每个利基项目的主题分别匹配所述M个已知项目的主题;聚集单元,用于在主题匹配通过时,聚集具有相同主题的利基项目和已知项目,得到个聚集后的项目组。可选地,所述模型参数获取模块包括:初始参数获取单元,用于获取所述每个聚集组的分层贝叶斯线性回归模型的初始化分布参数;模型参数迭代单元,用于重复执行最大期望EM算法中E步骤和M步骤,获取所述EM算法收敛时所述分层贝叶斯线性回归模型的分布参数值作为其模型参数。由上述技术方案可知,本专利技术实施例将具有相同主题的利基项目和已知项目聚集形成聚集组,然后针对每个聚集组中可以建立一个基于主题的分层贝叶斯线性回归模型,由于同一聚集组具有相同的主题,因此同一个聚集组中已知项目的信息可以借用给利基项目,从而可以改善利基项目推荐过程中信息稀疏的问题,即本实施例能够数据稀疏的情况下充分利用用户信息,有利于提高利基项目推荐的转换率。另外,本专利技术实施例提供了一种利基项目推荐的方法,能够区分出利基项目和长尾项目。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。图1为本专利技术一实施例提供的利基项目推荐方法的流程示意图;图2为本专利技术一实施例提供的同一数据集情况下THBLR、HBLR、CF-User和PMF算法的转换率变化的对比示意图;图3~图7为本专利技术一实施例提供的在50%、60%、70%、80%、90%的长尾划分情况下THBLR、HBLR、CF-User和PMF算法的转换率变化的对比示意图;图8~图11为本专利技术一实施例提供的利基项目推荐装置的框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。目前,现有的推荐系统通常采用以下推荐算法:基于内容的推荐算法、协同过滤推荐算法和混合推荐算法。其中,基于内容的推荐算法是基于目标用户过去偏好的类似项目做推荐;协同过滤算法基于与用户有相似兴趣的用户偏好项目做推荐;混合推荐算法是组合了两种或更多种推荐技术的算法从而克服单一算法的限制。到目前为止,很少有利基项目推荐算法且算法没有区分利基项目与长尾项目的不同为解决上述技术问题,本专利技术实施例提供了一种利基项目推荐方法。图1为本专利技术一实施例提供的利基项目推荐方法的流程示意图。参见图1,一种利基项目推荐方法包括:101,根据M个已知项目和N个利基项目的描述内容获取所述M个已知项目和所述N个利基项目中每个项目的主题分布;其中M、N为正整数;102,基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题;103,聚集具有相同主题的已知项目和利基项目,得到N个聚集组;104,根据所述N个聚集组中每个聚集组,基于主题建立每个聚集组的分层贝叶斯线性回归模型;105,获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;106,基于回归模型获取所述每个聚集组中利基项目与所有用户的相关度,向相关度较大的预设数量位用户推荐所述利基项目。下面结合附图和实施例对利基项目推荐方法的各步骤作详细描述。首先,介绍1本文档来自技高网...
利基项目推荐方法及装置

【技术保护点】
1.一种利基项目推荐方法,其特征在于,所述方法包括:根据M个已知项目和N个利基项目的描述内容获取所述M个已知项目和所述N个利基项目中每个项目的主题分布;其中M、N为正整数;基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题;聚集具有相同主题的已知项目和利基项目,得到N个聚集组;根据所述N个聚集组中每个聚集组,基于主题建立每个聚集组的分层贝叶斯线性回归模型;获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;基于回归模型获取所述每个聚集组中利基项目与所有用户的相关度,向相关度较大的预设数量位用户推荐所述利基项目。

【技术特征摘要】
1.一种利基项目推荐方法,其特征在于,所述方法包括:根据M个已知项目和N个利基项目的描述内容获取所述M个已知项目和所述N个利基项目中每个项目的主题分布;其中M、N为正整数;基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题;聚集具有相同主题的已知项目和利基项目,得到N个聚集组;根据所述N个聚集组中每个聚集组,基于主题建立每个聚集组的分层贝叶斯线性回归模型;获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数;基于回归模型获取所述每个聚集组中利基项目与所有用户的相关度,向相关度较大的预设数量位用户推荐所述利基项目。2.根据权利要求1所述的利基项目推荐方法,其特征在于,基于所述每个项目的主题分布,从每个项目中随机抽取一个主题确定为所述每个项目的主题包括:基于每个项目的主题分布中文档-主题的概率值的大小顺序排序;选取概率值最大的中文档-主题作为每个项目的主题。3.根据权利要求1所述的利基项目推荐方法,其特征在于,聚集具有相同主题的已知项目和利基项目包括:针对所述N个利基项目中每个利基项目,获取每个利基项目的主题;基于所述每个利基项目的主题分别匹配所述M个已知项目的主题;若匹配通过,则聚集具有相同主题的利基项目和已知项目,得到个聚集后的项目组。4.根据权利要求1所述的利基项目推荐方法,其特征在于,获取所述每个聚集组的分层贝叶斯线性回归模型的模型参数包括:获取所述每个聚集组的分层贝叶斯线性回归模型的初始化分布参数;重复执行最大期望EM算法中E步骤和M步骤,获取所述EM算法收敛时所述分层贝叶斯线性回归模型的分布参数值作为其模型参数。5.一种利基项目推荐装置,其特征在于,所述装置包括:主题分布获取模块,用于根据M个已...

【专利技术属性】
技术研发人员:刘业政朱婷婷熊强李玲菲杜非姜元春孙见山
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1