基于用户属性评分导向的个性化推荐系统及其推荐方法技术方案

技术编号:16779498 阅读:54 留言:0更新日期:2017-12-12 23:50
本发明专利技术公开了基于用户属性评分导向的个性化推荐系统及其推荐方法,该系统包括:数据预处理模块,用于对网络文本内容进行爬取预处理,预处理后的文本进行标注关键词标签;用户交互模块,用于收集用户历史浏览信息和评分信息产生用户属性文档和评分矩阵;相似近邻用户查找模块,用于据用户的历史数据对应的属性文档建立隐含狄利克雷分布模型;兴趣分布扢掘模块,用于根据近邻用户结合皮尔逊相似度和上述隐式狄利克雷分布挖掘所述用户的兴趣分布。本发明专利技术利用一种评分导向的隐式的狄利克雷分布的方法,提升评分准确度,文本不仅可以帮助用户和内容平台对海量文本内容进行管理,也能在新媒体、电子商务等很多应用场景下提高现有系统的准确性。

Personalized recommendation system based on user attribute rating oriented and its recommendation method

The invention discloses a recommendation system and recommendation method based personalized user attribute score oriented, the system includes: data preprocessing module, used to take up the network text pretreatment, text preprocessing the annotation Keywords tag; user interaction module is used to collect user browsing history information and score information generated user attribute document and the score matrix; similar neighbor users search module for the attribute document according to historical data corresponding to the user a hidden de Lickley distribution model; interest distribution module according to dig for chirpy, neighbor users with Pearson similarity and the implicit de Lickley distribution mining the user interest distribution. De Lickley distribution of the invention uses an implicit score oriented, enhance the accuracy of the score, the text can not only help users and content platform to manage the massive text content, but also can improve the accuracy of the existing system in the new media, e-commerce and many other application scenarios.

【技术实现步骤摘要】
基于用户属性评分导向的个性化推荐系统及其推荐方法
本专利技术涉及计算机应用技术与电子商务
,具体为基于用户属性评分导向的个性化推荐系统及其推荐方法。
技术介绍
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这个时代,无论是作为信息消费者的普通用户,还是作为信息生产者的内容提供商或者产品提供商都遇到了很大的挑战。作为用户,如何从大量的信息中找到自己感兴趣的信息是一件非常困难的事情。而作为提供商,如何让自己生产的信息脱颖而出,受到广大用户的欢迎,也是一件非常困难的事情。因此,很多研究人员和公司开发了推荐系统来解决这一矛盾。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,而另一方面让信息能够展现在对它有兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。在社会学中有一个著名的现象叫“马修效应”,即“富人变富,穷人变穷”,信息的传播也有类似的效果。正如“长尾”一样,大众商品可能会获得更好的曝光率,而大量内容将永远被忽视。推荐系统可以很好地解决这些问题。搜索的时代已经结束了。如专利CN106649879A所提出的在图书推荐领域的应用,可以解决一个特定领域的内容推荐,但是由于用户交互数据的欠缺,容易造成初期推荐内容的准确率低的问题。在专利CN106604081A中实现了视频领域的内容推荐,不过通用性较低,同样存在冷启动的问题。不利于技术的快速开发。CN105447179A中实现了文本领域的快速推荐,对用户的潜在兴趣挖掘不足。本专利中将集中对上述所提出的通用性不足,冷启动和潜在兴趣点挖掘提供一种可行高效的方案
技术实现思路
本专利技术的目的在于提供基于用户属性评分导向的个性化推荐系统及其推荐方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:基于用户属性评分导向的个性化推荐系统,该系统包括:数据预处理模块,用于对网络文本内容进行爬取预处理,预处理后的文本进行标注关键词标签;用户交互模块,用于收集用户历史浏览信息和评分信息产生用户属性文档和评分矩阵;相似近邻用户查找模块,用于据用户的历史数据对应的属性文档建立隐含狄利克雷分布模型;兴趣分布扢掘模块,用于根据近邻用户结合皮尔逊相似度和上述隐式狄利克雷分布挖掘所述用户的兴趣分布,还用于对推荐内容产生预测评分从而进行排序;推荐列表产生模块以及话题推荐展示模块,话题推荐展示模块用于根据所述用户的兴趣分布推荐预设数量的文本。优选的,所述数据预处理模块包括:内容获取模块,用于爬取网络上的文本内容;数据清洗模块,用于对网络爬取的数据进行数据清洗,并将清洗分词后的关键词放入词袋模型;用户属性标注模块,用于通过用户浏览信息产生用户属性文档;以及用户评分矩阵获取模块,用于将用户评分信息进行收集建立评分矩阵。优选的,所述推荐列表产生模块进一步包括:文档相似度计算模块:用于将计算文本间的相似度和用户属性文档的相似度。评分预测模块:用于计算推荐列表的预测评分,对推荐结果进行排序。本模块提出一种将皮尔逊相似度计算用户评分相似行为和隐式狄利克雷分布计算用户属性文档相似行为相结合的方法,提高了预测准确度。优选的,该基于用户属性评分导向的自动推荐方法包括:Sl:对相关预备推荐文本内容爬取、分词、专家标注标签进行预处理;S2:上线初期运行,收集用户的点击、浏览、评分信息;S3:根据用户的浏览信息将产生交互的文本的标签加入用户的属性文档,建立用户的属性文档;根据用户的评分信息建立用户-文本的评分矩阵。S4:根据所述属性文档和评分矩阵挖掘所述用户的兴趣分布;S5:从所述用户的兴趣分布寻找相似用户;S6:根据相似用户的浏览历史产生推荐列表并利用上述评分导向的狄利克雷分布预测评分最终产生有序的推荐立标。优选的,所述步骤S3进一步包括:S301:从进行预数理后的文本内容中选取多个关键词,进行文档标注;S302:对于用户产生过浏览评分行为的文本将其标签投入用户词袋文档作为用户属性。与现有技术相比,本专利技术的有益效果是:基于用户属性评分导向的个性化推荐系统及其推荐方法,1、针对系统冷启动的问题,系统初期将收集用户的点击、浏览和评分信息。解决初期用户属性标注不足产生推荐精度不高的问题。2、针对用户潜在兴趣挖掘的问题,系统采用专家标注与用户属性标注相结合,寻找用户相似行为用户产生推荐列表。3、针对系统推荐结果准确度问题,系统采用用户评分机制,收集用户显示反馈,对推荐结果产生一个预测评分,推荐结果按照预测评分排序,提高预测准确度。4、针对评分准确度问题,利用一种评分导向的隐式的狄利克雷分布的方法,提升评分准确度。对系统用户产生潜在兴趣的文本推荐。文本不仅可以帮助用户和内容平台对海量文本内容进行管理,也能在新媒体、电子商务等很多应用场景下提高现有系统的准确性。附图说明图1为本专利技术的结构框图。图2为本专利技术中基于用户属性评分导向的个性化推荐方法基于微博社交网络的话题自动推荐方法的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-2,本专利技术提供一种技术方案:基于用户属性评分导向的个性化推荐系统,该系统包括:数据预处理模块,用于对网络文本内容进行爬取预处理,预处理后的文本进行标注关键词标签;用户交互模块,用于收集用户历史浏览信息和评分信息产生用户属性文档和评分矩阵;相似近邻用户查找模块,用于据用户的历史数据对应的属性文档建立隐含狄利克雷分布模型;兴趣分布扢掘模块,用于根据近邻用户结合皮尔逊相似度和上述隐式狄利克雷分布挖掘所述用户的兴趣分布,还用于对推荐内容产生预测评分从而进行排序;推荐列表产生模块以及话题推荐展示模块,话题推荐展示模块用于根据所述用户的兴趣分布推荐预设数量的文本。所述数据预处理模块包括:内容获取模块,用于爬取网络上的文本内容;数据清洗模块,用于对网络爬取的数据进行数据清洗,并将清洗分词后的关键词放入词袋模型;用户属性标注模块,用于通过用户浏览信息产生用户属性文档;以及用户评分矩阵获取模块,用于将用户评分信息进行收集建立评分矩阵。所述推荐列表产生模块进一步包括:文档相似度计算模块:用于将计算文本间的相似度和用户属性文档的相似度。评分预测模块:用于计算推荐列表的预测评分,对推荐结果进行排序。本模块提出一种将皮尔逊相似度计算用户评分相似行为和隐式狄利克雷分布计算用户属性文档相似行为相结合的方法,提高了预测准确度。请参考图2,本专利技术中基于用户属性评分导向的个性化推荐方法基于微博社交网络的话题自动推荐方法的实施,包括以下步骤:Sl:爬取网络文本信息、进行分词和关键词标注。具体地,去将文本中的杂乱信息比如@信息、URL信息、图片信息等,然后对中文内容进行分词处理,并进行关键词标注。本专利技术的数据主要是新媒体的流文本数据,有用的信息包括:文本内容,文本发布时间。S2:将文本投入系统收集用户点击、浏览、评分信息。在本专利技术的一个实施例中,步骤S2进一步包括:S201:将用户产生交互行为的文本的关键词投入用户属性本文档来自技高网
...
基于用户属性评分导向的个性化推荐系统及其推荐方法

【技术保护点】
基于用户属性评分导向的个性化推荐系统,其特征在于:该系统包括:数据预处理模块,用于对网络文本内容进行爬取预处理,预处理后的文本进行标注关键词标签;用户交互模块,用于收集用户历史浏览信息和评分信息产生用户属性文档和评分矩阵;相似近邻用户查找模块,用于据用户的历史数据对应的属性文档建立隐含狄利克雷分布模型;兴趣分布扢掘模块,用于根据近邻用户结合皮尔逊相似度和上述隐式狄利克雷分布挖掘所述用户的兴趣分布,还用于对推荐内容产生预测评分从而进行排序;推荐列表产生模块以及话题推荐展示模块,话题推荐展示模块用于根据所述用户的兴趣分布推荐预设数量的文本。

【技术特征摘要】
1.基于用户属性评分导向的个性化推荐系统,其特征在于:该系统包括:数据预处理模块,用于对网络文本内容进行爬取预处理,预处理后的文本进行标注关键词标签;用户交互模块,用于收集用户历史浏览信息和评分信息产生用户属性文档和评分矩阵;相似近邻用户查找模块,用于据用户的历史数据对应的属性文档建立隐含狄利克雷分布模型;兴趣分布扢掘模块,用于根据近邻用户结合皮尔逊相似度和上述隐式狄利克雷分布挖掘所述用户的兴趣分布,还用于对推荐内容产生预测评分从而进行排序;推荐列表产生模块以及话题推荐展示模块,话题推荐展示模块用于根据所述用户的兴趣分布推荐预设数量的文本。2.根据权利要求1所述的基于用户属性评分导向的个性化推荐系统,其特征在于:所述数据预处理模块包括:内容获取模块,用于爬取网络上的文本内容;数据清洗模块,用于对网络爬取的数据进行数据清洗,并将清洗分词后的关键词放入词袋模型;用户属性标注模块,用于通过用户浏览信息产生用户属性文档;以及用户评分矩阵获取模块,用于将用户评分信息进行收集建立评分矩阵。3.根据权利要求1所述的基于用户属性评分导向的个性化推荐系统,其特征在于:所述推荐列表产生模块进一步包括:文档相似度计算模块:...

【专利技术属性】
技术研发人员:卢新宇朱峰
申请(专利权)人:雷锤智能科技南京有限公司
类型:发明
国别省市:江苏,32

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1