The invention discloses a recommendation system and recommendation method based personalized user attribute score oriented, the system includes: data preprocessing module, used to take up the network text pretreatment, text preprocessing the annotation Keywords tag; user interaction module is used to collect user browsing history information and score information generated user attribute document and the score matrix; similar neighbor users search module for the attribute document according to historical data corresponding to the user a hidden de Lickley distribution model; interest distribution module according to dig for chirpy, neighbor users with Pearson similarity and the implicit de Lickley distribution mining the user interest distribution. De Lickley distribution of the invention uses an implicit score oriented, enhance the accuracy of the score, the text can not only help users and content platform to manage the massive text content, but also can improve the accuracy of the existing system in the new media, e-commerce and many other application scenarios.
【技术实现步骤摘要】
基于用户属性评分导向的个性化推荐系统及其推荐方法
本专利技术涉及计算机应用技术与电子商务
,具体为基于用户属性评分导向的个性化推荐系统及其推荐方法。
技术介绍
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这个时代,无论是作为信息消费者的普通用户,还是作为信息生产者的内容提供商或者产品提供商都遇到了很大的挑战。作为用户,如何从大量的信息中找到自己感兴趣的信息是一件非常困难的事情。而作为提供商,如何让自己生产的信息脱颖而出,受到广大用户的欢迎,也是一件非常困难的事情。因此,很多研究人员和公司开发了推荐系统来解决这一矛盾。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,而另一方面让信息能够展现在对它有兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。在社会学中有一个著名的现象叫“马修效应”,即“富人变富,穷人变穷”,信息的传播也有类似的效果。正如“长尾”一样,大众商品可能会获得更好的曝光率,而大量内容将永远被忽视。推荐系统可以很好地解决这些问题。搜索的时代已经结束了。如专利CN106649879A所提出的在图书推荐领域的应用,可以解决一个特定领域的内容推荐,但是由于用户交互数据的欠缺,容易造成初期推荐内容的准确率低的问题。在专利CN106604081A中实现了视频领域的内容推荐,不过通用性较低,同样存在冷启动的问题。不利于技术的快速开发。CN105447179A中实现了文本领域的快速推荐,对用户的潜在兴趣挖掘不足。本专利中将集中对上述所提出的通用性不足,冷启动和潜在兴趣点挖掘提供一种可行高效的方案 ...
【技术保护点】
基于用户属性评分导向的个性化推荐系统,其特征在于:该系统包括:数据预处理模块,用于对网络文本内容进行爬取预处理,预处理后的文本进行标注关键词标签;用户交互模块,用于收集用户历史浏览信息和评分信息产生用户属性文档和评分矩阵;相似近邻用户查找模块,用于据用户的历史数据对应的属性文档建立隐含狄利克雷分布模型;兴趣分布扢掘模块,用于根据近邻用户结合皮尔逊相似度和上述隐式狄利克雷分布挖掘所述用户的兴趣分布,还用于对推荐内容产生预测评分从而进行排序;推荐列表产生模块以及话题推荐展示模块,话题推荐展示模块用于根据所述用户的兴趣分布推荐预设数量的文本。
【技术特征摘要】
1.基于用户属性评分导向的个性化推荐系统,其特征在于:该系统包括:数据预处理模块,用于对网络文本内容进行爬取预处理,预处理后的文本进行标注关键词标签;用户交互模块,用于收集用户历史浏览信息和评分信息产生用户属性文档和评分矩阵;相似近邻用户查找模块,用于据用户的历史数据对应的属性文档建立隐含狄利克雷分布模型;兴趣分布扢掘模块,用于根据近邻用户结合皮尔逊相似度和上述隐式狄利克雷分布挖掘所述用户的兴趣分布,还用于对推荐内容产生预测评分从而进行排序;推荐列表产生模块以及话题推荐展示模块,话题推荐展示模块用于根据所述用户的兴趣分布推荐预设数量的文本。2.根据权利要求1所述的基于用户属性评分导向的个性化推荐系统,其特征在于:所述数据预处理模块包括:内容获取模块,用于爬取网络上的文本内容;数据清洗模块,用于对网络爬取的数据进行数据清洗,并将清洗分词后的关键词放入词袋模型;用户属性标注模块,用于通过用户浏览信息产生用户属性文档;以及用户评分矩阵获取模块,用于将用户评分信息进行收集建立评分矩阵。3.根据权利要求1所述的基于用户属性评分导向的个性化推荐系统,其特征在于:所述推荐列表产生模块进一步包括:文档相似度计算模块:...
【专利技术属性】
技术研发人员:卢新宇,朱峰,
申请(专利权)人:雷锤智能科技南京有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。