【技术实现步骤摘要】
一种基于协同过滤的优化方法
本专利技术属于数据处理和数据挖掘领域,具体涉及一种基于奇异值分解和BP神经网络预测未评分项的改进方法。
技术介绍
进入移动互联网时代,各种平台上信息资源的体量越来越大,出现了比传统互联网时代更为严重的“信息过载”现象。面对如此巨大的信息量,用户经常感到无从下手,原因就是很难再通过简单的查找较快的获得自己喜欢的信息,同时也大大增加了人们查询信息的时间,这是“信息过载”现象在电子商务领域的表现。用户也可以通过阿里巴巴提供的搜索指数来选择商品,但是并不一定符合自己个性化需求。因此用户需要一种能根据自己的偏好特点来自动选择其感兴趣信息的技术,推荐算法在这种背景下得到了迅速发展。推荐系统的研究重点在于如何快速的从海量信息中获取我们感兴趣的内容,省时省力,准确快捷是首要目标。现在是大数据时代,各种信息数据增长速度极快,推荐系统的效率已经成为学者十分重视的问题,各种框架的出现表明了对推荐系统的进一步研究已经迫在眉睫,同时也给各类电商平台带来了很大改变。根据原理的不同,个性化推荐算法有几种不同的分类,通过不同的推荐策略来进行信息等资源的推荐,大致分为三种推荐方式:基于关联规则、基于内容和协同过滤推荐算法。基于关联规则算法的本质是获取数据与数据之间的关系,在获取到用户的行为之后,使用关联规则技术分析各个产品在用户之间购买的关系,找出各个产品之间的联系,由这些产品的联系推导出来跟其他产品之间的联系,不同规则的相似度不同,这个在每个关联规则中都可以通过两商品同时发生的概率来表示。基于内容的推荐算法是以平台上商品的分类属性来进行推荐的,首先要明确商品类 ...
【技术保护点】
一种基于协同过滤的优化方法,该方法为一种基于奇异值分解和BP神经网络预测未评分项的改进方法;其特征在于:该方法通过奇异值分解用户‑项目评分矩阵,有效的降低了矩阵的稀疏性;同时在奇异值分解的基础上,进一步采用BP神经网络来对未评分的目标项目进行分值预测,这样做的好处是避免了用平均分值代替而产生的效果单一性,从而使推荐的准确性有了较大提升;将用户对商品的评分用m×n矩阵R表示,其中,m是用户数量,n是商品数量,矩阵中元素Rij是用户i对商品j的偏好,Rij为数值;用矩阵R进行表示;
【技术特征摘要】
1.一种基于协同过滤的优化方法,该方法为一种基于奇异值分解和BP神经网络预测未评分项的改进方法;其特征在于:该方法通过奇异值分解用户-项目评分矩阵,有效的降低了矩阵的稀疏性;同时在奇异值分解的基础上,进一步采用BP神经网络来对未评分的目标项目进行分值预测,这样做的好处是避免了用平均分值代替而产生的效果单一性,从而使推荐的准确性有了较大提升;将用户对商品的评分用m×n矩阵R表示,其中,m是用户数量,n是商品数量,矩阵中元素Rij是用户i对商品j的偏好,Rij为数值;用矩阵R进行表示;若r是m×n矩阵R的秩,那么对矩阵R进行分解(1)U是m×m阶酋矩阵,表示用户特征矩阵;S是半正定m×n阶对角矩阵,S还能够用∑r的对角阵来表示;VT是V的共轭转置矩阵,是n×n阶酋矩阵,表示商品的特征矩阵;(2)RRT的特征值λ1,λ2,…λr也是RTR的特征值;(3)存在m×n的矩阵S符合∑ii=σi,其中1≤i≤r,σi就是矩阵R的奇异值,这里存在的数量关系即可用来表示特征值的关系;奇异值分解能够用于解决矩阵降维的问题,在电商个性化推荐系统中将其应用到用户-项目评分矩阵上,进行矩阵变换,这一过程是获取矩阵数据的重要特征值来取代整个的稀疏矩阵;(1)首先对于用户项目评分矩阵R,采用奇异值分解公式进行分解;(2)然后把矩阵S中对角线上r-k个最小奇异值置为0,得Sk;(3)最后计算Rk=USkVT作为R的重构矩阵;奇异值分解过程是在进行奇异值分解之前首先对数据进行处理,将用户和商品区别开来,矩阵中的Rij即表示所有用户i对商品j的喜好分值,若没有用户评分,则该项设置为0;在结合协同过滤推荐算法中,奇异值分解可以方便快速的处理原始数据,在保证数据集基本不缺失重要数据的情况下,对当前评分矩阵数据极度稀疏性这一问题;在协同过滤推荐方法中,目标用户和商品之间的关系影响整个算法推荐流程,利用用户的相似邻居对某一商品的评分来对其他商品进行评估;在获得准确完整的用户评价数据之后即可利用奇异值来进行处理。2.根据权利要求1所述的一种基于协同过滤的优化方法,其特征在于:利用奇异值分解的步骤:步骤1)读取用户对项目的行为数据,将用户对项目的评分转变成矩阵格式,将数据直接读入矩阵;步骤2)计算矩阵大小,选取大小适合的实验训练集;步骤3)选取合适的测试集数据用来跟训练集数据做对比,并将测试数据集转换为矩阵格式;步骤4)将训练数据集中对应的矩阵中用户对物品的评分值读入训练集矩阵中;步骤5)获取用户评分矩阵,将用户所在的第j列和电影所在的第j+1列转换即可;步骤6)对训练集矩阵进行分解获得结果;BP神经三层网络结构中元素中,{p1,p2,p3,…,pn-2,pn-1,pn}是输入元素,代表选取商品的特征数据值,获取的特征向量维数即为神经元个数;{w1,w2,w3,w4,w5}为隐层,包含权值的很多分量;{q1,q2,q3,q4,q5}是输出元素,输出产品评分值;BP神经网络的训练是不断进化迭代的;原始的BP神经网络是net(i),那么假定更新之后的网络是net(i+1);由于最新的数据实时性最好,那么在进行进化时把最新的n个数据作为样本集进行训练的效果是最好的。3.根据权利要求2...
【专利技术属性】
技术研发人员:杨胜齐,黄樟钦,郑龙帅,吴寒,包宇津,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。