当前位置: 首页 > 专利查询>同济大学专利>正文

一种用于个性化推荐的融合内容和行为的协同过滤方法技术

技术编号:18302397 阅读:48 留言:0更新日期:2018-06-28 12:12
本发明专利技术涉及一种用于个性化推荐的融合内容和行为的协同过滤方法,该方法包括如下步骤:(1)特征输入:包括代表项目内容的项目‑属性矩阵以及代表用户行为的用户行为矩阵;(2)基于内容的项目聚类:计算项目相似性,对项目进行聚类;(3)评分预测与特征填充:对未评分项目进行评分预测,填充用户‑项目评分矩阵;(4)基于行为的用户聚类:根据项目聚类结果和用户‑项目评分矩阵,对用户进行聚类;(5)评分预测与项目推荐:确定目标用户所在的聚类簇,找到最近邻居用户集合,对目标用户的未评分项目进行评分预测,最后将预测评分最高的前N个项目推荐给目标用户。与现有技术相比,本发明专利技术有效解决了数据稀疏性和冷启动问题,推荐效率高。

A collaborative filtering method for personalized recommendation based on content and behavior integration

The present invention relates to a collaborative filtering method for personalized recommendation of fusion content and behavior. The method includes the following steps: (1) feature input, including item attribute matrix representing project content and user behavior matrix representing user behavior; (2) item clustering based on internal capacity: computing project similarity, pair Clustering of items; (3) score prediction and feature filling: score prediction of non scoring projects, fill in the rating matrix of users' project, and (4) clustering based on behavior based clustering results and rating matrix of users; (5) score prediction and project recommendation: determine the location of the target user The cluster cluster, find the nearest neighbor user set, evaluate the target users' non scoring items, and finally recommend the top N items that predict the highest score to the target users. Compared with the existing technology, the invention effectively solves the problem of data sparsity and cold start, and the recommendation efficiency is high.

【技术实现步骤摘要】
一种用于个性化推荐的融合内容和行为的协同过滤方法
本专利技术涉及一种个性化推荐中的协同过滤方法,尤其是涉及一种融合内容和行为的协同过滤方法。
技术介绍
自上世纪90年代Resnick和Varian提出推荐系统的概念以来,推荐系统由于其重要的理论价值和应用价值,受到了学术界和产业界的广泛关注,至今己经发展成一个独立的研究领域。在学术界,国外有很多著名的研究机构,产出了大量有突破性的学术研究和学术论文。在产业界,实用推荐系统服务于互联网新闻、电子商务、社交网络等各个领域,国内外各大互联网公司也都有专门研究推荐系统的团队。各站点常见的分类排序和热门推荐也是推荐的一种形式,结果偏社会化,属于非个性化推荐(Non-personalizedRecommendation),系统不需要考虑用户的个性化需求,按一定的逻辑将相同的信息资源向用户展示。而个性化推荐基于数据挖掘,将特定的项目与用户的偏好相匹配,为用户提供一对一的、个性化的决策支持信息。个性化推荐服务的自动化、智能化程度更高,使用户从信息泛滥和选择困难中得到解放。个性化推荐服务是当今信息服务的热点,也是未来的必然趋势。协同过滤推荐利用集体智慧,从群体用户的行为中得出具有统计意义的结论,这些结论蕴含着某种趋势或者人群中的共性。其基本思想是认为用户会偏好“与他兴趣相似的用户所喜欢的项目”或“与他喜欢的项目相似的其他项目”,由此对应的分别是基于用户的协同过滤(User-basedCollaborativeFiltering,UCF)和基于项目的协同过滤(Item-basedCollaborativeFiltering,ICF)。协同过滤沿用GroupLens系统的方法,充分利用推荐系统中用户和项目的联系,以用户对项目的评分代表用户偏好,以用户之间对项目评分的相似性、项目之间得分的相似性,代表用户偏好的相似性、项目特征的相似性,无需关注用户或项目本身的属性,就能挖掘出用户的兴趣。协同过滤算法不需要提取用户和项目的特征,故能很好的处理非结构化的网络信息,推荐对象可以为任何类型的资源,且个性化程度高、效果明显,易于挖掘用户潜在兴趣、产生新异推荐。协同过滤推荐优势明显、易于实现,是迄今为止应用最成功和最广泛的推荐技术。但过于依赖用户评分,将面临严重的数据稀疏性问题。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种用于个性化推荐的融合内容和行为的协同过滤方法。本专利技术的目的可以通过以下技术方案来实现:一种用于个性化推荐的融合内容和行为的协同过滤方法,该方法包括如下步骤:(1)特征输入:特征输入包括代表项目内容的项目-属性矩阵以及代表用户行为的用户-项目浏览矩阵、用户-项目收藏矩阵、用户-项目购买矩阵、项目评价标签矩阵和用户-项目评分矩阵;(2)基于内容的项目聚类:将项目-属性矩阵和项目评价标签矩阵组合,计算项目相似性,对项目进行聚类;(3)评分预测与特征填充:针对用户-项目评分矩阵中的未评分项目,在与未评分项目相似性较高的聚类簇中寻找最近邻居项目,根据最近邻居项目的评分,对未评分项目进行评分预测,填充用户-项目评分矩阵;(4)基于行为的用户聚类:根据项目聚类结果和用户-项目评分矩阵,定义用户对项目的偏好度,根据用户的历史行为,定义用户对项目的关注度,将偏好度和关注度进行融合,定义用户对项目的倾向度,并基于此构造用户的融合相似度计算方式,对用户进行聚类;(5)评分预测与项目推荐:确定目标用户所在的聚类簇,在与目标用户相似度最高的若干个簇中找到最近邻居用户集合,根据近邻用户的评分,对目标用户的未评分项目进行评分预测,最后将预测评分最高的前N个项目推荐给目标用户。步骤(2)采用K-Means聚类法进行项目聚类,具体为:21)记项目-属性矩阵和项目评价标签矩阵分别为A和T:A=(aij)m×p,aij∈{0,1},T=(tij)m×q,tij∈[0,1],其中,m为项目总个数,p为项目属性个数,tij为项目i与第j个标签的相关性,q为标签的总个数;22)将项目-属性矩阵和项目评价标签矩阵组合得到项目特征矩阵为m×(p+q)阶矩阵,记作S=(sij)m×l,l=p+q,该矩阵中的行向量为项目的特征值向量;23)定义项目集E[m]={e1,e2,...,em},从项目集E中随机选取k1个项目作为k1个初始的聚类中心,k1为聚类数;24)对根据项目的特征值向量分别计算每个项目与k1个聚类中心的相似度,将项目划分到距离最近的簇中,直到所有的项目都被划分;25)根据划分后的各个簇中的项目,重新调整每个簇的聚类中心,以簇中所有项目特征值向量中的特征值的均值作为新的聚类中心;26)重复步骤24)和25),直到聚类准则函数平方误差收敛、聚类中心保持稳定为止,最终输出聚类簇以及k1个聚类中心步骤24)中计算每个项目与k1个聚类中心的相似度通过下式方式求取:设待求取的两个项目的特征值向量为和以两个特征值向量之间的距离Ssim(i,j)表示两个项目之间的相似度:其中,wx是第x个特征值的权重,0≤wx≤1,d(six,sjx)为项目i和j在第x个特征值上的绝对值距离,是项目i和j在第x个特征值上的相似性。步骤(3)具体为:31)步骤(2)进行项目聚类后,项目集E被划分为k1个聚类簇使得且32)设用户u和v已评分项目并集为Euv=Eu∪Ev,则用户u未评分项目集为Nu=Euv-Eu,对于未评分项目e∈Nu,有e,f∈Ei,i∈[1,k1],其中,项目f为未评分项目e所在项目簇中的其他项目,对于用户-项目评分矩阵中的某个空缺值,即某用户未对某项目的评分,若该项目有其他用户评分,即对于非新项目e,该项目与其所在簇中的其他项目f的相似性采用皮尔逊相似度,表示为:其中,Uef表示对项目e,f都已评分用户集,分别表示所有用户对项目e,f的平均评分,rue为用户u对项目e的评分值,ruf为用户u对项目f的评分值;若该项目e没有其他用户评分过,即e为新项目,则根据项目特征值矩阵,项目e,f之间的相似性表示为:其中,项目e,f特征值向量为和wx是第x个特征值的权重,0≤wx≤1,d(sex,sfx)为项目e,f在第x个特征值的绝对值距离,是项目e,f在第x个特征值的相似性;33)根据上述相似性计算结果确定未评分项目e在聚类簇中最相似的K1个最近邻居项目集K1NN(e),根据近邻项目的评分预测未评分项目的评分,计算公式如下:根据上式计算出所有用户未评分项目的预测值。步骤(4)具体为:41)求取用户u对步骤(2)中聚类后的某一类的项目Ei的类别偏好度favor(u,Ei),i∈[1,k1],k1为聚类的项目类别总个数,favor(u,Ei)为用户u对Ei类项目的评分和与用户u对所有项目的评分和的比值;42)统计用户u的行为次数和行为评分,所述的行为包括浏览、收藏和购买,针对某一类的项目Ei,用户u对Ei的行为次数为behaviorFui,对每种行为赋予不同权重,获取用户u对Ei的行为评分为behaviorRui,同时获取用户u对所有项目的行为次数totalFu和行为评分behaviorRu;43)计算类别相对次数RGFui和类别相对评分RGRui:RGFui=behaviorFui/totalFu,本文档来自技高网
...
一种用于个性化推荐的融合内容和行为的协同过滤方法

【技术保护点】
1.一种用于个性化推荐的融合内容和行为的协同过滤方法,其特征在于,该方法包括如下步骤:(1)特征输入:特征输入包括代表项目内容的项目‑属性矩阵以及代表用户行为的用户‑项目浏览矩阵、用户‑项目收藏矩阵、用户‑项目购买矩阵、项目评价标签矩阵和用户‑项目评分矩阵;(2)基于内容的项目聚类:将项目‑属性矩阵和项目评价标签矩阵组合,计算项目相似性,对项目进行聚类;(3)评分预测与特征填充:针对用户‑项目评分矩阵中的未评分项目,在与未评分项目相似性较高的聚类簇中寻找最近邻居项目,根据最近邻居项目的评分,对未评分项目进行评分预测,填充用户‑项目评分矩阵;(4)基于行为的用户聚类:根据项目聚类结果和用户‑项目评分矩阵,定义用户对项目的偏好度,根据用户的历史行为,定义用户对项目的关注度,将偏好度和关注度进行融合,定义用户对项目的倾向度,并基于此构造用户的融合相似度计算方式,对用户进行聚类;(5)评分预测与项目推荐:确定目标用户所在的聚类簇,在与目标用户相似度最高的若干个簇中找到最近邻居用户集合,根据近邻用户的评分,对目标用户的未评分项目进行评分预测,最后将预测评分最高的前N个项目推荐给目标用户。

【技术特征摘要】
1.一种用于个性化推荐的融合内容和行为的协同过滤方法,其特征在于,该方法包括如下步骤:(1)特征输入:特征输入包括代表项目内容的项目-属性矩阵以及代表用户行为的用户-项目浏览矩阵、用户-项目收藏矩阵、用户-项目购买矩阵、项目评价标签矩阵和用户-项目评分矩阵;(2)基于内容的项目聚类:将项目-属性矩阵和项目评价标签矩阵组合,计算项目相似性,对项目进行聚类;(3)评分预测与特征填充:针对用户-项目评分矩阵中的未评分项目,在与未评分项目相似性较高的聚类簇中寻找最近邻居项目,根据最近邻居项目的评分,对未评分项目进行评分预测,填充用户-项目评分矩阵;(4)基于行为的用户聚类:根据项目聚类结果和用户-项目评分矩阵,定义用户对项目的偏好度,根据用户的历史行为,定义用户对项目的关注度,将偏好度和关注度进行融合,定义用户对项目的倾向度,并基于此构造用户的融合相似度计算方式,对用户进行聚类;(5)评分预测与项目推荐:确定目标用户所在的聚类簇,在与目标用户相似度最高的若干个簇中找到最近邻居用户集合,根据近邻用户的评分,对目标用户的未评分项目进行评分预测,最后将预测评分最高的前N个项目推荐给目标用户。2.根据权利要求1所述的一种用于个性化推荐的融合内容和行为的协同过滤方法,其特征在于,步骤(2)采用K-Means聚类法进行项目聚类,具体为:21)记项目-属性矩阵和项目评价标签矩阵分别为A和T:T=(tij)m×q,tij∈[0,1],其中,m为项目总个数,p为项目属性个数,tij为项目i与第j个标签的相关性,q为标签的总个数;22)将项目-属性矩阵和项目评价标签矩阵组合得到项目特征矩阵为m×(p+q)阶矩阵,记作S=(sij)m×l,l=p+q,该矩阵中的行向量为项目的特征值向量;23)定义项目集E[m]={e1,e2,...,em},从项目集E中随机选取k1个项目作为k1个初始的聚类中心,k1为聚类数;24)对根据项目的特征值向量分别计算每个项目与k1个聚类中心的相似度,将项目划分到距离最近的簇中,直到所有的项目都被划分;25)根据划分后的各个簇中的项目,重新调整每个簇的聚类中心,以簇中所有项目特征值向量中的特征值的均值作为新的聚类中心;26)重复步骤24)和25),直到聚类准则函数平方误差收敛、聚类中心保持稳定为止,最终输出聚类簇以及k1个聚类中心3.根据权利要求2所述的一种用于个性化推荐的融合内容和行为的协同过滤方法,其特征在于,步骤24)中计算每个项目与k1个聚类中心的相似度通过下式方式求取:设待求取的两个项目的特征值向量为和以两个特征值向量之间的距离Ssim(i,j)表示两个项目之间的相似度:其中,wx是第x个特征值的权重,0≤wx≤1,d(six,sjx)为项目i和j在第x个特征值上的绝对值距离,是项目i和j在第x个特征值上的相似性。4.根据权利要求2所述的一种用于个性化推荐的融合内容和行为的协同过滤方法,其特征在于,步骤(3)具体为:31)步骤(2)进行项目聚类后,项目集E被划分为k1个聚类簇使得且32)设用户u和v已评分项目并集为Euv=Eu∪Ev,则用户u未评分项目集为Nu=Euv-Eu,对于未评分项目e∈Nu,有e,f∈Ei,i∈[1,k1],其中,项目f为未评分项目e所在项目簇中的其他项目,对于用户-项目评分矩阵中的某个空缺值,即某用户未对某项目的评分,若该项目有其他用户评分,即对于非新项目e,该项目与其所在簇中的其他项目f的相似性采用皮尔逊相似度,表示为:其中,Uef表示对项目e,f都已评分用户集,分别表示所有用户对...

【专利技术属性】
技术研发人员:马云龙刘敏袁菡殷蓉
申请(专利权)人:同济大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1