一种基于子兴趣划分的标注用户模型建构方法技术

技术编号：10733745 阅读：153 留言：0更新日期：2014-12-10 10:44

本发明专利技术提供一种基于子兴趣划分的标注用户模型建构方法，包括步骤：获取网站用户标注数据，建立标注资源信息数据库；建立资源向量空间模型；对资源向量空间模型进行资源聚类；根据聚类资源结果进行用户子兴趣划分；构建用户模型；将用户模型嵌入标签网站后台，根据用户模型与资源模型的余弦相似度进行资源推送。本发明专利技术更多地考虑到用户存在兴趣的多样性，突破用户模型单一化的表现形式，细化了用户模型的描述粒度，减少了单一模型中多个标签混合造成的语义混乱问题，从而帮助标签网站推出更为有效的用户个性化信息服务，将依据本发明专利技术的方法所建立的标注用户模型应用到标签网站的推荐系统中，能够极大提高推荐系统的推荐准确性和推荐效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于子兴趣划分的标注用户模型建构方法
本专利技术涉及社会化标注技术，具体涉及一种基于子兴趣划分的标注用户模型建构方法。
技术介绍
电子商务作为一种新兴的商务模式已经越来越受到人们的普遍认可并蓬勃发展。个性化推荐技术作为用户在海量商务信息中获取偏好商品信息的重要手段，近年来受到了广泛的关注。几乎所有的大型电子商务系统如Amazon、淘宝等均不同程度的使用了各种推荐系统。随着各种Web2.0应用的深入发展，普通用户越来越成为信息内容的重要生产者，Delicious、Flickr、YouTube等Web2.0网站不断涌现，社会化标注(SocialTagging)也成为了电子商务个性化推荐研究一个新的着手点。社会化标注系统中的用户模型是各类推荐系统进行个性化推荐的重要依据之一，因此用户模型的建立对于推荐系统能否进行准确及时有效的推荐至关重要。当前，基于社会化标注的用户建模的研究仍处在一个兴起阶段。在已有的研究中，多数的研究是将用户兴趣作为同一维度加以处理，而事实上，用户往往有着多个不同的兴趣点。如某一用户不仅对计算机编程充满兴趣，同时也关注旅游摄影方面的信息，如果将该用户的兴趣标签置于同一维度模型中，将很有可能导致标签间的语义混乱，从而降低个性化推荐的效果。现有的方法有：一是基于矩阵的处理建立用户模型。矩阵的表示方法在社会网络的文献中非常流行，具体的方法包括：通过标签-资源矩阵和LSA方法来进行的，利用HOSVD算法将用户、标签、资源吸收到同一框架中进行分析的，以及通过矩阵扩展的方法等。二是基于聚类分析建立用户模型。具体的方法包括通过紧密度(affinity)...
一种基于子兴趣划分的标注用户模型建构方法

【技术保护点】
一种基于子兴趣划分的标注用户模型建构方法，其特征在于：包括以下步骤：1)从标签网站提供的API端口爬取网站用户标注数据，对用户添加过标签的资源信息(URLs)进行统计，建立标注资源信息数据库；2)对用户所标注的每个资源建立向量空间模型；3)对步骤2)中所建立的向量空间模型进行资源聚类；4)根据步骤3)得到的资源聚类结果进行用户子兴趣划分；5)基于步骤4)划分的用户子兴趣构建用户模型；6)将用户模型嵌入标签网站后台，根据用户模型与资源模型的余弦相似度进行资源推送。

【技术特征摘要】
1.一种基于子兴趣划分的标注用户模型建构方法，其特征在于：包括以下步骤：1)从标签网站提供的API端口爬取网站用户标注数据，对用户添加过标签的资源信息进行统计，建立标注资源信息数据库；2)对用户所标注的每个资源建立向量空间模型；3)对步骤2)中所建立的向量空间模型进行资源聚类；4)根据步骤3)得到的资源聚类结果进行用户子兴趣划分；5)基于步骤4)划分的用户子兴趣构建用户模型；6)将用户模型嵌入标签网站后台，根据用户模型与资源模型的余弦相似度进行资源推送；所述步骤2)具体包括以下步骤：2.1)：选取标签网站中的一个目标用户，从步骤1)建立的标注资源信息数据库中获取其标注的所有资源信息，建立资源集合SetR；2.2)：统计资源集合SetR中每一资源r中所有标签的出现频率；2.3)：应用TF-IDF算法，计算资源r中所有标签的权值w并确定主流标签PopT；2.4)：构建资源r的向量空间模型r(tm,wm)，其中，tm表示该模型中所包含的第m个标签，wm为对应的权重；所述步骤3)包括以下具体步骤：3.1)：选取一个资源集合SetR，计算其中任意两个不同向量ri与rj的余弦相似度Simij；3.2)：根据SetR内资源所对应的向量间的余弦相似度Simij，建立对称矩阵Data_Sim；3.3)：应用派系过滤算法的社团发现算法对Data_Sim进行聚类，得到类别数C；3.4)：根据每一资源集合所属的不同类别，统计每一类别C中所包含的资源集合，构成聚...

【专利技术属性】
技术研发人员：魏建良，琚春华，肖亮，刘东升，
申请(专利权)人：浙江工商大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人