【技术实现步骤摘要】
一种基于多重聚类的个性化内容推荐方法及装置
本公开涉及计算机数据处理
,具体涉及一种基于多重聚类的个性化内容推荐方法及装置。
技术介绍
随着网络信息化技术的发展,人们越来越普及了通过推送网络信息来及时了解自己想要的信息。传统的方法是对用户进行聚类,当有新用户出现时,将新用户也放入到聚类算法中,查找其具有相同或者相近兴趣偏好的用户,通过这个来推荐产品或者内容。现有专利技术的缺点在于,将用户进行聚类之后,虽然可以知道相似或者相同兴趣偏好的用户有哪些,但是内容和用户之间的关系不太确定,如果用户没有对推荐内容进行反馈,无法通过已有用户的信息来决定是否给新用户推荐内容。
技术实现思路
本公开提供一种基于多重聚类的个性化内容推荐方法及装置,对内容聚类、对用户聚类、将用户与内容一起聚类的方式,使用决策树算法给用户贴标签,通过对内容、用户、内容的用户的三重聚类,自动向用户推荐个性化的内容。为了实现上述目的,根据本公开的一方面,提供一种基于多重聚类的个性化内容推荐方法,所述方法包括以下步骤:步骤A,将待推送的新内容进行分词并使用LDA算法得出内容主题;步骤B,将新内容的主题和以往 ...
【技术保护点】
1.一种基于多重聚类的个性化内容推荐方法,其特征在于,所述方法包括以下步骤:步骤A,将待推送的新内容进行分词并使用LDA算法得出内容主题;步骤B,将新内容的主题和以往内容的主题进行向量化得到主题向量,向量化即当主题出现作为1,否则为0;步骤C,将用户的初始信息放入决策树算法贴上标签并将其向量化,每个决策树的节点就是一个标签,当新用户通过某个节点时,就贴上相应的标签,形成新用户信息向量;步骤D,通过聚类算法将新内容的主题向量与以往内容的主题向量进行聚类:以往内容的主题向量与新内容的主题向量一并放入聚类算法中,若新内容主题向量距离任意聚类中心大于阈值距离,则将新内容主题向量与用 ...
【技术特征摘要】
1.一种基于多重聚类的个性化内容推荐方法,其特征在于,所述方法包括以下步骤:步骤A,将待推送的新内容进行分词并使用LDA算法得出内容主题;步骤B,将新内容的主题和以往内容的主题进行向量化得到主题向量,向量化即当主题出现作为1,否则为0;步骤C,将用户的初始信息放入决策树算法贴上标签并将其向量化,每个决策树的节点就是一个标签,当新用户通过某个节点时,就贴上相应的标签,形成新用户信息向量;步骤D,通过聚类算法将新内容的主题向量与以往内容的主题向量进行聚类:以往内容的主题向量与新内容的主题向量一并放入聚类算法中,若新内容主题向量距离任意聚类中心大于阈值距离,则将新内容主题向量与用户信息向量进行聚类:将主题向量和用户信息向量都放入聚类算法中,否则将新内容推荐到同一聚类中心且经过协同过滤推荐算法过滤后的用户:将主题向量所对应的新内容推送给与主题向量相同聚类中心的用户;步骤E,将新内容推送至同类的以往内容的所推送过的用户:新内容的主题向量与的以往内容的主题向量聚类后,若所推送用户初始信息未变化,则进入步骤E,否则进入步骤H;步骤F,推送消息给当前用户;步骤G,将用户信息向量进行聚类:将用户信息的向量放入聚类算法;步骤H,同类收到此新内容的用户数:若聚类后,初始信息发生变化的用户的同类用户有收到此新内容,若收到此新内容的同类用户数超过用户阈值,则推送消息给当前用户,否则不推送消息给当前用户。2.根据权利要求1所述的一种基于多重聚类的个性化内容推荐方法,其特征在于,在步骤A中,将待推送的新内容进行分词的分词方法为最小匹配算法、最大匹配算法、逐字匹配算法、神经网络分词算法、联想—回溯法、N-最短路径分词算法、基于词频统计的切词法、基于期望的切词法、有穷多级列举法的任意一种。3.根据权利要求1所述的一种基于多重聚类的个性化内容推荐方法,其特征在于,在步骤C中,所述决策树算法为朴素贝叶斯分类算法、贝叶斯网络算法、ID3算法和C4.5算法中任意一种。4.根据权利要求1所述的一种基于多重聚类的个性化内容推荐方法,其特征在于,在步骤D中,所述聚类算法包括K-means算法、层次聚类算法、SOM算法、FCM算法、WAVECLUSTER算法、ROCK算法、BIRCH算法、CURE算法、K...
【专利技术属性】
技术研发人员:罗云,陈远存,刘国文,
申请(专利权)人:广东奥博信息产业股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。