This application provides a user clustering method and device, the method includes determining a plurality of users to obtain clustering; each of the users in the animation business platform in at least one of the first class in the first class label, the label interest representation of the user visited in the animation business platform animation types respectively; for each of the users in the pan entertainment business platform specified at least one of the second kinds of interest label, the second categories of interest label characterization of the user visited in the pan entertainment business platform in the pan entertainment, the pan entertainment business platform is different from the animation business platform; according to the user with the at least one the first kind of interest in the label and the at least one of second types of interest to cluster the tags, multiple users, multiple classification cluster, each of the classifications includes at least One of the users. Through this application scheme, we can improve the accuracy of clustering for animation users.
【技术实现步骤摘要】
本申请涉及
,特别涉及一种用户聚类方法和装置。
技术介绍
随着动漫技术的不断发展,动漫行业中动漫的数量以及种类也逐渐增多。为了满足动漫业务平台的运营需求或者有针对性向动漫用户提供动漫服务等,经常需要对动漫业务平台的动漫用户进行聚类。然而,目前对动漫用户进行聚类时,由于无法准确把控动漫用户的兴趣爱好,使得聚类结果存在偏差,无法实现较为精准的聚类。
技术实现思路
本申请提供了一种用户聚类方法和装置,以提高对动漫用户进行聚类的精准度。为了解决上述问题,一方面,本申请提供了一种用户聚类方法,包括:确定待聚类的多个用户;分别获取每个所述用户在动漫业务平台中的至少一个第一类兴趣标签,所述第一类兴趣标签表征所述用户在所述动漫业务平台中访问过的动漫类型;分别获取每个所述用户在指定的泛娱乐业务平台中的至少一个第二类兴趣标签,所述第二类兴趣标签表征所述用户在所述泛娱乐业务平台中访问过的泛娱乐类型,所述泛娱乐业务平台不同于所述动漫业务平台;根据所述用户具有的所述至少一个第一类兴趣标签以及所述至少一个第二类兴趣标签,对所述多个用户进行聚类,得到聚类出的多个分类,每个所述分类中包括至少 ...
【技术保护点】
一种用户聚类方法,其特征在于,包括:确定待聚类的多个用户;分别获取每个所述用户在动漫业务平台中的至少一个第一类兴趣标签,所述第一类兴趣标签表征所述用户在所述动漫业务平台中访问过的动漫类型;分别获取每个所述用户在指定的泛娱乐业务平台中的至少一个第二类兴趣标签,所述第二类兴趣标签表征所述用户在所述泛娱乐业务平台中访问过的泛娱乐类型,所述泛娱乐业务平台不同于所述动漫业务平台;根据所述用户具有的所述至少一个第一类兴趣标签以及所述至少一个第二类兴趣标签,对所述多个用户进行聚类,得到聚类出的多个分类,每个所述分类中包括至少一个所述用户。
【技术特征摘要】
1.一种用户聚类方法,其特征在于,包括:确定待聚类的多个用户;分别获取每个所述用户在动漫业务平台中的至少一个第一类兴趣标签,所述第一类兴趣标签表征所述用户在所述动漫业务平台中访问过的动漫类型;分别获取每个所述用户在指定的泛娱乐业务平台中的至少一个第二类兴趣标签,所述第二类兴趣标签表征所述用户在所述泛娱乐业务平台中访问过的泛娱乐类型,所述泛娱乐业务平台不同于所述动漫业务平台;根据所述用户具有的所述至少一个第一类兴趣标签以及所述至少一个第二类兴趣标签,对所述多个用户进行聚类,得到聚类出的多个分类,每个所述分类中包括至少一个所述用户。2.根据权利要求1所述的用户聚类方法,其特征在于,所述根据所述用户具有的所述至少一个第一类兴趣标签以及所述至少一个第二类兴趣标签,对所述多个用户进行聚类,包括:按照待构建的兴趣向量中每个维度所表征的兴趣标签,并结合所述用户具有的所述至少一个第一类兴趣标签以及至少一个第二类兴趣标签,构建所述用户的兴趣向量;依据所述多个用户各自的兴趣向量,对所述多个用户进行聚类。3.根据权利要求2所述的用户聚类方法,其特征在于,在所述按照待构建的兴趣向量中每个维度所表征的兴趣标签,并结合所述用户具有的所述至少一个第一类兴趣标签以及至少一个第二类兴趣标签,构建所述用户的兴趣向量之前,还包括:根据所述用户具有的所述至少一个第一类兴趣标签以及所述至少一个第二类兴趣标签,分别确定具有每个所述第一类兴趣标签的用户数量以及具有每个所述第二类兴趣标签的用户数量;按照具有的用户数量从多到少的排序,从所述多个第一类兴趣标签以及多个第二类兴趣标签中,选取出具有的用户数量的排序靠前的指定数量个兴趣标签;将所述指定数量个兴趣标签分别作为待构建的兴趣向量中不同维度所表征的兴趣标签,其中,所述待构建的兴趣向量具有的维度个数为所述指定数量个。4.根据权利要求2或3所述的用户聚类方法,其特征在于,所述按照待构建的兴趣向量中每个维度所表征的兴趣标签,并结合所述用户具有的所述至少一个第一类兴趣标签以及至少一个第二类兴趣标签,构建所述用户的兴趣向量,包括:对于待构建的兴趣向量中的每个维度,当用户的所述至少一个第一类兴趣标签以及所述至少一个第二类兴趣标签中包括所述维度所表征的兴趣标签,则确定所述用户的兴趣向量中所述维度的取值为1;否则,确定用户的所述兴趣向量中所述维度的取值为0,得到所述用户的兴趣向量。5.根据权利要求2或3所述的用户聚类方法,其特征在于,所述依据所述多个用户各自的兴趣向量,对所述多个用户进行聚类,包括:确定所需聚类出的分类个数k;根据所述分类个数k以及预置的k-均值聚类算法,将所述多个用户的兴趣向量聚类到多个分类,并将所述用户的兴趣向量所属的分类确定为所述用户所属的分类。6.根据权利要求1至3任一项所述的用户聚类方法,其特征在于,在得到聚类出的多个分类之后,还包括:对于每一个分类,确定该分类中的所有用户具有的多个第一类兴趣标签以及多个第二类兴趣标签;且,按照所述分类中具有所述多个第一类兴趣标签中每个第一类兴趣标签的用户数量,从所述多个第一类兴趣标签中,确定出具有的用户数量最多的目标第一类兴趣标签;按照所述分类中具有所述多个第二类兴趣标签中每个第二类兴趣标签的用户数量,从所述多个第二类兴趣标签中,确定出具有的用户数量最多的目标第二类兴趣标签;利用所述目标第一类兴趣标签以及所述目标第二类兴趣标签标...
【专利技术属性】
技术研发人员:袁林,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。