The invention discloses a social network user interest mining method, which is characterized in that: the user groups including users in a social network are divided according to different objects of attention row weight after treatment, each group of users of the social network; for a pre-set interest of each category, select a the user interest group as the core group corresponding to the category of interest; for each core interest group selected from the group and the similarity of other users in the core group, the group of users set similarity higher than the threshold value as the core interest group under the general interest group; for each user of the social network. Interest categories according to the interest of the user group contains generalized corresponding results to determine the user interest mining. By using the invention, the accuracy of interest mining can be improved.
【技术实现步骤摘要】
社交网络用户兴趣挖掘方法和系统
本专利技术涉及互联网技术,尤其涉及一种社交网络用户兴趣挖掘方法和装置。
技术介绍
随着互联网技术的发展,互联网上的海量信息与用户对信息的有效获取能力形成了强烈的反差。为了提高用户查找信息的满意度,在社交网络SNS(SocialNetworkService,社交网络服务)中,根据用户的兴趣而有针对性地提供信息的个性化信息服务应运而生,而个性化信息服务的基础是用户兴趣的挖掘。实际应用中,在社交网络用户的行为一般是主动进行的,例如,自行定义或选择标签,浏览页面,使用站内产品或第三方APP,发表博文或对其他博文内容的点赞或收藏,关注其他用户并将其关注的对象划分到自行设置的各用户组内等。而上述这些社交网络用户的行为能够在一定程度上反映出用户的兴趣。因此,社交网络中,可以根据用户的这些网络行为来进行用户的兴趣挖掘。目前,对于社交网络用户的兴趣挖掘,一般可以采用基于用户博文的兴趣挖掘方法。具体地,由于用户博文具体可以是用户发表的,也可以是用户点赞或收藏的,能够在一定程度上反映出用户的兴趣,因此,可以通过对用户博文进行语义解析,以此提取用户的兴趣。 ...
【技术保护点】
一种社交网络用户兴趣挖掘方法,其特征在于,包括:将社交网络中的各用户针对各自关注的对象所划分的用户组进行排重处理后,得到所述社交网络中的各用户组;对于预先设置的每个兴趣类别,选取一个用户组作为与该兴趣类别相对应的兴趣核心组;针对选取出的每个兴趣核心组,计算其它用户组与该兴趣核心组的相似度,将相似度高于设定阈值的用户组作为该兴趣核心组下的兴趣广义组;对于所述社交网络中的每个用户,根据包含该用户的兴趣广义组所对应的兴趣类别确定该用户的兴趣挖掘结果。
【技术特征摘要】
1.一种社交网络用户兴趣挖掘方法,其特征在于,包括:将社交网络中的各用户针对各自关注的对象所划分的用户组进行排重处理后,得到所述社交网络中的各用户组;对于预先设置的每个兴趣类别,选取一个用户组作为与该兴趣类别相对应的兴趣核心组;针对选取出的每个兴趣核心组,计算其它用户组与该兴趣核心组的相似度,将相似度高于设定阈值的用户组作为该兴趣核心组下的兴趣广义组;对于所述社交网络中的每个用户,根据包含该用户的兴趣广义组所对应的兴趣类别确定该用户的兴趣挖掘结果。2.如权利要求1所述的方法,其特征在于,在所述针对选取出的每个兴趣核心组,计算其它用户组与该兴趣核心组的相似度,将相似度高于设定阈值的用户组作为该兴趣核心组下的兴趣广义组之后,还包括:对于所述社交网络中的每个用户,统计出包含该用户的兴趣广义组的个数,作为该用户的被广义分组次数;针对每个兴趣广义组,计算出该兴趣广义组内的所有用户的被广义分组次数之和,作为该兴趣广义组的分组次数和值;对于该兴趣广义组内的每个用户,根据该用户的被广义分组次数和该兴趣广义组的分组次数和值,计算出该用户的广义组内权重;以及所述根据包含该用户的兴趣广义组所对应的兴趣类别确定该用户的兴趣挖掘结果,具体包括:选取该用户的广义组内权重最大的兴趣广义组,将选取的兴趣广义组所属的兴趣核心组所对应的兴趣类别作为该用户的兴趣挖掘结果。3.如权利要求1或2所述的方法,其特征在于,所述针对选取出的每个兴趣核心组,计算其它用户组与该兴趣核心组的相似度,具体包括:对于所述社交网络中的每个用户,统计出包含该用户的用户组的个数,作为该用户的被分组次数;针对所述社交网络中的每个用户组,计算出该用户组内的所有用户的被分组次数之和,作为该用户组的分组次数和值;并对于该用户组内的每个用户,根据该用户的被分组次数和该用户组的分组次数和值,计算出该用户在该用户组内的组内权重;针对选取出的每个兴趣核心组,对于除该兴趣核心组之外的其它用户组中的一个用户组,将其作为涉及相似度计算的用户组a、将该兴趣核心组作为涉及相似度计算的用户组b,根据如下公式1计算出用户组a与b之间的相似度x:其中,waj为用户组a与用户组b之间的第j个重合用户在用户组a中的组内权重,wbj为用户组a与用户组b之间的第j个重合用户在用户组b中的组内权重,n为a与b之间的重合用户的总数,j取值为1~n的自然数;其中,用户组a与用户组b之间的重合用户指的是用户组a与用户组b共同包含的用户。4.如权利要求1或2所述的方法,其特征在于,所述选取一个用户组作为与该兴趣类别相对应的兴趣核心组,具体包括:对于预先设置的每个兴趣类别,将组名与该兴趣类别的名称相同的用户组作为与该兴趣类别相对应的兴趣核心组。5.如权利要求1或2所述的方法,其特征在于,在所述根据包含该用户的兴趣广义组所对应的兴趣类别确定该用户的兴趣挖掘结果后,还包括:将该兴趣挖掘结果作为该用户的基于被分组信息的兴趣挖掘结果后,还根据该用户的至少一种网络行为信息,分别确定基于各网络行为信息的兴趣挖掘结果;所述网络行为信息包括:用户自定义的标签、用户对社交网络的站内产品以及第三方应用的使用频次、用户站外网页浏览的反向链接、用户的博文;根据该用户的基于被分组信息的兴趣挖掘结果,以及基于各网络行为信息的兴趣挖掘结果,确定出该用户最终的兴趣类别。6.如权利要求5所述的方法,其特征在于,所述根据该用...
【专利技术属性】
技术研发人员:何秋菊,高辉,
申请(专利权)人:微梦创科网络科技中国有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。