【技术实现步骤摘要】
社交网络群体识别方法和系统
本专利技术涉及通信
,尤其涉及一种社交网络群体识别方法和系统。
技术介绍
现有技术中,在web1.0时期,网络中消息的传播模式主要为:发布者编辑发布消息,大众浏览消息。而用户与用户之间的交互活动很少,因此,消息传播的范围、路径和影响是可以准确预测的。然而,在web2.0时期,随着微博、QQ、人人网、Facebook等社交网络的发展,用户与用户之间的交互活动大量增加,每个用户都可以成为消息的传播源,导致消息传播的范围、路径和影响难以预测,难以从社交网络中识别出使得消息广泛传播的关键用户群体,从而难以对消息的传播进行有效的控制。
技术实现思路
本专利技术提供一种社交网络群体识别方法和系统,用于解决现有技术中难以从社交网络中识别出使得消息广泛传播的关键用户群体的问题。本专利技术的第一个方面是提供一种社交网络群体识别方法,包括:获取社交网络中多个待识别的用户以及每个待识别用户对应的用户消息;所述用户消息包括消息内容和感染状态;对于每个待识别的用户,根据各个待识别用户对应的用户消息中的消息内容,确定所述各个用户消息所属的主题以及所述各个用户消息属于对应主题的概率;对于每个待识别的用户,根据所述各个用户消息属于对应主题的概率,以及所述各个用户消息中的感染状态,计算各个主题被所述待识别的用户感染的概率;对于每个待识别的用户,根据各个主题被所述待识别的用户感染的概率,确定所述待识别的用户所属的与主题对应的用户群体。本专利技术的另一个方面提供一种社交网络群体识别系统,包括:获取模块,用于获取社交网络中多个待识别的用户以及每个待识别用户对应的用户 ...
【技术保护点】
一种社交网络群体识别方法,其特征在于,包括:获取社交网络中多个待识别的用户以及每个待识别用户对应的用户消息;所述用户消息包括消息内容和感染状态;对于每个待识别的用户,根据各个待识别用户对应的用户消息中的消息内容,确定所述各个用户消息所属的主题以及所述各个用户消息属于对应主题的概率;对于每个待识别的用户,根据所述各个用户消息属于对应主题的概率,以及所述各个用户消息中的感染状态,计算各个主题被所述待识别的用户感染的概率;对于每个待识别的用户,根据各个主题被所述待识别的用户感染的概率,确定所述待识别的用户所属的与主题对应的用户群体。
【技术特征摘要】
1.一种社交网络群体识别方法,其特征在于,包括:获取社交网络中多个待识别的用户以及每个待识别用户对应的用户消息;所述用户消息包括消息内容和感染状态;对于每个待识别的用户,根据各个待识别用户对应的用户消息中的消息内容,确定所述各个用户消息所属的主题以及所述各个用户消息属于对应主题的概率;对于每个待识别的用户,根据所述各个用户消息属于对应主题的概率,以及所述各个用户消息中的感染状态,计算各个主题被所述待识别的用户感染的概率;对于每个待识别的用户,根据各个主题被所述待识别的用户感染的概率,确定所述待识别的用户所属的与主题对应的用户群体;其中,所述对于每个待识别的用户,根据所述各个用户消息属于对应主题的概率,以及所述各个用户消息中的感染状态,计算各个主题的消息被所述待识别的用户感染的概率,包括:对于每个待识别的用户,针对每个主题,根据所述各个用户消息属于对应主题的概率,以及所述各个用户消息中的感染状态,计算所述各个用户消息中所述主题被所述待识别的用户感染的概率;根据所述各个用户消息中所述主题被所述待识别的用户感染的概率,确定所述主题被所述待识别的用户感染的概率;所述对于每个待识别的用户,根据各个主题被所述待识别的用户感染的概率,确定所述待识别的用户所属的与主题对应的用户群体,包括:对于每个待识别的用户,获取所述待识别用户的关注对象、好友列表以及消息发送对象,构建关系网络;针对每个主题,根据所述主题被所述待识别的用户感染的概率,确定所述关系网络中具有连接关系的任意两个待识别用户之间的连接距离;若具有连接关系的两个待识别用户之间的连接距离小于预设值,则确定所述两个待识别用户属于所述主题对应的用户群体。2.根据权利要求1所述的方法,其特征在于,所述对于每个待识别的用户,根据各个待识别用户对应的用户消息中的消息内容,确定所述各个用户消息所属的主题以及所述各个用户消息属于对应主题的概率,包括:对于每个待识别的用户,对所述用户消息中的消息内容进行分词,获取所述用户消息中的关键词以及所述关键词的词频;根据所述关键词查询预设的词汇表,确定所述用户消息所属的主题;根据所述关键词的词频,确定所述用户消息属于对应主题的概率。3.根据权利要求1所述的方法,其特征在于,所述对于每个待识别的用户,根据各个主题被所述待识别的用户感染的概率,确定所述待识别的用户所属的与主题对应的用户群体之后,还包括:获取待分析消息的消息内容;根据所述待分析消息的消息内容,确定所述待分析消息所属的主题以及属于对应主题的概率;获取所述待分析消息所属的主题中...
【专利技术属性】
技术研发人员:怀进鹏,武南南,李建欣,张日崇,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。