当前位置: 首页 > 专利查询>清华大学专利>正文

社会网络在线特定团体感知方法及系统技术方案

技术编号:10053908 阅读:193 留言:0更新日期:2014-05-16 02:37
本发明专利技术公开了一种社会网络在线特定团体感知方法及系统,该方法包括步骤:S1.根据待感知团体的特征,得到描述该团体的关键词列表;S2.选取若干已知待探测团体的用户节点,并将其加入团体;S3.依次取出已确定为团体内部的用户节点;S4.遍历团体内部的用户节点,若遍历完成进入S5,否则进入S6;S5.系统运行结束;S6.通过从团体中提取用户节点ID获取其好友ID列表;S7.遍历好友ID列表,若遍历完成则返回S3,否则进入S8;S8.从好友列表中顺序取出好友ID;S9.通过好友ID获取用户个人属性信息。本发明专利技术采用有效且高效的框架感知特定团体,通过三层过滤机制对未知用户进行探测,识别其是否归属于特定团体,可对待探测用户列表的重复项进行去重操作,减少信息的冗余程度。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种社会网络在线特定团体感知方法及系统,该方法包括步骤:S1.根据待感知团体的特征,得到描述该团体的关键词列表;S2.选取若干已知待探测团体的用户节点,并将其加入团体;S3.依次取出已确定为团体内部的用户节点;S4.遍历团体内部的用户节点,若遍历完成进入S5,否则进入S6;S5.系统运行结束;S6.通过从团体中提取用户节点ID获取其好友ID列表;S7.遍历好友ID列表,若遍历完成则返回S3,否则进入S8;S8.从好友列表中顺序取出好友ID;S9.通过好友ID获取用户个人属性信息。本专利技术采用有效且高效的框架感知特定团体,通过三层过滤机制对未知用户进行探测,识别其是否归属于特定团体,可对待探测用户列表的重复项进行去重操作,减少信息的冗余程度。【专利说明】社会网络在线特定团体感知方法及系统
本专利技术涉及网络与信息安全
,尤其涉及一种社会网络在线特定团体感知方法及系统。
技术介绍
社会网络分析技术是信息安全和社会网络领域中的核心技术。其主要任务是以社会网络中的个人、群体、事件等不同维度进行多角度分析。社会媒体的内部结构称为社会网络。社会网络最初起源于1934年美国社会心理学家Moreno对小群体使用计量学的方法进行的实验研究。哈佛大学的心理学教授StanleyMilgram在1967年创立了六度分割理论,其主要思想是在网络上随机抽取的两个人之间所间隔的人不会超过六个,通过这个理论每一个人物的社交范围都会不断地被放大并形成大型的网络。70年代,社会网络研究逐渐成为一个新兴的社会学专业,近年来社交网络的相关研究也成为计算机科学领域的一个研究热点。2011年2月,著名的IT风险投资人约翰?杜尔提出一个新兴概念ZSoLoMo”。So(Social,社交);Lo (Local,本地位置);Mo (Mobile,移动)。在此之后,SoLoMo被一致认为是互联网未来发展趋势,SoLoMo的概念风靡全世界。随着社会网络的发展,截止到2013年I月,Facebook、Twitter、新浪微博和腾讯微博的用户数分别突破了 12亿、5亿、5亿和6亿。与此同时,社会网络也产生了大量的用户生成内容(User Generated Content,UGC)信息,这些UGC信息在社会网络上呈病毒式信息扩散,而且传播速度呈指数性增长。网络团体结构是现实世界中`复杂网络最普遍和最重要的拓扑属性之一。具有团体内节点相互连接紧密,而团体间相互连接稀疏的特点。揭示复杂网络的团体结构对分析网络拓扑结构、理解其功能、发现其隐含模式、预测其行为都具有十分重要的理论意义和应用价值,在科学研究、计算机科学、社会、生物和互联网等领域中具有广泛应用。然而,在团体发现研究领域中,往往分析人员很难在线获取到特定团体的所属成员,现在还没有一种非常有效的社会网络的在线团体感知方法。
技术实现思路
(一)要解决的技术问题本专利技术要解决的技术问题是:如何提供一种社会网络在线特定团体感知方法及系统,以快速、有效地对真实社会媒体上的真实用户信息进行获取,同时依据三层过滤机制在线的将属于特定团体的用户节点识别检测出来。(二)技术方案为解决上述问题,本专利技术一方面提供一种社会网络在线特定团体感知方法,包括步骤:S1.根据待感知团体的特征,得到描述该团体的关键词列表;S2.选取若干符合团体特征的用户节点,并将其加入团体;S3.依次取出已确定为团体内部的用户节点;S4.遍历团体内部的用户节点,若遍历完成则进入S5,否则进入S6;S5.系统运行结束;S6.通过从团体中提取的用户节点ID获取其好友ID列表;S7.遍历好友ID列表,若遍历完成则返回S3,否则进入步骤S8 ;S8.从好友列表中顺序取出好友ID ;S9.通过好友ID获取用户个人属性信息;S10.判断所述好友个人属性信息中是否包含描述团体的关键词,若个人属性中包含团体关键词则更新团体关键词列表并进入步骤S11,否则进入步骤S12 ;Sll.将已确定为属于待探测团体的用户节点加入团体集合,并进入步骤S5 ;S12.通过所述好友ID获取用户行为属性信息;S13.将所述好友发布的文本信息与团体内部全部节点的文本集合做相似度对比,若相似度大于预设的阈值则进入步骤S11,否则进入步骤S14 ;S14.通过所述好友ID获取用户关系属性信息;S15.计算所述好友的个人聚集系数与团体的聚集系数,若个人聚集系数大于团体聚集系数,则进入步骤SI I,否则进入步骤S7。优选地,步骤SI中,所述团体的关键词列表是指描述待感知团体特征的词语列表。优选地,所述若干符合团体特征的用户节点是指待探测用户与团体内的用户集合具有相似的特征,与团体具有相关联性。优选地,步骤S6中,所述好友ID列表通过开放接口或者通过解析网络的基本信息页面结构获取。优选地,步骤S9中,所述用户个人属性信息包括用户名、用户描述、e-mail。优选地,步骤SlO中,所述个人属性信息中是否包含团体关键词是指将用户基本信息通过KMP快速字符串匹配与团体关键词进行对比,挖掘用户与团体相关性的强特征。优选地,文本相似度对比是指将用户历史文本信息分词,获得一个基于词的用户向量,并与团体中用户集合的向量进行余弦计算。优选地,所述个人聚集系数是指用户与团体内部节点实际产生连接数与理论相互连接数的比值。所述团体聚集系数是指包含在团体内部的全部用户聚集系数的平均值。另一方面,本专利技术还提供一种社会网络在线特定团体感知系统,包括:用户信息获取模块,用于获取检测用户的基本属性;属性特征过滤模块,用于判断用户是否包含团体关键词,将符合这一强特征的用户从背景数据中提取出来,并加入待探测团体;行为特征过滤模块,用于判断用户的历史性行为是否符合团体内用户节点的普遍行为特征;关系特征过滤模块,用于判断用户与团体的关联性是否达到团体内用户之间的平均连通性;重复项识别模块,用于将好友列表与所述团体内用户列表进行对比,判断两个列表中是否含有重复项,若不含有,则从好友列表顺序取出节点,若含有,则将好友列表去除重复项后再执行遍历操作。优选地,所述用户的基本属性息包括:用户ID、用户昵称、用户描述、发布文本ID、发布文本内容、用户关系。(三)有益效果本专利技术的方法采用了一个有效且高效的框架感知特定团体,设计了一种三层过滤机制对未知用户进行探测,识别其是否归属于特定团体,同时可以对待探测用户列表的重复项进行去重操作,减少信息的冗余程度,该方法及系统有效、快速、并具有较好的可扩展性。【专利附图】【附图说明】图1为依照本专利技术实施例的社会网络在线感知特定团体方法流程示意图。【具体实施方式】下面结合附图和实施例,对本专利技术的【具体实施方式】作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。本专利技术在社会网络的大量用户信息观察和分析基础之上,总结出社会网络的特定团体在线感知方法,并创新性的采用了基于用户个人信息、用户发布信息、用户关系信息的三层过滤机制对用户进行检测,确保了划分团体的准确性。如图1所示,依照本专利技术一种实施方式的社会网络的特定团体感知方法包括:S1.根据待感知团体的特征,获取一个可以描述该团体的关键词列表;S2.选取若干已知属于待探测团体的用户节点,并将其加入团体,所述团本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:薛一波姜京池易成岐
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1