一种社交数据采集方法及装置制造方法及图纸

技术编号:34490301 阅读:24 留言:0更新日期:2022-08-10 09:08
本发明专利技术公开一种社交数据采集方法及装置,通过获取待观察的主社区中所有第一社交账号的关系型数据和与主社区对应的特征词语组集合,并根据关系型数据获取与每一第一社交账号对应的第二社交账号生成对应的子社区,再获取子社区中第二社交账号的信息生成特征词语组,通过特征词语组与特征词语组集合之间的关系判断第二社交账号与主社区之间的关系,即能够追踪到当前时间段内与主社区群体事件相关的第二社交账号,并将第二社交账号加入主社区内进行监测,从而能够有效的将群体事件的参与者们进行关联并采集对应的事件信息;并且将第二社交账号加入主社区,还实现对主社区的动态扩展,从而实现对群体事件发展的动态监控。从而实现对群体事件发展的动态监控。从而实现对群体事件发展的动态监控。

【技术实现步骤摘要】
一种社交数据采集方法及装置


[0001]本专利技术涉及数据采集领域,特别是涉及一种社交数据采集方法及装置。

技术介绍

[0002]随着移动通讯技术的飞速发展,社交网络平台由于具有开放性、共享性和互动性的特点以及丰富多彩、方便实用的应用形式使其日益成为反映社情民意的重要手段,因而社交网络平台上的热点也层出不穷。但网络和群体性事件的结合增加了热点事件更多的不稳定性、辐射性和危害性。特别是针对近年来频发的网络群体性事件,有必要趋利避害,实时掌握事件话题演变方向,才能及时的采取应对措施,更好的让社会生态向有序健康的方向发展。
[0003]而网络群体性事件的发展通常遵循潜伏和酝酿、爆发、高潮、平息和善后这几个必经阶段。因此,研究事件发生机理和规律可以为此类事件的有效应对做好准备。但是网络具有匿名性、交互性、低成本操作以及参与的平等性等特性,导致社交网络中群体行为的观察在技术层面上存在各种各样需要解决的技术障碍。
[0004]如从管理者角度来看待群体事件:监测分布式社交网络中每个参与者的行为是一件很困难的事情。特别是当群体性事件的参与者范围本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种社交数据采集方法,其特征在于,包括步骤:获取待观察的主社区中所有第一社交账号的关系型数据;获取所述主社区对应的特征词语组集合;根据所述关系型数据获取与每一所述第一社交账号对应的第二社交账号,根据所述第二社交账号生成与所述第一社交账号对应的子社区;获取所述子社区中所有所述第二社交账号的信息;根据所述第二社交账号的信息生成与所述第二社交账号一一对应的特征词语组;判断所述特征词语组与所述特征词语组集合是否有交集,若是,则将所述特征词语组对应的第二社交账号加入所述主社区。2.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述获取所述主社区对应的特征词语组集合包括:获取所述主社区中所有所述第一社交账号的文本数据;根据所述文本数据生成与每一所述第一社交账号对应的特征词语组,并生成与所述主社区对应的特征词语组集合。3.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述获取所述主社区对应的特征词语组集合包括:设置预监测的文本数据;根据所述预监测的文本数据生成与所述主社区对应的特征词语组集合。4.根据权利要求2或3所述的一种社交数据采集方法,其特征在于,所述生成与所述主社区对应的特征词语组集合包括:清洗所述文本数据,得到所述文本数据的主干语段;抽取所述主干语段中的关键词;标注所述关键词,得到关键词集合;通过加权计数计算所述关键词集合的热度排名,得到所述特征词语组集合。5.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述根据所述关系型数据获取与每一所述第一社交账号对应的第...

【专利技术属性】
技术研发人员:吴春萍王静陈强林志扬李火泉
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1