【技术实现步骤摘要】
一种社交数据采集方法及装置
[0001]本专利技术涉及数据采集领域,特别是涉及一种社交数据采集方法及装置。
技术介绍
[0002]随着移动通讯技术的飞速发展,社交网络平台由于具有开放性、共享性和互动性的特点以及丰富多彩、方便实用的应用形式使其日益成为反映社情民意的重要手段,因而社交网络平台上的热点也层出不穷。但网络和群体性事件的结合增加了热点事件更多的不稳定性、辐射性和危害性。特别是针对近年来频发的网络群体性事件,有必要趋利避害,实时掌握事件话题演变方向,才能及时的采取应对措施,更好的让社会生态向有序健康的方向发展。
[0003]而网络群体性事件的发展通常遵循潜伏和酝酿、爆发、高潮、平息和善后这几个必经阶段。因此,研究事件发生机理和规律可以为此类事件的有效应对做好准备。但是网络具有匿名性、交互性、低成本操作以及参与的平等性等特性,导致社交网络中群体行为的观察在技术层面上存在各种各样需要解决的技术障碍。
[0004]如从管理者角度来看待群体事件:监测分布式社交网络中每个参与者的行为是一件很困难的事情。特别是当群 ...
【技术保护点】
【技术特征摘要】
1.一种社交数据采集方法,其特征在于,包括步骤:获取待观察的主社区中所有第一社交账号的关系型数据;获取所述主社区对应的特征词语组集合;根据所述关系型数据获取与每一所述第一社交账号对应的第二社交账号,根据所述第二社交账号生成与所述第一社交账号对应的子社区;获取所述子社区中所有所述第二社交账号的信息;根据所述第二社交账号的信息生成与所述第二社交账号一一对应的特征词语组;判断所述特征词语组与所述特征词语组集合是否有交集,若是,则将所述特征词语组对应的第二社交账号加入所述主社区。2.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述获取所述主社区对应的特征词语组集合包括:获取所述主社区中所有所述第一社交账号的文本数据;根据所述文本数据生成与每一所述第一社交账号对应的特征词语组,并生成与所述主社区对应的特征词语组集合。3.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述获取所述主社区对应的特征词语组集合包括:设置预监测的文本数据;根据所述预监测的文本数据生成与所述主社区对应的特征词语组集合。4.根据权利要求2或3所述的一种社交数据采集方法,其特征在于,所述生成与所述主社区对应的特征词语组集合包括:清洗所述文本数据,得到所述文本数据的主干语段;抽取所述主干语段中的关键词;标注所述关键词,得到关键词集合;通过加权计数计算所述关键词集合的热度排名,得到所述特征词语组集合。5.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述根据所述关系型数据获取与每一所述第一社交账号对应的第...
【专利技术属性】
技术研发人员:吴春萍,王静,陈强,林志扬,李火泉,
申请(专利权)人:厦门市美亚柏科信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。