一种网络舆情信息传播中关键节点选择方法技术

技术编号:24353775 阅读:21 留言:0更新日期:2020-06-03 02:08
本发明专利技术公开了一种网络舆情信息传播中关键节点选择方法,1)从真实社交网络中采集特定主题下的舆情事件传播流数据;2)采用传染病模型对单一微博消息的传播过程进行建模并且准确估计其传播影响力;3)为了解决用户数量过多算法时间复杂度高的问题,从网络结构特征角度采用一种启发式方法减少种子的数目,并且引入隔离效率的概念,采用贪心算法选取每次仿真过程中隔离效率最高的节点加入关键节点集;4)采用了有向图搜索中的深度优先算法解决了仿真随机性问题,得到了一组信息传播过程中的关键节点集。本发明专利技术在对网络舆情信息传播中关键节点选择过程中综合考虑网络的结构特征和信息传播的动态特征,更贴合实际应用场景。

A method of selecting key nodes in network public opinion information dissemination

【技术实现步骤摘要】
一种网络舆情信息传播中关键节点选择方法
本专利技术涉及社交网络应用
,特别涉及一种网络舆情信息传播中关键节点选择方法。
技术介绍
web2.0时代,在线社交网络发展迅速,用户从单纯的信息受众演变成为有独立影响能力的信息传播主体,社交网络为舆情事件的发展提供了广阔的平台,舆情信息在社交网络的传播呈现出传播速度越来越快,影响越来越大的特点。如何对快速发现有害舆情事件,并且准确评估其发展态势,采用智能化的引导方式疏解舆情代替暴力删帖、五毛党灌水等低效手段,是社会发展中一个关键的研究问题。社交网络中用户数量众多,每个用户对事件的发展演化能够造成不同的影响。与社交网络中意见领袖的发现不同,我们的研究问题是找到一批相对于易于引导的节点,通过改变用户行为以期望取得比较好的整体效果。目前社交网络关键节点选择算法主要可以分为以下几类:1)基于节点属性与网络拓扑结构的节点重要性评估:这类方法利用网络的结构信息,然后基于这些已知的结构信息对节点的重要性进行排序,重要度高的节点被视为关键节点。常用的评估指标有:节点度、介数(通过节点最短路径的几率,反映了节点对其他节点之间联络的控制作用)、聚类系数以及一些中心性指标用于描述节点在社交网络中所处位置的中心程度。2)基于贪心算法的节点影响力最大化评估:影响力最大化问题,已经有大量研究将其形式化定义出来。由于种子节点数目众多,并且组合多样性,已经被证明是一个np-hard问题,基于贪心策略的算法通常在准确性方面都有良好的表现,因此被广泛采用。传播模型上,在传播模型上主要还是使用Kempe等提出的独立级联模型和线性阈值模型。其研究思路为通过模拟信息传播过程,寻找一批能够大量增加参与节点让这些种子节点在预定的传播模型下进行影响力传播,使得传播过程终止时被影响的节点数量达到最大。现在已经存在了许多在社交网络中发现关键节点的工作。现有技术1提出了一种基于节点覆盖范围的社交网络影响力最大化方法,其主要方法包括:首先根据网络拓扑结构计算每个节点的覆盖范围增益,然后根据增益排序选择种子节点,最后从种子节点集合中选择该社交网络影响力最大化节点集合。现有技术2提出了一种基于K壳分解的识别传播关键节点的方法,其方法主要包括:首先,通过采集社交平台的消息转发建立传播网络,把参与转发消息的用户加入节点集合,并且获取节点集合中用户的好友集合,建立节点拓扑图;然后根据节点度计算各个节点的K壳索引作为个体影响力;最后采用Floyd算法计算所述传播网络中每对节点间的最短距离,综合K壳索引以及最短路径排名得到传播网络中的传播关键节点。现有技术3提出了一种基于影响力最大化的社交网络关键节点识别方法,其主要方法包括:首先根据节点度对节点影响力进行初步排序;然后在节点影响力全局稳定之前迭代更新节点影响力;最后根据影响力最大化原则,选取影响力排名靠前的节点作为关键节点。上述社交网络关键节点发现方法的专利技术方案在关键节点选择过程中都只考虑了网络的静态特征,如节点度,k-shell特性等,忽略了社交网络信息传播过程中的节点相互影响的动态过程;其次,采用综合排名的方式导致关键节点的选取多集中在度较大的节点,在发现影响信息传播的中间关键节点方面存在不足。
技术实现思路
本专利技术的目的在于提供一种网络舆情信息传播中关键节点选择方法,以解决上述问题。为实现上述目的,本专利技术采用以下技术方案:一种网络舆情信息传播中关键节点选择方法,其特征在于,包括以下步骤:步骤1,社交网络特定主题舆情事件传播数据流抽取及参与用户关注关系矩阵构建:对某社交网络的主站点以及它的wap站点进行网络请求抓包,分析某社交网络登录过程的网络请求序列,实现爬虫程序自动登录站点;对于获取到的特定主题下的社交网络消息,爬取每条社交网络下的转发内容,转发时间以及转发用户信息,并且获取参与转发用户的用户关注列表以及粉丝列表,根据用户之间发送消息的时序关系以及用户关注关系构建用户关注关系矩阵A=(V,E),其中V表示参与用户,E表示用户之间的关注关系,是用户的出度边;步骤2,事件传播模型构建:使用传染病模型作为基础信息传播模型去建模每条社交网络消息的传播过程,对每条消息i进行影响力βi估计,所有消息的传播过程结合在一起即为事件整体的传播过程;步骤3,事件传播过程中关键节点选择:依据步骤1得到的数据构造用户邻接矩阵A,利用A的结构特征进行启发式搜索,筛选出一批种子节点Q;依据步骤3得到的事件传播模型仿真模拟隔离节点v∈Q之后的信息传播结果,利用贪心算法获得每次迭代结果的最优解,最终得到一组节点序列,将多组节点序列构造成一个有向图,利用深度优先算法遍历得到的有向图,得到最终的关键节点序列。2.根据权利要求1所述的一种网络舆情信息传播中关键节点选择方法,其特征在于,社交网络中的特定主题事件传播流数据包括:社交网络发帖人信息、社交网络内容和社交网络发送时间;社交网络发帖人信息包括用户粉丝数、关注数、粉丝列表、关注列表和用户简介。3.根据权利要求1所述的一种网络舆情信息传播中关键节点选择方法,其特征在于,步骤1社交网络特定主题舆情事件传播数据流抽取及参与用户关注关系矩阵构建,其构建步骤为:第1步:对社交网络的主站点以及社交网络wap站点进行网络请求抓包,分析社交网络登录过程的网络请求序列,模拟登录请求,获取用户Cookie实现爬虫程序自动登录社交网络站点;第2步:模拟登录后,从社交网络搜索入口输入事件关键词,解析搜索结果页HTML得到特定主题下的社交网络消息,内容包括发帖内容、发帖时间、发帖人信息以及转发情况;根据每条社交网络消息的转发,获取转发该条社交网络的用户信息,包含用户粉丝数、关注数、粉丝列表、关注列表和用户简介;第3步:根据每个事件参与用户的粉丝以及关注列表和转发关系,把用户之间的关系强度建模为强关联关系、中等关联关系和弱关联关系三种关联关系,得到一个N*N维的用户关系矩阵A,其中N为参与用户数。4.根据权利要求3所述的一种网络舆情信息传播中关键节点选择方法,其特征在于,1)强关联关系:根据用户转发消息的时间进行构建;如果用户U转发了用户V的消息,认为用户U关注了用户V,则有一条从V指向U的边;2)中等关联关系:用户之间存在关注关系,但是没直接有转发关系;假定用户U关注了用户V,用户V发送事件相关消息的时间比用户U早,即tv<tu;3)弱关联关系:用户之间存在关注关系,但是双方在发贴时序上没有关系;假定用户u关注了用户v,但是用户v发送事件相关消息的时间比用户u晚,即tu<tv;用t*表示用户转发消息的时间。5.根据权利要求1所述的一种网络舆情信息传播中关键节点选择方法,其特征在于,步骤2事件传播模型构建,采用基本传染病SI模型描述每条微博信息的传播,以1min为周期度量传播,利用真实数据集在固定时刻的参与用户数量作为基准去估计一条社交网络消息的影响力Bi,从而构成一个N*1维的用户影响力矩阵&本文档来自技高网
...

【技术保护点】
1.一种网络舆情信息传播中关键节点选择方法,其特征在于,包括以下步骤:/n步骤1,社交网络特定主题舆情事件传播数据流抽取及参与用户关注关系矩阵构建:对某社交网络的主站点以及它的wap站点进行网络请求抓包,分析某社交网络登录过程的网络请求序列,实现爬虫程序自动登录站点;对于获取到的特定主题下的社交网络消息,爬取每条社交网络下的转发内容,转发时间以及转发用户信息,并且获取参与转发用户的用户关注列表以及粉丝列表,根据用户之间发送消息的时序关系以及用户关注关系构建用户关注关系矩阵A=(V,E),其中V表示参与用户,E表示用户之间的关注关系,是用户的出度边;/n步骤2,事件传播模型构建:使用传染病模型作为基础信息传播模型去建模每条社交网络消息的传播过程,对每条消息i进行影响力βi估计,所有消息的传播过程结合在一起即为事件整体的传播过程;/n步骤3,事件传播过程中关键节点选择:依据步骤1得到的数据构造用户邻接矩阵A,利用A的结构特征进行启发式搜索,筛选出一批种子节点Q;依据步骤3得到的事件传播模型仿真模拟隔离节点v∈Q之后的信息传播结果,利用贪心算法获得每次迭代结果的最优解,最终得到一组节点序列,将多组节点序列构造成一个有向图,利用深度优先算法遍历得到的有向图,得到最终的关键节点序列。/n...

【技术特征摘要】
1.一种网络舆情信息传播中关键节点选择方法,其特征在于,包括以下步骤:
步骤1,社交网络特定主题舆情事件传播数据流抽取及参与用户关注关系矩阵构建:对某社交网络的主站点以及它的wap站点进行网络请求抓包,分析某社交网络登录过程的网络请求序列,实现爬虫程序自动登录站点;对于获取到的特定主题下的社交网络消息,爬取每条社交网络下的转发内容,转发时间以及转发用户信息,并且获取参与转发用户的用户关注列表以及粉丝列表,根据用户之间发送消息的时序关系以及用户关注关系构建用户关注关系矩阵A=(V,E),其中V表示参与用户,E表示用户之间的关注关系,是用户的出度边;
步骤2,事件传播模型构建:使用传染病模型作为基础信息传播模型去建模每条社交网络消息的传播过程,对每条消息i进行影响力βi估计,所有消息的传播过程结合在一起即为事件整体的传播过程;
步骤3,事件传播过程中关键节点选择:依据步骤1得到的数据构造用户邻接矩阵A,利用A的结构特征进行启发式搜索,筛选出一批种子节点Q;依据步骤3得到的事件传播模型仿真模拟隔离节点v∈Q之后的信息传播结果,利用贪心算法获得每次迭代结果的最优解,最终得到一组节点序列,将多组节点序列构造成一个有向图,利用深度优先算法遍历得到的有向图,得到最终的关键节点序列。


2.根据权利要求1所述的一种网络舆情信息传播中关键节点选择方法,其特征在于,社交网络中的特定主题事件传播流数据包括:社交网络发帖人信息、社交网络内容和社交网络发送时间;社交网络发帖人信息包括用户粉丝数、关注数、粉丝列表、关注列表和用户简介。


3.根据权利要求1所述的一种网络舆情信息传播中关键节点选择方法,其特征在于,步骤1社交网络特定主题舆情事件传播数据流抽取及参与用户关注关系矩阵构建,其构建步骤为:
第1步:对社交网络的主站点以及社交网络wap站点进行网络请求抓包,分析社交网络登录过程的网络请求序列,模拟登录请求,获取用户Cookie实现爬虫程序自动登录社交网络站点;
第2步:模拟登录后,从社交网络搜索入口输入事件关键词,解析搜索结果页HTML得到特定主题下的社交网络消息,内容包括发帖内容、发帖时间、发帖人信息以及转发情况;根据每条社交网络消息的转发,获取转发该条社交网络的用户信息,包含用户粉丝数、关注数、粉丝列表、关注列表和用户简介;
第3步...

【专利技术属性】
技术研发人员:秦涛南夷非郑庆华罗敏楠王博沈壮
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1