The invention discloses an information dissemination model implementation method and device based on contact probability. The method includes: dividing microblog user nodes into four kinds of nodes, which include: S nodes that have never touched information, C nodes that have touched information but have not yet forwarded, I nodes that have decided to forward information to enable themselves to disseminate information, and connection. It touches R nodes which are ignored by information selection, determines the state transition rules among the four types of nodes, and determines the information propagation model based on the state transition rules.
【技术实现步骤摘要】
基于接触概率的信息传播模型实现方法及装置
本专利技术涉及社交网络大数据分析领域,尤其涉及一种基于接触概率的信息传播模型实现方法及装置。
技术介绍
传统的SIR模型中,S节点代表易感染节点,I节点代表感染节点,R节点代表免疫节点;在疾病的传播过程中,S节点一定的概率变为I节点,而I节点以一定的概率变为R节点,最终所有节点都成为R节点,达到稳态。社交网络信息的传播过程与传染病有很多类似的地方,可用SIR模型来对信息传播过程建模,其中S节点代表未接触信息的节点,I节点代表收到信息然后进行转发节点,R节点代表收到信息但忽略的节点。微博传播态势预测本质上是建立微博传播模型的问题。其中与本专利技术工作最接近的是FeiXiong等人和王金龙等人的工作。在FeiXiong等人的研究中,提出了一种基于传染病模型的在线社交媒体信息传播模型SCIR,该模型在SIR模型基础上增加了接触状态C,并重新定义了各状态之间转换的逻辑关系。王金龙等人同样是对SIR模型进行了优化,但并没有增加新的节点状态,而是重新定义了健康节点被感染的概率计算方法,从固定的概率值优化为基于感染节点和易感节点影响力的函数。上述两种模型都有效地刻画了信息在社交网络中传播过程和态势,但仍然存在几个不足:(1)现有模型中各状态的转换逻辑关系与微博传播过程中状态的转变过程不一致,最典型的就是在微博网络传播过程中感染用户(转发节点)不会变为免疫节点(忽略节点);(2)既有的传播模型中相关的状态转化概率没有体现节点属性的不同,在实际传播过程中微博被转发的概率差别很大,与用户节点的属性关系极大;(3)现有模型忽略了随着信息 ...
【技术保护点】
1.一种基于接触概率的信息传播模型实现方法,其特征在于,包括:将微博用户节点划分为四类节点,其中,所述四类节点具体包括:从未接触过信息的S节点、接触到信息但还未转发的C节点、接触到信息决定转发使自己具备传播能力的I节点、以及接触到信息选择忽略的R节点;确定所述四类节点之间的状态转换规则,并基于所述状态转换规则确定信息传播模型。
【技术特征摘要】
1.一种基于接触概率的信息传播模型实现方法,其特征在于,包括:将微博用户节点划分为四类节点,其中,所述四类节点具体包括:从未接触过信息的S节点、接触到信息但还未转发的C节点、接触到信息决定转发使自己具备传播能力的I节点、以及接触到信息选择忽略的R节点;确定所述四类节点之间的状态转换规则,并基于所述状态转换规则确定信息传播模型。2.如权利要求1所述的方法,其特征在于,所述状态转换规则具体包括:在最初微博未进行传播时,所有的微博用户节点均为S节点,当其中一个微博用户节点发布了微博后,该微博用户节点变为I节点;与I节点相连的S节点以概率α看到微博变为C节点;如果没有变为C节点,则对I节点和S节点连接的边进行标记,每条边只有一次机会来试图让S节点看到微博;C节点以概率β转发微博,成为I节点;C节点以概率1-β忽略微博,成为R节点;与I节点相连的R节点虽然最初选择了忽略微博,但当相邻的邻居很多都变为I节点之后,以概率γ对微博进行了转发,成为I节点。3.如权利要求1所述的方法,其特征在于,基于所述状态转换规则确定信息传播模型具体包括:基于公式1确定信息传播模型:其中,S(t)表示t时刻S节点占总节点的比例,C(t)为t时刻C节点比例,I(t)代表t时刻I节点的比例,R(t)代表t时刻R节点的比例,其中,S(t)+C(t)+R(t)+I(t)=1;初始情况下S(t)=1,C(t)=0,R(t)=0;I(t)=0,参数α表示与I节点相连的S节点能够看到信息的概率,β表示C节点转发微博的概率,γ表示与I节点相连的R节点重新对信息进行转发的概率。4.如权利要求3所述的方法,其特征在于,所述参数α根据公式2进行计算:其中,p为在微博平台上微博可被...
【专利技术属性】
技术研发人员:朱海龙,马秉楠,陈苏,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。