基于接触概率的信息传播模型实现方法及装置制造方法及图纸

技术编号:21225827 阅读:37 留言:0更新日期:2019-05-29 06:35
本发明专利技术公开了一种基于接触概率的信息传播模型实现方法及装置,所述方法包括:将微博用户节点划分为四类节点,其中,所述四类节点具体包括:从未接触过信息的S节点、接触到信息但还未转发的C节点、接触到信息决定转发使自己具备传播能力的I节点、以及接触到信息选择忽略的R节点;确定所述四类节点之间的状态转换规则,并基于所述状态转换规则确定信息传播模型。

Realization Method and Device of Information Communication Model Based on Contact Probability

The invention discloses an information dissemination model implementation method and device based on contact probability. The method includes: dividing microblog user nodes into four kinds of nodes, which include: S nodes that have never touched information, C nodes that have touched information but have not yet forwarded, I nodes that have decided to forward information to enable themselves to disseminate information, and connection. It touches R nodes which are ignored by information selection, determines the state transition rules among the four types of nodes, and determines the information propagation model based on the state transition rules.

【技术实现步骤摘要】
基于接触概率的信息传播模型实现方法及装置
本专利技术涉及社交网络大数据分析领域,尤其涉及一种基于接触概率的信息传播模型实现方法及装置。
技术介绍
传统的SIR模型中,S节点代表易感染节点,I节点代表感染节点,R节点代表免疫节点;在疾病的传播过程中,S节点一定的概率变为I节点,而I节点以一定的概率变为R节点,最终所有节点都成为R节点,达到稳态。社交网络信息的传播过程与传染病有很多类似的地方,可用SIR模型来对信息传播过程建模,其中S节点代表未接触信息的节点,I节点代表收到信息然后进行转发节点,R节点代表收到信息但忽略的节点。微博传播态势预测本质上是建立微博传播模型的问题。其中与本专利技术工作最接近的是FeiXiong等人和王金龙等人的工作。在FeiXiong等人的研究中,提出了一种基于传染病模型的在线社交媒体信息传播模型SCIR,该模型在SIR模型基础上增加了接触状态C,并重新定义了各状态之间转换的逻辑关系。王金龙等人同样是对SIR模型进行了优化,但并没有增加新的节点状态,而是重新定义了健康节点被感染的概率计算方法,从固定的概率值优化为基于感染节点和易感节点影响力的函数。上述两种模型都有效地刻画了信息在社交网络中传播过程和态势,但仍然存在几个不足:(1)现有模型中各状态的转换逻辑关系与微博传播过程中状态的转变过程不一致,最典型的就是在微博网络传播过程中感染用户(转发节点)不会变为免疫节点(忽略节点);(2)既有的传播模型中相关的状态转化概率没有体现节点属性的不同,在实际传播过程中微博被转发的概率差别很大,与用户节点的属性关系极大;(3)现有模型忽略了随着信息的传播,消息对用户的新颖性会逐渐下降的情况。以上三方面的问题均会导致微博传播态势预测产生偏差。
技术实现思路
本专利技术实施例提供一种基于接触概率的信息传播模型实现方法及装置,用以解决现有技术中的上述问题。本专利技术实施例提供一种基于接触概率的信息传播模型实现方法,包括:将微博用户节点划分为四类节点,其中,所述四类节点具体包括:从未接触过信息的S节点、接触到信息但还未转发的C节点、接触到信息决定转发使自己具备传播能力的I节点、以及接触到信息选择忽略的R节点;确定所述四类节点之间的状态转换规则,并基于所述状态转换规则确定信息传播模型。优选地,所述状态转换规则具体包括:在最初微博未进行传播时,所有的微博用户节点均为S节点,当其中一个微博用户节点发布了微博后,该微博用户节点变为I节点;与I节点相连的S节点以概率α看到微博变为C节点;如果没有变为C节点,则对I节点和S节点连接的边进行标记,每条边只有一次机会来试图让S节点看到微博;C节点以概率β转发微博,成为I节点;C节点以概率1-β忽略微博,成为R节点;与I节点相连的R节点虽然最初选择了忽略微博,但当相邻的邻居很多都变为I节点之后,以概率γ对微博进行了转发,成为I节点。优选地,基于所述状态转换规则确定信息传播模型具体包括:基于公式1确定信息传播模型:其中,S(t)表示t时刻S节点占总节点的比例,C(t)为t时刻C节点比例,I(t)代表t时刻I节点的比例,R(t)代表t时刻R节点的比例,其中,S(t)+C(t)+R(t)+I(t)=1;初始情况下S(t)=1,C(t)=0,R(t)=0;I(t)=0,参数α表示与I节点相连的S节点能够看到信息的概率,β表示C节点转发微博的概率,γ表示与I节点相连的R节点重新对信息进行转发的概率。优选地,所述参数α根据公式2进行计算:其中,p为在微博平台上微博可被相关用户能够看到的平均概率,Deg(u)表示用户u的等级,Deg_Avg为所有用户等级的平均值;Fol(u)表示用户u关注账户数的多少,Fol_Avg表示所有用户关注数的平均值。优选地,所述参数β根据公式3进行计算:其中,h为微博的相对热度,Hot(w)表示微博内容w的热度,H_Avg表示微博的平均热度,Fen(u)表示用户u的粉丝数,Fen_avg表示所有用户的粉丝数的平均值,q为平均的转发概率,Deg(u)表示用户u的等级,Deg_Avg为所有用户等级的平均值。优选地,所述参数γ根据公式4进行计算:γ=log(CountI(u))×0.01公式4;其中,CountI(u)表示用户u关注的用户中I类节点的个数。优选地,所述方法进一步包括:设置并计算老化因子,并根据所述老化因子计算老化后的参数α、参数β、以及参数γ;每一轮迭代之后,基于老化后的参数α、参数β、以及参数γ重新确定信息传播模型。优选地,计算老化因子具体包括:根据公式5计算老化因子θ:其中,H_Avg表示各微博内容的平均热度,为一个常数,Hot(w)表示微博w的热度。优选地,根据所述老化因子计算老化后的参数α、参数β、以及参数γ具体包括:根据公式6计算老化后的参数α、参数β、以及参数γ:本专利技术实施例还提供一种基于接触概率的信息传播模型实现装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述方法的步骤。采用本专利技术实施例,提供了一种基于用户属性的微博信息传播模型,即UA-SCIR(UserAttribute-SCIR)模型,在经典SIR模型基础上进行改进,本专利技术实施例的技术方案更加符合微博这类消息传播的实际情况,能够更好地实现微博传播的态势预测。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例中基于接触概率的信息传播模型实现方法的处理流程图;图2是本专利技术实施例中UA-SCIR模型阶段不同状态转换图。具体实施方式本专利技术实施例在传统SIR模型的基础上,提出了基于用户属性的微博信息传播模型,即UA-SCIR(UserAttribute-SCIR)模型,相对于经典的SIR模型,UA-SCIR模型在原有的传染病模型增加了接触节点(C节点),解决未接触微博的用户因看不到微博消息而变成忽略用户的问题;根据微博传播的实际情况重新定义不同节点间转换的规则;基于用户属性定义状态间转换的概率,包括用户看到微博的概率、转发微博的概率、忽略微博的概率和忽略后再次转发的概率。UA-SCIR模型相对于经典SIR模型更加符合微博这种消息传播的实际情况。下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例的技术方案在传统SIR模型的基础上,提出了基于用户属性的微博信息传播模型,即UA-SCIR(UserAttribute-SCIR)模型,UA-SCIR模型在经典的SIR上进行了三点改进:(1)增加了接触节点(C节点)。经过对微博传播过程的分析本文档来自技高网
...

【技术保护点】
1.一种基于接触概率的信息传播模型实现方法,其特征在于,包括:将微博用户节点划分为四类节点,其中,所述四类节点具体包括:从未接触过信息的S节点、接触到信息但还未转发的C节点、接触到信息决定转发使自己具备传播能力的I节点、以及接触到信息选择忽略的R节点;确定所述四类节点之间的状态转换规则,并基于所述状态转换规则确定信息传播模型。

【技术特征摘要】
1.一种基于接触概率的信息传播模型实现方法,其特征在于,包括:将微博用户节点划分为四类节点,其中,所述四类节点具体包括:从未接触过信息的S节点、接触到信息但还未转发的C节点、接触到信息决定转发使自己具备传播能力的I节点、以及接触到信息选择忽略的R节点;确定所述四类节点之间的状态转换规则,并基于所述状态转换规则确定信息传播模型。2.如权利要求1所述的方法,其特征在于,所述状态转换规则具体包括:在最初微博未进行传播时,所有的微博用户节点均为S节点,当其中一个微博用户节点发布了微博后,该微博用户节点变为I节点;与I节点相连的S节点以概率α看到微博变为C节点;如果没有变为C节点,则对I节点和S节点连接的边进行标记,每条边只有一次机会来试图让S节点看到微博;C节点以概率β转发微博,成为I节点;C节点以概率1-β忽略微博,成为R节点;与I节点相连的R节点虽然最初选择了忽略微博,但当相邻的邻居很多都变为I节点之后,以概率γ对微博进行了转发,成为I节点。3.如权利要求1所述的方法,其特征在于,基于所述状态转换规则确定信息传播模型具体包括:基于公式1确定信息传播模型:其中,S(t)表示t时刻S节点占总节点的比例,C(t)为t时刻C节点比例,I(t)代表t时刻I节点的比例,R(t)代表t时刻R节点的比例,其中,S(t)+C(t)+R(t)+I(t)=1;初始情况下S(t)=1,C(t)=0,R(t)=0;I(t)=0,参数α表示与I节点相连的S节点能够看到信息的概率,β表示C节点转发微博的概率,γ表示与I节点相连的R节点重新对信息进行转发的概率。4.如权利要求3所述的方法,其特征在于,所述参数α根据公式2进行计算:其中,p为在微博平台上微博可被...

【专利技术属性】
技术研发人员:朱海龙马秉楠陈苏
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1