用于在线社交网络数据挖掘模型数值机理有效性验证方法技术

技术编号:20425281 阅读:17 留言:0更新日期:2019-02-23 08:32
本发明专利技术提出了一种用于在线社交网络数据挖掘模型数值机理有效性验证方法,包括如下步骤:S1,获取在线社交网络数据,形成概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成概率模型的数据趋势,并发送到远程终端;S2,对于在线社交网络数据进行传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。

【技术实现步骤摘要】
用于在线社交网络数据挖掘模型数值机理有效性验证方法
本专利技术涉及大数据分析领域,尤其涉及一种用于在线社交网络数据挖掘模型数值机理有效性验证方法。
技术介绍
随着移动互联网的发展、5G时代的来临,在线社交网络越来越流行,人们的日常工作和生活已经离不开这些社交网络,随之产生的大量信息也充斥着网络,无论是谣言还是商品广告信息等都会在网络上蔓延,因而了解信息背后的传播机理能够帮助人们更好地管理和控制网络上信息的传播。在线社交网络上的信息传播在诸多因素的影响下进行演化,既包括传播速度和扩散范围的演化也包括信息自身内容的演化。影响因素有很多,但归结起来不外乎信息自身特征、传播信息的网络用户的特征与行为、承载信息传播的社交网络的拓扑结构,以及信息传播的宏观环境。此外,社交媒体上信息传播有时还受到社会媒体服务所提供的信息推送功能的影响,比如Facebook的NewsFeed、新浪微博的即时推、腾讯视频的消息推荐等。这几个方面是在线社交网络中信息传播的关键因素,它们共同决定了信息传播与演化的行为与模式。基于传染病的多信息建模方法是从用户的角度出发,认为用户以一定概率传播事件信息,传染病模型是信息传播领域公认比较成熟的模型,传统模型有SI、SIR、SIS,其中SIR模型是将人群分为易感者S状态、感染者I状态和治愈者R状态,信息从感染者传到易感者,易感者收到信息并成功转发后,自身转变为治愈者,完成个体状态的转换,直至系统达到一种稳定态。SIS和SIR模型产生了很多变体,如SIRS、SIDR和SAIR。但是这些模型均无法反映S状态节点转化为I状态节点之前有一个潜伏期的事实,为此将潜伏状态引入SIR模型,产生了SEIR模型。在此基础上,为了刻画信息传播中广泛存在的点到群的传播模式,提出了e-SEIR模型。随着研究工作的不断深入,传染病模型在许多实际应用领域得到了进一步的发展,例如,研究新产品在社交网络中扩散的Bass-SIR模型,恢复时间是幂律分布的SIR生命动力学模型,基于情感交流的HIT-SCIR模型和具有两个时滞和垂直转移的SEIRS模型。当模型建立之后其工作的效率高低始终无法进行有效的验证,对于相应模型的稳定性无法预知其工作效率,这就亟需本领域技术人员解决相应的技术问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种用于在线社交网络数据挖掘模型数值机理有效性验证方法。为了实现本专利技术的上述目的,本专利技术提供了一种用于在线社交网络数据挖掘模型数值机理有效性验证方法,包括如下步骤:S1,获取在线社交网络数据,形成概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成概率模型的数据趋势,并发送到远程终端;S2,对于在线社交网络数据进行传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。所述的用于在线社交网络数据挖掘模型数值机理有效性验证方法,优选的,所述S1包括:S1-1,根据转移概率矩阵P,考虑某个S状态节点同时存在na个IA状态、nb个IB状态的邻居节点,则以λ1为横轴、λ2为纵轴,以S状态节点成功接收到某一类型信息导致状态转移的概率为竖轴,绘制了S状态节点转移概率随λ1,λ2,na,nb的变化关系图;S1-2,转移概率随λ1,λ2的增加呈线性增长,随na,nb的增加呈指数快速增长,当λ1>λ2时,节点向IA状态转移,反之,向IB状态转移,在na=10,nb=2情形下,S状态节点向IA状态转移的概率很快达到1,当节点只接触到某一种信息,即λ1=0或λ2=0时,节点只向接触到的这种类型信息的节点状态转变;S1-3,节点在信息竞争中向对方状态转移的概率随θ1,θ2的增加呈线性增长,随na,nb的增加呈指数快速增长,在na=10,nb=2情形下,竞争使节点转移到IA状态的概率远高于转移到IB状态的概率,当在线社交网络数据信息中一类数据信息占有绝对优势时,信息竞争行为消失,即θ1=0或θ2=0,传播节点将快速向某一种状态单方向转化,整个网络舆论迅速统一。所述的用于在线社交网络数据挖掘模型数值机理有效性验证方法,优选的,所述S2包括:S2-1,根据传播模型所提取的在线社交网络数据,度k的分布服从幂律分布P(k)~αk-γ,γ为常量,无标度网络的平均路径长度较小,聚类系数也较小;S2-2,在整个传播过程中,节点的状态不断改变,每一时刻节点处于某一状态,那么不同的状态在往下一状态转化时其处理过程是不同的;S2-3,当节点当前状态为未传播任何信息的S状态时,节点在某一时刻接收不到任何信息,那么节点状态保持不变;当只接收到某一类型的信息,然后以一定的传播概率进行传播,当同时接收到两类信息。所述的用于在线社交网络数据挖掘模型数值机理有效性验证方法,优选的,所述S2-2包括:S2-A,对于在线社交网络数据选取未传播任何信息节点的S状态的节点i,收集在线社交网络数据节点i收到A信息并积极传播的节点的IA网络状态的邻居节点数量IANum,同时收集在线社交网络数据节点i收到B信息并积极传播的节点的IB网络状态的邻居节点数量IBNum,收集完毕IAnum和IBnum之后,计算未传播任何信息节点的S状态向IA状态转换的转移概率和未传播任何信息节点的S状态向IB状态转换的转移概率然后生成原始随机数Prand∈(0,1),将转移概率和进行比较;S2-B,当时执行Prand和比较步骤,如果则在线网络数据节点i转化为IA状态,如果则在线网络数据节点i不发生变化;S2-C,当时执行Prand和比较步骤,如果则在线网络数据节点i转化为IB状态,如果则在线网络数据节点i不发生变化;S2-D,当时,读取在线社交网络数据信息偏好权重系数η,执行和比较步骤,如果则执行Prand和比较步骤,如果则在线网络数据节点i转化为IA状态,如果则在线网络数据节点i不发生变化;S2-E,如果则执行Prand和比较步骤,如果则在线网络数据节点i转化为IB状态,如果则在线网络数据节点i不发生变化。所述的用于在线社交网络数据挖掘模型数值机理有效性验证方法,优选的,所述S2-3包括:S2-F,当只接收到信息A时,S2-G,当只接收到信息B时,S2-H,当同时接收到A信息和B信息两类信息时,需要更进一步的判断处理,对两类信息的传播可能性进行比较。所述的用于在线社交网络数据挖掘模型数值机理有效性验证方法,优选的,所述S2还包括:S2-4,当节点当前状态为传播A信息的IA状态时,该节点有一定的遗弃率转化为R状态,同时还以一定的概率被B信息所取代而转化为IB状态;S2-5,首先选取IA状态的在线社交网络数据节点i,生成第一随机数Prand1∈(0,1),判断是否Prand1<δ1,如果是,则执行在线社交网络数据节点i转化为所有信息持抵制态度的遗弃状态节点的R状态,如果否,则统计在线社交网络数据节点i的IB状态的邻居节点数量IBNum,计算IA向IB转换的转移概率生成第二随机数Prand2∈(0,1),判断是否如果是,则执行在线社交网络数据节点i转化为IB状态,如果否,则执行在线社交网络数据节点i保持不变。其中,δ1表示对A信息的遗弃率本文档来自技高网
...

【技术保护点】
1.一种用于在线社交网络数据挖掘模型数值机理有效性验证方法,其特征在于,包括如下步骤:S1,获取在线社交网络数据,形成概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成概率模型的数据趋势,并发送到远程终端;S2,对于在线社交网络数据进行传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。

【技术特征摘要】
1.一种用于在线社交网络数据挖掘模型数值机理有效性验证方法,其特征在于,包括如下步骤:S1,获取在线社交网络数据,形成概率模型进行数据抽取,对于抽取后的网络数据进行数据模拟,形成概率模型的数据趋势,并发送到远程终端;S2,对于在线社交网络数据进行传播模型提取,通过对不同在线社交网络数据状态的转化规律的分析之后,设定相应数据提取的判断阈值,从而预先判断在线社交网络数据的发展趋势,并将该在线社交网络数据发展趋势进行远程展示。2.根据权利要求1所述的用于在线社交网络数据挖掘模型数值机理有效性验证方法,其特征在于,所述S1包括:S1-1,根据转移概率矩阵P,考虑某个S状态节点同时存在na个IA状态、nb个IB状态的邻居节点,则以λ1为横轴、λ2为纵轴,以S状态节点成功接收到某一类型信息导致状态转移的概率为竖轴,绘制了S状态节点转移概率随λ1,λ2,na,nb的变化关系图;S1-2,转移概率随λ1,λ2的增加呈线性增长,随na,nb的增加呈指数快速增长,当λ1>λ2时,节点向IA状态转移,反之,向IB状态转移,在na=10,nb=2情形下,S状态节点向IA状态转移的概率很快达到1,当节点只接触到某一种信息,即λ1=0或λ2=0时,节点只向接触到的这种类型信息的节点状态转变;S1-3,节点在信息竞争中向对方状态转移的概率随θ1,θ2的增加呈线性增长,随na,nb的增加呈指数快速增长,在na=10,nb=2情形下,竞争使节点转移到IA状态的概率远高于转移到IB状态的概率,当在线社交网络数据信息中一类数据信息占有绝对优势时,信息竞争行为消失,即θ1=0或θ2=0,传播节点将快速向某一种状态单方向转化,整个网络舆论迅速统一。3.根据权利要求1所述的用于在线社交网络数据挖掘模型数值机理有效性验证方法,其特征在于,所述S2包括:S2-1,根据传播模型所提取的在线社交网络数据,度k的分布服从幂律分布P(k)~αk-γ,γ为常量,无标度网络的平均路径长度较小,聚类系数也较小;S2-2,在整个传播过程中,节点的状态不断改变,每一时刻节点处于某一状态,那么不同的状态在往下一状态转化时其处理过程是不同的;S2-3,当节点当前状态为未传播任何信息的S状态时,节点在某一时刻接收不到任何信息,那么节点状态保持不变;当只接收到某一类型的信息,然后以一定的传播概率进行传播,当同时接收到两类信息。4.根据权利要求3所述的用于在线社交网络数据挖掘模型数值机理有效性验证方法,其特征在于,所述S2-2包括:S2-A,对于在线社交网络数据选取未传播任何信息节点的S状态的节点i,收集在线社交网络数据节点i收到A信息并积极传播的节点的IA网络状态的邻居节点数量IANum,同时收集在线社交网络数据节点i收到B信息并积极传播的节点的IB网络状态的邻居节点数量IBNum,收集完毕IAnum和IBnum之后,计算未传播任何信息节点的S状态向IA状态转换的转移概率和未传播任何信息节点的S状态向IB状态转换的转移概率然后生成原始随机数Prand∈(0,1),将转移概率和进行比较;S2-B,当时执行Prand和比较步骤,如果则在线网络数据节点i转化为IA状态,如果则在线网络数据节点i不发生变化;S2-C,当时执行Prand和比较步骤,如果则在线网络数据节点i转化为IB状态,如果则在线网络数据节点i不发生变化;S2-D,当时,读取在线社交网络数据信息偏好权重系数η,执行和比较步骤,如果则执行Prand和比较步骤,如果则在线网络数据节点i转化为IA状态,如果则在线网络数据节点i不发生变化;S2-E,如果则执行Prand和比较步骤,如果则在线网络数据节点i转化为IB状态,如果则在线网络数据节点i不发生变化。5.根据权利要求3所述的用于在线社交网络数据挖掘模型...

【专利技术属性】
技术研发人员:刘小洋何道兵
申请(专利权)人:重庆理工大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1