一种改进的RBF神经网络热点话题用户参与行为预测方法技术

技术编号:15330674 阅读:40 留言:0更新日期:2017-05-16 14:05
本发明专利技术请求保护一种改进的RBF神经网络热点话题用户参与行为预测方法,属于计算机网络信息技术分析领域。首先,考虑到神经网络能够对用户行为之间复杂的非线性关系起到良好的拟合效果,并进一步采用RBF(Radical Basis Function,径向基函数)神经网络构建用户参与行为预测模型;其次,由于用户属性与参与行为之间的映射关系具有不确定性,引入云理论(Cloud)对RBF中隐含层的激活函数进行优化;最后,针对用户的参与行为随时间变化的特点,利用时间离散化及时间切片方法,对话题热度进行基于指数函数模型的参数拟合,从而得出话题热度变化趋势。

An improved RBF neural network hot topic user participation behavior prediction method

The invention claims to protect an improved RBF neural network hot topic user participation behavior prediction method, and belongs to the field of computer network information technology analysis. First of all, taking into account the neural network to fit a good effect on the complex nonlinear relationship between the user behavior, and further using RBF (Radical Basis Function, radial basis function) to construct user participation behavior prediction model of neural network; secondly, because the mapping relationship between the user attributes and participation behavior is uncertain, the introduction of cloud theory (Cloud) of RBF in the activation function containing layer is optimized; finally, according to the characteristics of participation behavior of users changes with time, using the time discretization and time slicing method, parameter fitting degree heat topic model based on exponential function, so that the heat topic change trend.

【技术实现步骤摘要】
一种改进的RBF神经网络热点话题用户参与行为预测方法
本专利技术属于网络话题分析领域,尤其涉及社交网络中热点话题的用户行为分析与预测。
技术介绍
近年来,随着互联网的不断普及与发展,社交网络越来越成为很多人生活中的重要组成部分,微博是其中非常有代表性的社交网络之一,它是一种基于关注机制的社交网络平台,不仅能够让用户自主选择自己感兴趣的其他用户进行收听、关注,也能自由的发布自己的消息,发表的消息同时具有广播性质,即所有人都能够看到,所以,微博不仅具有社交网络的功能,同时也兼备媒体的性质。微博平台作为一种新的舆论媒介,吸引了我国大部分网民参与,其中的热点话题也很快扩散成为整个社会的热点事件,社会影响力也随之激增。同时,微博也秉承自由、开放和共享的社会网络媒体精神,与以往的传统媒介相比,给予每个个体自由表达交流的渠道,也使得其成为新兴话语传播平台。这就意味着,预测某话题将达到的热度,在舆论传播与控制上具有非常重要的意义。不仅能在发表前期预测出它可能的影响范围,也能够在发展中期及时的控制舆论走向。随之而来的就是对话题数据的分析需求也表现出了快速增长的趋势,因此,有越来越多的研究人员开始关注话题的发展态势。而话题热度的变化可以通过参与该话题的人数动态变化来体现,目前对用户参与行为的预测大致分为以下几种:基于用户过往行为的预测、基于用户文本兴趣的预测、基于用户所受群体影响的预测等。如Zaman等人在《PredictinginformationspreadinginTwitter》中提出一种基于协同过滤模型的用户行为预测方法,通过构建用户信息矩阵来进行预测。Zhang等人在《Retweetbehaviorpredictionusinghierarchicaldirichletprocess》中提出一种基于分层狄利克雷过程的非参数贝叶斯模型,对用户的兴趣进行动态的主题建模。Luo等人在《Whowillretweetme?FindingretweetersinTwitter》中使用了基于Pointwise的排序学习方法,针对有可能转发某微博的用户进行top-K排序,根据多种属性判断该用户是否会产生转发行为。由于上述现有技术均无法体现用户参与行为具有极大的不确定性的特征,忽略了用户在做出是否参与该话题的决定时的随机性与模糊性,因此并不能很好的拟合出实际情况,导致了并不能取得良好的预测效果。同时,多数研究成果均针对静态的参与行为进行预测,无法体现用户参与数量上的动态变化,因此也不能感知话题的态势。因此本专利技术采用模糊数学中的云理论与RBF神经网络相结合的方法,使该预测模型在能够对用户参与行为起到良好的非线性拟合作用的同时,还能够体现用户行为的随机性与模糊性的特征。其难点在于用户行为的特征选取以及如何将诸多特征转换为定性的云模型表示。
技术实现思路
本专利技术针对现有技术中神经网络算法进行预测时,容易陷入局部最小值而且收敛速度慢,同时由于用户行为成因复杂,无法准确体现用户属性与用户行为之间的模糊性与随机性,且用户参与行为随时间动态变化等问题。本专利技术提出了一种热点话题用户参与行为预测方法。该方法研究已经参与话题用户的粉丝,是否会在各种因素影响下继续参与该话题。同时,分别从用户粉丝自身特征属性、用户外部社交属性两个角度出发,通过RBF神经网络进行用户行为预测。由于用户行为具有模糊性和随机性,因此在模型的学习过程中引入云理论,将云模型代替RBF神经网络中的高斯函数,符合网络话题中用户参与行为的不确定性。进而将用户参与行为的分类问题转化为话题热度预测问题,通过时间切片化处理,并通过指数函数模型进行参数拟合,从而得出话题热度态势走向。提出了一种改进的RBF神经网络热点话题用户参与行为预测方法。本专利技术的技术方案如下:一种改进的RBF神经网络热点话题用户参与行为预测方法,其包括以下步骤:S1:从现有的社交平台的API获取,或者通过网络爬虫抓取web网页中的内容获取社交网络用户数据;S2:提取相关属性的步骤:考虑到潜在用户参与话题主要原因包括用户个人特征属性以及用户外部社交属性的影响,将从这两个方面提取相关属性;并对用户的信息做时间切片化处理,S3:建立模型的步骤:将用户属性进行基于云变换的数据拟合,得到正态云后可以构建出高维云,高维云的个数即为RBF神经网络中隐含层的神经元个数,其参数即为隐含层激励函数的聚类中心和带宽,确定好参数后即可对RBF神经网络进行训练,得到预测该用户是否会参与话题的预测模型;S4:预测和分析过程步骤:通过采用指数平滑法预测未来话题趋势走向,将预测得出的热点话题参与人数的时间序列(y1,y2,…,yn)做三次指数平滑计算,即可拟合出热点话题的热度趋势变化,从而进行对下一时间段的预测。进一步的,所述步骤S1获取获取社交网络用户数据的具体内容为特定热点话题下的用户参与行为数据及用户关系数据;用户参与行为数据包括该话题被转发及评论的时间、参与用户的个人信息及历史行为数据;用户关系数据包括参与该话题下的用户的所有粉丝和关注用户,以及他们的个人信息。进一步的,所述步骤S2根据用户个人特征属性提取相关属性,主要包括:提取潜在用户个人特征属性:潜在用户的个人特征属性主要包括①潜在用户是否为活跃用户isActivity(vi);②潜在用户vi的标签中是否包括与热点话题相同的关键字isSameTag(Vi);③潜在用户的关注用户中参与话题的数量countOfHF(vi);④潜在用户的关注用户的话题带动力inf(vi);将以上有关潜在用户的自身特征属性用xik的统一形式描述,表示潜在用户vi的第k个属性。进一步的,所述步骤S2根据用户外部社交属性提取相关属性,主要包括:潜在用户的外部社交属性主要包括①潜在用户vi的关注用户是否为认证用户isVip(vi,vj);②潜在用户vi的关注用户是否为意见领袖isLeader(vi,vj);③潜在用户vi与其关注用户性别相同isSameS(vi,vj);④潜在用户vi与其关注用户性别不同isDifS(vi,vj);⑤潜在用户vi与其关注用户地点相同isSameL(vi,vj);⑥潜在用户vi与其关注用户地点不同isDifL(vi,vj);同时,潜在用户是否会参与该热点话题还与其所处的社团影响力有关,因此定义其团队属性为groupInf(vi,Cm),即潜在用户所处的Cm社团是否为对该热点话题感兴趣的社团;将以上有关潜在用户的自身特征属性用xik的统一形式描述,表示潜在用户vi的第k个属性。进一步的,步骤S3建立模型的步骤主要分以下4个步骤:S31:对用户自身特征属性和用户外部社交属性分别采用极大值法进行云变换,云变换即对任意不规则的数据分布进行数学变换,它能对样本点进行软分类的模糊聚类,使其成为若干个不同的云的叠加;S32:将通过云变换的属性值与RBF神经网络相结合,从而确定云模型的隐含层神经元;根据峰值法云变化,对于输入层的每维属性X,可以得到ni个拟合正态云,根据高维云理论和n维正向云发生器构造出n维正态云作为RBF神经网络隐含层的神经元,可以得到(n1×n2×...×nn)个n维云模型,即n个隐含层节点;S33:从基于n维云模型改进的隐含层神经元中取期望值作为RBF神经网络隐含层神经元的最本文档来自技高网
...

【技术保护点】
一种改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,包括以下步骤:S1:从现有的社交平台的API获取,或者通过网络爬虫抓取web网页中的内容获取社交网络用户数据;S2:提取相关属性的步骤:考虑到潜在用户参与话题主要原因包括用户个人特征属性以及用户外部社交属性的影响,将从这两个方面提取相关属性;并对用户的信息做时间切片化处理;S3:建立模型的步骤:将用户属性进行基于云变换的数据拟合,得到正态云后可以构建出高维云,高维云的个数即为RBF神经网络中隐含层的神经元个数,其参数即为隐含层激励函数的聚类中心和带宽,确定好参数后即可对RBF神经网络进行训练,得到预测该用户是否会参与话题的预测模型;S4:预测和分析过程步骤:通过采用指数平滑法预测未来话题趋势走向,将预测得出的热点话题参与人数的时间序列(y

【技术特征摘要】
1.一种改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,包括以下步骤:S1:从现有的社交平台的API获取,或者通过网络爬虫抓取web网页中的内容获取社交网络用户数据;S2:提取相关属性的步骤:考虑到潜在用户参与话题主要原因包括用户个人特征属性以及用户外部社交属性的影响,将从这两个方面提取相关属性;并对用户的信息做时间切片化处理;S3:建立模型的步骤:将用户属性进行基于云变换的数据拟合,得到正态云后可以构建出高维云,高维云的个数即为RBF神经网络中隐含层的神经元个数,其参数即为隐含层激励函数的聚类中心和带宽,确定好参数后即可对RBF神经网络进行训练,得到预测该用户是否会参与话题的预测模型;S4:预测和分析过程步骤:通过采用指数平滑法预测未来话题趋势走向,将预测得出的热点话题参与人数的时间序列(y1,y2,…,yn)做三次指数平滑计算,即可拟合出热点话题的热度趋势变化,从而进行对下一时间段的预测。2.根据权利要求1所述改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,所述步骤S1获取获取社交网络用户数据的具体内容为特定热点话题下的用户参与行为数据及用户关系数据;用户参与行为数据包括该话题被转发及评论的时间、参与用户的个人信息及历史行为数据;用户关系数据包括参与该话题下的用户的所有粉丝和关注用户,以及他们的个人信息。3.根据权利要求1或2所述改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,所述步骤S2根据用户个人特征属性提取相关属性,主要包括:提取潜在用户个人特征属性:潜在用户的个人特征属性主要包括①潜在用户是否为活跃用户isActivity(vi);②潜在用户vi的标签中是否包括与热点话题相同的关键字isSameTag(Vi);③潜在用户的关注用户中参与话题的数量countOfHF(vi);④潜在用户的关注用户的话题带动力inf(vi);将以上有关潜在用户的自身特征属性用xik的统一形式描述,表示潜在用户vi的第k个属性。4.根据权利要求3所述改进的RBF神经网络热点话题用户参与行为预测方法,其特征在于,所述步骤S2根据用户外部社交属性提取相关属性...

【专利技术属性】
技术研发人员:刘宴兵赵金哲肖云鹏李晓娟邝瑶刘雨恬
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1