The invention requests to protect a prediction model based on chaos theory. Its specific steps are as follows: data acquisition, definition of popularity, chaos theory model, prediction model four parts. First, crawling the contents of Web through the crawler to get the social network user data. Then, the driving mechanism of influencing popularity is analyzed, and the topic popularity based on multiple mechanisms is quantified by principal component analysis. Secondly, based on the chaos theory, the phase space reconstruction of the epidemic time series is carried out by using the one-parameter and multi-parameter time series defined in the previous step. At the same time, in the process of multi-parameter phase space fusion, Bayesian estimation theory is used to optimize the fusion of multiple parameters in the same high-dimensional space. The new multi parameter reconstruction phase space is obtained. Finally, considering the strong ability of RBF to approximate nonlinear functions, RBF is used to predict the popularity of the reconstructed chaotic time series.
【技术实现步骤摘要】
一种基于混沌理论的热点话题流行度预测系统及方法
本专利技术属于社交网络热点话题分析领域,主要涉及用户行为分析,构建一种基于混沌时间序列的热点话题流行度预测模型。
技术介绍
随着Web2.0的兴起以及技术的发展与进步,在线社交网已经成为人们获取信息、交流信息的重要平台,对人们的工作生活产生了巨大的影响。其中,微博是当今最为流行的在线社交网之一,它是一种互动及传播性及快的平台,正是因为这,使得用户生成的内容成为受到关注的热门内容,拥有较高的流行度。对于话题的流行度的预测与分析具有非常重要的研究和应用价值。在安全领域,感知话题流行度的趋势、预测话题流行度的值,能够及时掌控舆情的发展趋势,从而有效的掌控社会态势并有利的支持安全预警和辅助决策;在商业领域,准确估计热点话题的流行度可以及时了解用户的需求和喜好,帮助商家更合理的进行商品推荐和广告投放。因此如何准确地估计出给定热点话题在未来某个时间点的流行度的值,成为社交网络领域的主要研究内容。目前,关于流行度的研究主要集中于在线视频、微博、话题标签等。多数研究工作中,研究者通常将流行度定义量化为某种数量,如视频的观看数、微博的点赞数、话题标签的出现次数等。关于流行度的预测方法,主要有3类:基于早期流行度、基于影响因素、基于级联传播。基于早期流行度的预测方法认为早期流行度和一段时间后的流行度之间存在很强的线性关系,因此早期流行度可以作为预测因子预测未来时刻的流行度,SH模型是流行度演化态势预测的经典模型,后来SH模型的基础上扩展和延伸,如:多元线性回归模型和生成式模型等。基于影响因素的方法,考虑影响流行度的多种因素,利用 ...
【技术保护点】
1.一种基于混沌理论的热点话题流行度预测系统,包括数据源获取模块,用于获取社交网络用户数据,抓取热点话题的传播信息,包括用户个人信息和用户话题用信息,其中,用户话题信息是指用户参与该话题转发、评论的时间以及转发或者评论该话题的内容,用户个人信息包括参与该话题用户的粉丝数,关注数以及其历史行为信息,其特征在于,还包括:流行度定义模块、融合模块及流行度预测模块;其中流行度定义模块是根据数据源模块抓取的数据,即用户的话题信息和历史行为信息,获得的影响流行度的因素,即和数据源模块的关系进而提取影响流行度变化趋势的行为驱动机制和属性驱动机制,利用主成分分析,确定影响流行度的主要驱动机制,定义基于多种驱动机制影响的流行度,进而获得单参数和多参数流行度时间序列;融合模块,用于对流行度定义模块获得的单参数和多参数时间序列利用小数据量法求最大Lyapunov指数,从而证明热点话题的流行度变化趋势具有混沌特性,单参数相空间重构时,只需求得嵌入维数和延迟时间,按照相空间重构定理重构相空间,但对多参数相空间重构时,结合贝叶斯估计理论对多变量相空间在同一高维相空间进行相点的最优融合,得到对应的融合后新的相空间; ...
【技术特征摘要】
1.一种基于混沌理论的热点话题流行度预测系统,包括数据源获取模块,用于获取社交网络用户数据,抓取热点话题的传播信息,包括用户个人信息和用户话题用信息,其中,用户话题信息是指用户参与该话题转发、评论的时间以及转发或者评论该话题的内容,用户个人信息包括参与该话题用户的粉丝数,关注数以及其历史行为信息,其特征在于,还包括:流行度定义模块、融合模块及流行度预测模块;其中流行度定义模块是根据数据源模块抓取的数据,即用户的话题信息和历史行为信息,获得的影响流行度的因素,即和数据源模块的关系进而提取影响流行度变化趋势的行为驱动机制和属性驱动机制,利用主成分分析,确定影响流行度的主要驱动机制,定义基于多种驱动机制影响的流行度,进而获得单参数和多参数流行度时间序列;融合模块,用于对流行度定义模块获得的单参数和多参数时间序列利用小数据量法求最大Lyapunov指数,从而证明热点话题的流行度变化趋势具有混沌特性,单参数相空间重构时,只需求得嵌入维数和延迟时间,按照相空间重构定理重构相空间,但对多参数相空间重构时,结合贝叶斯估计理论对多变量相空间在同一高维相空间进行相点的最优融合,得到对应的融合后新的相空间;流行度预测模块,用于对融合模块得到的单参数和多参数融合相空间,利用径向基神将网络RBF对其重构的相空间进行流行度的预测。2.根据权利要求1所述的一种基于混沌理论的热点话题流行度预测系统,其特征在于,所述流行度定义模块提取流行度的行为驱动机制和属性驱动机制,包括以下内容:行为驱动机制:(1)参与该话题用户在特定时刻的评论数:countnum(ti)(2)参与该话题用户在特定时刻的转发数:retweetnum(ti)属性驱动机制:(1)参与该话题用户在特定时刻关注度:attentionvalue(ti)(2)参与该话题用户在特定时刻的影响力:influence(ti)。3.根据权利要求2所述的一种基于混沌理论的热点话题流行度预测系统,其特征在于,所述行为驱动机制,获取的转发和评论数影响的流行度的时间序列的获得包括:从话题开始到话题结束,每隔10分钟作为一个时间序列的采样点,用户在每个时刻受转发数影响的流行度定义为该时刻用户转发数相对上一时刻转发数增加的数目;用户在每个时刻受评论数影响的流行度定义为该时刻用户评论数相对上一时刻评论数增加的数目;属性驱动机制:参与用户关注度影响的时间序列的获得:A(ui)是用户的关注度,其中Num[fans(ui)...
【专利技术属性】
技术研发人员:肖云鹏,谢小秋,杜江,梁霞,张丽,刘宴兵,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。