基于传播加速度的微博传播流行度预测方法及装置制造方法及图纸

技术编号:21552036 阅读:16 留言:0更新日期:2019-07-07 00:07
本发明专利技术公开了一种基于传播加速度的微博传播流行度预测方法及装置,所述方法包括:确定微博消息m的目标时间Tt;将各个时间片的加速度Ai的加权算数平均值作为t0~Tr的传播加速度;在SH模型的基础上增加所述传播加速度的特征,构建二元线性回归预测模型;确定微博相对活跃强度,得到相对流行度N

Prediction Method and Device of Microblog Propagation Popularity Based on Propagation Acceleration

【技术实现步骤摘要】
基于传播加速度的微博传播流行度预测方法及装置
本专利技术涉及社交网络大数据分析领域,尤其涉及一种基于传播加速度的微博传播流行度预测方法及装置。
技术介绍
近年来,以微博为代表的部分社交网络应用迅速融入人们生活中,并深刻地改变了用户之间信息传递的方式。在以报纸、广播、电视为代表的传统媒体中,信息传播的主要方式是少数权威节点发布信息,绝大多数用户阅读、收听或者观看消息,信息传播速度相对较慢,深度较浅,同一平台上不同信息之间的传播范围的差别并不是很大。而在微博平台上,每个用户都可以自己发布和转发信息,信息的传播是以发布、阅读、转发、再阅读…这种不断迭代复制的方式进行传播的。相对于传统媒体,微博消息传播速度更快,信息传播的路径和过程随机性更强,不同信息之间传播的“流行度”也非常地不均衡,绝大多数消息传播范围很小,而极少数热点消息却能在极大范围内进行传播。国内外很多学者对于流行度预测问题开展了大量的研究工作。2008年惠普实验室的Szabo和Huberman研究了Digg和YouTube中帖子的流行度变化趋势,发现这两个网站中帖子的早期流行度与未来流行度在进行对数变换之后存在的线性相关关系,并基于此发现提出了在线信息流行度预测的线性回归SH模型。2013年Pinto等人在SH模型上进行了改进,将YouTube视频传播早期时段分成多个时间片,根据每个时间片的传播流行度来预测未来的传播流行度,并基于这种思想提出了一种改进的多元线性回归ML模型。尽管使用SH模型和ML模型等能够对在YouTube中视频帖子的传播流行度进行预测,但是对微博消息预测效果并不令人满意。这主要是因为相对于Digg和YouTube来说,微博消息的传播周期更短、速度更快、传播机制也更复杂,所以有必要对微博消息的流行度预测问题进一步进行研究。现有方法主要是根据消息早期传播的流行度值来预测未来流行度,没有考虑早期流行度的变化趋势。经过对微博的传播流行度变化态势进行分析发现,传播加速度与未来流行度有一定的相关关系。另外,微博消息的流行度与消息最初发布时间密切相关,在进行预测时应充分考虑这一因素的影响。
技术实现思路
本专利技术实施例提供一种基于传播加速度的微博传播流行度预测方法及装置,用以解决现有技术中的问题。本专利技术实施例提供一种基于传播加速度的微博传播流行度预测方法,包括:确定微博消息m的目标时间Tt,其中,所述目标时间Tt为所述微博消息的流行度趋于稳定不再增长的时刻;将微博消息m从t0到Tr这段时间平均分为i个时间段,每个时间段末的消息m累计转发数为N1,…,Ni,将t0时的转发数设为N0=0,每个时间片内新增的转发量为Ni-Ni-1,用第i时间段开始时的消息总的转发量来近似的表示该时刻m的传播范围,记为Ni-1,则第i时段的加速度为取各个时间片的加速度Ai的加权算数平均值作为t0~Tr的传播加速度;在SH模型的基础上增加所述传播加速度的特征,构建二元线性回归预测模型;确定微博相对活跃强度,根据所述微博相对活跃强度修正微博在Tr的流行度N(Tr)和传播加速度A(Tr),并分别除以Tr时刻的微博相对活跃强度,得到相对流行度N*(Tr)和相对传播加速度A*(Tr);将相对流行度N*(Tr)和相对传播加速度A*(Tr)替代所述二元线性回归预测模型中的N(Tr)和A(Tr),得到新的预测模型UAPA,并基于所述预测模型UAPA对微博传播流行度进行预测。优选地,所述目标时间Tt为24小时。优选地,取各个时间片的加速度Ai的加权算数平均值作为t0~Tr的传播加速度具体包括:根据公式1计算t0~Tr的传播加速度:其中,Tr为微博消息发布一段时间后开始进行预测任务的参考时间。优选地,在SH模型的基础上增加所述传播加速度的特征,构建二元线性回归预测模型具体包括:根据公式2和公式3构建二元线性回归预测模型:最终的未来流行度预测模型为:其中,为微博消息m在Tt时刻的转发数,N(Tt)为微博消息m在Tt时刻的实际转发数,α0,α1,α2为模型参数,通过在训练数据集上通过最小二乘估计获得。优选地,确定微博相对活跃强度具体包括:微博相对活跃强度为一个向量,代表每天24个小时中第n小时平台的活跃强度,首先计算微博平台上平均每小时转发的微博数u,然后再计算每个小时内平均的转发量为V[n],其中,1≤n≤24,则根据公式4确定每个小时平台的相对活跃强度:6、如权利要求1所述的方法,其特征在于,将相对流行度N*(Tr)和相对传播加速度A*(Tr)替代所述二元线性回归预测模型中的N(Tr)和A(Tr),得到新的预测模型UAPA,并基于所述预测模型UAPA对微博传播流行度进行预测具体包括:修正微博在Tr的流行度N(Tr)和传播加速度A(Tr),分别除以Tr时刻的微博相对活跃强度,根据公式5和公式6得到相对流行度N*(Tr)和相对传播加速度A*(Tr):将相对流行度N*(Tr)和相对传播加速度A*(Tr)替代所述二元线性回归预测模型中的N(Tr)和A(Tr),根据公式7得到新的预测模型UAPA:其中,β0,β1,β2为模型参数,通过训练集上的最小二乘法估计获得。本专利技术实施例还提供一种基于传播加速度的微博传播流行度预测装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述方法的步骤。采用本专利技术实施例,经过实验证明新的预测模型对微博消息的流行度预测在多个指标上均具有更好的表现,从而能够准确的预测微博传播流行度。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例中基于传播加速度的微博传播流行度预测方法的流程图;图2是本专利技术实施例中传播加速度与未来流行度图;图3是本专利技术实施例中一天内不同时刻的微博用户活跃度图;图4是本专利技术实施例中两条微博的早期传播加速度、流行度与未来流行度示例图。具体实施方式本专利技术实施例提出了一种新的微博消息流行度预测方法,该方法通过微博发布后短期内的传播加速度及流行度,结合微博发布时微博用户的活跃度对早期流行度和传播加速度进行修正,得到UAPA(UserActivityPropagationAcceleration)模型。也就是说,本专利技术实施例将早期流行度、传播加速度、用户活跃度等多因素纳入微博消息流行度预测的模型中,旨在提出更加准确和符合实际的微博流行度预测传播模型。本专利技术实施例将UAPA模型和业内有代表性的SH、ML和RPP模型进了对比,新预测模型对微博消息的流行度预测在多个指标上均具有更好的表现。下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传本文档来自技高网
...

【技术保护点】
1.一种基于传播加速度的微博传播流行度预测方法,其特征在于,包括:确定微博消息m的目标时间Tt,其中,所述目标时间Tt为所述微博消息的流行度趋于稳定不再增长的时刻;将微博消息m从t0到Tr这段时间平均分为i个时间段,每个时间段末的消息m累计转发数为N1,…,Ni,将t0时的转发数设为N0=0,每个时间片内新增的转发量为Ni‑Ni‑1,用第i时间段开始时的消息总的转发量来近似的表示该时刻m的传播范围,记为Ni‑1,则第i时段的加速度为

【技术特征摘要】
1.一种基于传播加速度的微博传播流行度预测方法,其特征在于,包括:确定微博消息m的目标时间Tt,其中,所述目标时间Tt为所述微博消息的流行度趋于稳定不再增长的时刻;将微博消息m从t0到Tr这段时间平均分为i个时间段,每个时间段末的消息m累计转发数为N1,…,Ni,将t0时的转发数设为N0=0,每个时间片内新增的转发量为Ni-Ni-1,用第i时间段开始时的消息总的转发量来近似的表示该时刻m的传播范围,记为Ni-1,则第i时段的加速度为取各个时间片的加速度Ai的加权算数平均值作为t0~Tr的传播加速度;在SH模型的基础上增加所述传播加速度的特征,构建二元线性回归预测模型;确定微博相对活跃强度,根据所述微博相对活跃强度修正微博在Tr的流行度N(Tr)和传播加速度A(Tr),并分别除以Tr时刻的微博相对活跃强度,得到相对流行度N*(Tr)和相对传播加速度A*(Tr);将相对流行度N*(Tr)和相对传播加速度A*(Tr)替代所述二元线性回归预测模型中的N(Tr)和A(Tr),得到新的预测模型UAPA,并基于所述预测模型UAPA对微博传播流行度进行预测。2.如权利要求1所述的方法,其特征在于,所述目标时间Tt为24小时。3.如权利要求1所述的方法,其特征在于,取各个时间片的加速度Ai的加权算数平均值作为t0~Tr的传播加速度具体包括:根据公式1计算t0~Tr的传播加速度:其中,Tr为微博消息发布一段时间后开始进行预测任务的参考时间。4.如权利要求1所述的方法,其特征在于,在SH模型的基础上增加所述传播加速度的特征,构建二元线性回归预测模型具体包括...

【专利技术属性】
技术研发人员:朱海龙陈苏马秉楠
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1