社会网中基于主题兴趣的影响最大化方法技术

技术编号：18289666 阅读：47 留言：0更新日期：2018-06-24 04:26

社会网中基于主题兴趣的影响最大化方法，本发明专利技术涉及主题兴趣的影响最大化方法。本发明专利技术的目的是为了解决现有IC模型没有考虑传播项的特征，假定对所有传播项目的影响概率都是相同的；以及现有TIC模型没有考虑到用户的兴趣分布，不能准确地描述信息传播规律，导致信息传播预测准确率低的问题。本发明专利技术过程为：步骤一、建立基于主题兴趣的传播模型TI‑IC；步骤二、利用EM算法学习TI‑IC模型的参数和新传播项的主题分布向量；步骤三、基于步骤二提出针对TI‑IC模型的影响最大化算法。本发明专利技术用于社交网的影响最大化问题领域。

全部详细技术资料下载

【技术实现步骤摘要】
社会网中基于主题兴趣的影响最大化方法
本专利技术涉及主题兴趣的影响最大化方法。
技术介绍
近年来，随着社交应用的普及，人们信息获取的方式发生了很大的改变。通过在线社交网络转发和分享消息逐渐成为了人们获取信息的主要方式。很多在线社交网站允许用户对信息进行转发、评论、标记或其他一些类似的操作。如果能充分挖掘社交网络中这些海量数据，发现传播规律，将促进新思想、新产品在社交网上快速传播。为了利用社交网进行病毒式营销，Kempe等人[1]等人首次提出了影响最大化问题：选取一个大小为k的初始用户集合(种集)，使得在给定传播模型下，最终被影响的用户数量最大。文献[1]同时在两个个经典的传播模型(独立级联模型IC和线性阈值模型LT)给出了贪心算法。此后，影响最大化问题被广泛研究。一方面，为了扩展到大规模社交网络上，经典传播模型上高效的影响最大化算法[2-5]相继被提出；[1]KempeD,KleinbergJ.Maximizingthespreadofinfluencethroughasocialnetwork[C]//Procofthe9thACMSIGKDDIntConfonKnowledgeDiscoveryandDataMining.NewYork:ACM,2003:137-146[2]ChenWei,WangYajun,YangSiyu.Efficientinfluencemaximizationinsocialnetworks[C]//Procofthe15thACMSIGKDDIntConfonKnowledgeDiscoveryandDataMining....
社会网中基于主题兴趣的影响最大化方法

【技术保护点】
1.社会网中基于主题兴趣的影响最大化方法，其特征在于：所述方法具体过程为：步骤一、建立基于主题兴趣的传播模型TI‑IC；给定一个社会网有向图G＝(V,E)，一组用户的历史动作日志D(u,i,t)，对于每个主题z

【技术特征摘要】
1.社会网中基于主题兴趣的影响最大化方法，其特征在于：所述方法具体过程为：步骤一、建立基于主题兴趣的传播模型TI-IC；给定一个社会网有向图G＝(V,E)，一组用户的历史动作日志D(u,i,t)，对于每个主题z∈[1,Z]，每个传播项i都有一个主题分量每个用户结点u都有一个兴趣分量因此每个传播项i存在主题分布向量每个用户结点u存在不同主题上的兴趣分布向量i∈[1,I]；其中V为用户集合，E为关系集合；Z为主题总个数，取值为正整数；I为传播项总个数，取值为正整数；D中u属于G中的用户集合V；每个结点仅有一次机会由不活跃状态变为活跃状态，并且该过程不可逆；S表示种集，即初始的活跃用户集合，在t＝0时刻，S中的结点在传播项i上活跃；在t≥1时刻，如果用户结点u的任何邻居结点w在时刻t-1变为活跃状态，则w都有一次机会去激活邻居用户结点u，激活的概率为当用户结点u的邻居结点活跃的条件下，用户结点u被激活的概率如下所示：其中，表示在传播项i的传播过程中，在用户结点u之前已经活跃的邻居结点集合，即Δ为时延阈值；N取值为正整数；ti(w)为结点w在传播项i上活跃的时刻，ti(u)为用户结点u在传播项i上活跃的时刻；ti(u)＝∞，代表每个用户结点u不会接受传播项i；令表示传播项i在传播过程中，一定不会影响u的邻居集合；当点用户结点u的任何邻居结点w在传播项i上一定活跃，用户结点u在传播项i上活跃或不活跃；所述TI-IC为主题-兴趣的传播模型；步骤二、利用EM算法学习TI-IC模型的参数和新传播项的主题分布向量；EM算法的输入是：社会网有向图G＝(V,E)，用户历史动作日志D(u,i,t)；假设TI-IC模型的每个传播项的传播轨迹都是独立的，则给定TI-IC传播模型参数Θ的对数似然函数，表示为：其中，L(Θ；Di)表示传播项i的传播轨迹的似然函数；传播项i的传播轨迹Di在第z个主题分量上的似然函数定义为：其中，表示传播项i的传播过程中，主题z使结点u被激活的概率，表示传播项i的传播过程中，主题z没有影响结点u的概率：φ为空集；利用EM算法学习TI-IC模型的参数，得到EM学习算法的输出，即TI-IC传播模型参数Θ，Θ包括和当新的传播项i出现时，求解新传播项i的主题分布向量步骤三、基于步骤二提出针对TI-IC模型的影响最大化算法。2.根据权利要求1所述社会网中基于主题兴趣的影响最大化方法，其特征在于：所述步骤二中利用EM算法学习TI-IC模型的参数，得到EM学习算法的输出，即TI-IC模型的参数Θ，Θ包括和具体过程为...

【专利技术属性】
技术研发人员：刘勇，郭龙江，王楠，李金宝，
申请(专利权)人：黑龙江大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人