The invention requests protection, belonging to the field of social network analysis, a system and a method for analyzing the propagation trend of hot topics based on hidden links. Including: First, download or use the public API from the existing Web-based research recommendation system to obtain user information and data processing including data fragmentation. Second, establish implicit links. Using implicit relationships in social networks, implicit links are established by tag similarity, topic similarity, text content similarity, and common friends among users. The network topology is established by implicit links and explicit links, and the propagation situation of hot topics is analyzed. Third, define influence. Individual driving mechanism and friend driving mechanism are used to define influence, and multiple linear regression model is used to fit individual influence and friend influence. Fourthly, an improved SIR model is established to analyze the communication situation of hot topics and excavate hidden chains.
【技术实现步骤摘要】
一种基于隐链接分析热点话题传播趋势的系统及方法
本专利技术属于信息传播领域,涉及隐链接的建立,是一种更加全面分析热点话题传播态势的系统及方法。
技术介绍
近年来,随着互联网、社交网络等技术的快速发展,在线社交网络成为用户获取、分享及传播信息的重要平台,对社交网络的研究成为当今研究的热点,其中信息传播态势的分析备受关注。目前大量的研究主要基于已有的显性好友拓扑结构,忽略了隐性影响因素对信息传播的影响,这样不能准确地分析热点话题传播的态势,没有给舆情控制,商家推销产品带来更好的效果。肖云鹏博士在其论文(肖云鹏.在线社会网络用户行为模型与应用算法研究,北京邮电大学,2013)首次提出“隐链接”这个概念,隐链接指本来不存在显性好友关系,由于在话题中与用户的观点相同或相反,因此驱动话题的传播。所以在分析在线社交网络热点话题传播态势中,不仅需要显链接来构建网络拓扑结构,也需要添加隐链接共同构建网络拓扑结构,更加准确地分析热点话题的传播态势。目前在建立隐链接方面,主要采用单属性来构建隐链接,由于习惯性、用户自身特殊情况等原因参与话题,所以在利用文本相似性单属性建立隐链接方面存在偏差。需要利用不同类型的话题以及不同性格的用户,采用不同的多个属性建立隐链接。目前关于多个属性赋权值的研究,主要有两个方面,一方面是主观赋权法,另一方面是客观赋权法。主观赋权法需要作者有足够的经验,客观赋权法需要有大量真实的数据。这两个方法都存在误差,需要在适当情况下采用合适的方法,进而减小误差。在线社交网络信息传播的影响力最大化方面,很多学者主要研究定性分析影响力。忽略在复杂网路中,影响力受很多 ...
【技术保护点】
1.一种基于隐链接分析热点话题传播趋势的系统,其特征在于,包括:数据获取模块、隐链接建立模块、影响力定义模块及动力学模型构建模块,其中数据获取模块,主要用于直接从基于web研究型的推荐系统下载或利用成熟的社交平台的应用程序编程接口获取数据,并对数据进行包括相应属性的预处理后发送给隐链接建立模块后,利用K‑近邻算法建立隐链接;隐链接建立模块,主要用于提取相关属性,建立隐链接,从已有数据中提取用户之间标签相似度、相同话题、共同好友、文本相似性四个属性,利用K‑近邻算法,构建用户之间的隐链接,进而计算非好友之间的影响力;影响力定义模块,用于根据个体驱动机制和好友驱动机制,分别用多个属性构成个体影响力和好友影响力两个因素定义热点话题传播的影响力,并利用多元线性回归模型,分析影响力;动力学模型构建模块,用于把信息传播运用到动力学模型中,把影响力因子引入到动力学模型中,分析热点话题传播趋势。
【技术特征摘要】
1.一种基于隐链接分析热点话题传播趋势的系统,其特征在于,包括:数据获取模块、隐链接建立模块、影响力定义模块及动力学模型构建模块,其中数据获取模块,主要用于直接从基于web研究型的推荐系统下载或利用成熟的社交平台的应用程序编程接口获取数据,并对数据进行包括相应属性的预处理后发送给隐链接建立模块后,利用K-近邻算法建立隐链接;隐链接建立模块,主要用于提取相关属性,建立隐链接,从已有数据中提取用户之间标签相似度、相同话题、共同好友、文本相似性四个属性,利用K-近邻算法,构建用户之间的隐链接,进而计算非好友之间的影响力;影响力定义模块,用于根据个体驱动机制和好友驱动机制,分别用多个属性构成个体影响力和好友影响力两个因素定义热点话题传播的影响力,并利用多元线性回归模型,分析影响力;动力学模型构建模块,用于把信息传播运用到动力学模型中,把影响力因子引入到动力学模型中,分析热点话题传播趋势。2.根据权利要求1所述的一种基于隐链接分析热点话题传播趋势的系统,其特征在于,所述数据获取模块抓取某三个热点话题下的转发或评论用户的信息,包括已参与话题讨论用户的粉丝信息。3.根据权利要求1所述的一种基于隐链接分析热点话题传播趋势的系统,其特征在于,所述隐链接建立模块从已有数据中提取用户之间标签相似度、相同话题、共同好友、文本相似性四个属性,根据数据方面的特征对其进行修改,具体如下:1.标签相似度tagsim(vi,vj):A表示用户vi的标签,B表示用户vj的标签,用Jaccard系数进行归一化计算,Jaccard系数越大,表示两个用户标签相似度越大;2.相同话题comtopic(vi,vj)和共同好友comfriend(vi,vj)通过获取的数据直接统计出来;3.文本内容相似性textsim(θ):textsim(θ)=cosθ(2)式(2)中的余弦值cosθ的定义如下式(3)所示:将两个用户的发的微博的词,建立两个向量a,b,计算这两个向量的余弦值,就得到这两个用户的文本在统计学方法中他们的相似情况,其中(x1,y1)代表向量a的坐标,(x2,y2)代表向量b的坐标。4.根据权利要求3所述的一种基于隐链接分析热点话题传播趋势的系统,其特征在于,所述隐链接建立模块根据计算出来的四个属性,结合主观赋权值法和客观赋权值法,给予四个属性合理赋权值,利用K-近邻算法,设置k值,得到与好友属性极其相似的用户,建立隐链接,其算法步骤如下:①从统计好的数据中随机选出3/4的数据作为训练集,1/4的数据作为测试集;②设置k=6;③根据公式dis=w1*(tr1-te1)2+w2*(tr2-te2)2+w3*(tr3-te3)2+w4*(tr4-te4)2,其中w1+w2+w3+w4=1,tr代表训练集中的数据,te代表测试集中的数据。分别输入四个属性的值;w1、w2、w3、w4代表属性的权重;④通过KNN算法,得...
【专利技术属性】
技术研发人员:肖云鹏,梁霞,杜江,谢小秋,刘宴兵,李净桦,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。