社交网络中一种基于三元组的参与话题预测方法技术

技术编号:13348387 阅读:42 留言:0更新日期:2016-07-15 01:52
本发明专利技术提出了一种预测用户参与话题的方法,属于数据挖掘和信息检索领域。获取数据模块获取热点话题下的用户信息;提取特征模块将用户参与话题的行为通过时间分片,找出每个时间段参与话题的用户组成的信息三元组,为每个用户提取特征属性,基于用户的属性提取信息三元组的属性;模型训练模块基于信息三元组属性对信息三元组的闭合行为建模构建三元信息因子图模型,找出该热点话题下一阶段有哪些信息三元组闭合;结果预测模块根据预测的信息三元组闭合结果,预测得到参与话题的用户。该方法将用户参与话题的行为视作信息三元组的闭合行为,为社交网络中的话题参与预测提供了一种新思路,可以广泛应用于话题推荐、话题分析等相关领域。

【技术实现步骤摘要】

本专利技术涉及社交网络信息分析技术,尤其是社交网络中的信息传播、话题分析领域。
技术介绍
社交网络指的是社交参与者及其间的关系的集合,也可以说,一个社交网络是由节点(社交参与者)和节点之间的边(社交参与者之间的关系)组成的集合。因此,常用图模型来描述这样的结构。典型的社交网络研究领域包括角色识别、话题分析和信息传播等。其中话题分析领域由于能够了解舆论导向,及时获取有效信息,成为了近几年研究了热门方向之一。当前话题分析研究主要包括话题发现、话题参与预测等,所使用的方法包括:基于文本的分析,基于用户影响力的分析和基于网络结构的分析等。其中,基于网络结构的分析是最重要的研究方法之一。有许多重要的理论建立在基于结构的分析之上,例如结构洞理论和小世界理论。也有很多重要的指标用于描述网络结构,包括度、路径、网络密度和聚类系数等。在基于网络结构的话题参与预测分析中,具体又有基于树形结构的分析方法和基于好友圈子的分析方法等。基于树形结构的分析方法将用户参与话题的行为通过“粉丝转发话题,粉丝的粉丝再转发话题”这样一层一层的树形结构建模;基于用户好友圈子的分析方法,将用户参与话题的行为视为用户的好友圈子对用户产生的影响。以上两种方法的有效性在各自的应用场景中都得到了证明。但是,上述方法都存在一定应用场景的局限性,例如,在参与话题的用户数量极少的情况下,树会只剩下两层,好友圈子更是会萎缩成离散的点。三元组是三个相互关联的用户组成的小团体,是研究社交网络中团体现象的最基本单位。HONGHUANG等人在《在社交网络中挖掘三元组的闭合模式》(MiningTriadicClosurePatternsinSocialNetworks.WWW’14Companion,April7-11,2014,Seoul,Korea.)一文中,利用一种基于三元组结构的三元因子图模型进行链接预测,成功地对所有三元组的闭合行为进行了研究。该文说明利用三元组的分析方法可以有效地对用户关系的建立进行分析,但三元组结构目前仅应用在链接预测领域,传统的三元因子图模型不适合直接用于预测用户参与话题的问题。
技术实现思路
本专利技术针对现有技术社交网络话题信息预测分析中存在的上述技术问题,基于改进的三元组结构和三元因子图模型对社交网络话题进行预测分析。具体包括:获取数据、提取用户属性、提取信息三元组属性、利用改进的三元因子图模型进行建模,预测哪些用户会参与话题。本专利技术解决上述技术问题的技术方案是,提出一种社交网络中基于三元组的参与话题预测方法,该方法包括:获取数据模块获取热点话题下的用户信息;提取特征模块将用户参与话题的行为通过时间分片,找出每个时间段参与话题的用户组成的信息三元组,为每个用户提取特征属性,基于用户的属性提取信息三元组的属性;模型训练模块基于信息三元组属性对信息三元组的闭合行为建模构建三元信息因子图模型,找出该热点话题下一阶段有哪些信息三元组闭合;结果预测模块根据预测的信息三元组闭合结果,预测得到参与话题的用户。本专利技术的其中一个实施例进一步包括,所述三元信息因子图模型包括,根据信息传播过程及可能的信息传播过程构建话题参与网络拓扑结构,将所有可能闭合的开元三元组作为候选三元组,对候选信息三元组的状态赋值,使用函数f(X,Y,Z,yi)表示三元组本身的属性对三元组取值的影响;使用函数g(yi,yj)表示两个相互影响的候选三元组取值的相互影响。预测得到参与话题的用户进一步包括:根据公式:为信息三元组的属性xij确定一个函数fj(xij,yi)和一个参数αj,根据公式:为每一对相互关联的三元组确定函数hk(Yc)和权重参数μk,其中,P(xi|yi)表示信息三元组取yi的情况下属性xi存在的概率,Z1和Z2为正则化因子;根据公式 O ( θ ) = Σ i = 1 | E | Σ j = 1 d α j f j ( x i j , y i ) + Σ c Σ k μ k h k ( Y c ) - log Z ]]>定义一个对数似然目标函数logPθ(Y|X,G)为O(θ),其中,Yc表示一对相互联系的三元组,Z=Z1Z2为正则化因子;计算参数θ=({αj本文档来自技高网
...

【技术保护点】
一种社交网络中基于三元组的参与话题预测方法,其特征在于,该方法包括:获取数据模块获取热点话题下的用户信息;提取特征模块将用户参与话题的行为通过时间分片,找出每个时间段参与话题的用户组成的信息三元组,为每个用户提取特征属性,基于用户的属性提取信息三元组的属性;模型训练模块基于信息三元组属性对信息三元组的闭合行为建模构建三元信息因子图模型,找出该热点话题下一阶段有哪些信息三元组闭合;结果预测模块根据预测的信息三元组闭合结果,预测得到参与话题的用户。

【技术特征摘要】
1.一种社交网络中基于三元组的参与话题预测方法,其特征在于,该方法包括:获取数
据模块获取热点话题下的用户信息;提取特征模块将用户参与话题的行为通过时间分片,
找出每个时间段参与话题的用户组成的信息三元组,为每个用户提取特征属性,基于用户
的属性提取信息三元组的属性;模型训练模块基于信息三元组属性对信息三元组的闭合行
为建模构建三元信息因子图模型,找出该热点话题下一阶段有哪些信息三元组闭合;结果
预测模块根据预测的信息三元组闭合结果,预测得到参与话题的用户。
2.根据权利要求1所述的方法,其特征在于,所述三元信息因子图模型包括,根据信息
传播过程及可能的信息传播过程构建话题参与网络拓扑结构,将所有可能闭合的开元三元
组作为候选三元组,对候选信息三元组的状态赋值,使用函数f(X,Y,Z,yi)表示三元组本身
的属性对三元组取值的影响;使用函数g(yi,yj)表示两个相互影响的候选三元组取值的相
互影响。

【专利技术属性】
技术研发人员:肖云鹏黄恺刘宴兵刘瀚松杨光赖佳伟李露李松阳
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;85

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1