当前位置: 首页 > 专利查询>扬州大学专利>正文

基于个体用户特征的信息传播方法技术

技术编号:16529527 阅读:66 留言:0更新日期:2017-11-09 21:27
本发明专利技术公开一种基于个体用户特征的信息传播方法,包括提取影响用户转发行为的相关特征;从社交网络中提取出用户的转发微博和未转发微博;为每个用户的历史数据为每个用户生成一个预测模型;确定参考好友的相关特征,建立参考好友选择模型,最后对参考好友模型进行求解;判断该用户是否拥有自己的转发预测模型,如果有则使用该用户自己的转发模型进行预测,如果没有则使用参考好友选择模型选择一个参考好友,通过该参考好友的转发预测模型进行预测。本发明专利技术克服了未考虑用户间关系的特征关系,以及使用同一个预测模型带来的同质性缺陷。本发明专利技术对于缺乏历史信息的新用户有较好的预测结果并且能够准确的反映真实社交网络上信息的传播规律。

【技术实现步骤摘要】
基于个体用户特征的信息传播方法
本专利技术属于在线社交网络信息传播
,特别涉及基于个体用户特征的信息传播方法。
技术介绍
随着互联网快速的发展和在线社交平台的普及,信息的传播方式发生了根本的变化。四通八达的网络将人们无时无刻地联系在一起,打破了传统的通过熟人社交网络和中心节点进行信息传播。截止2016年6月中国网民数量已经高达7.10亿,2017年新浪的月活跃用户达到4亿,同比增长了46%。网络社交平台有助于国家政策的普及、商品的推广、新闻的传播等。微博作为Web2.0应用的代表,其对社会的影响备受关注。微博社交平台为人们提供了一个信息传播平台和言论自由的空间,然而在社交平台给大家带来诸多便利的同时,也有一些不法分子在网络上散布谣言以及制造舆论来破坏社会治安。因此如何有效的预测信息的传播成为亟待解决的难题。国内外都对微博的信息传播模型展开了相关的研究,各有所侧重,总体上分为两种:一种是从宏观上入手,这类模型一般是基于仓室模型,侧重于信息传播时,不同人群总人数随时间变化的特征,例如:转发人数占总人数的比例,接收到信息的人数占总人数的比例等。另一种是从微观上入手,随着无标度网络、小本文档来自技高网...
基于个体用户特征的信息传播方法

【技术保护点】
基于个体用户特征的信息传播方法,其特征在于,包括如下步骤:(10)转发特征提取:提取影响用户转发行为的相关特征;(20)历史数据提取:从社交网络中提取出用户的转发微博和未转发微博;(30)转发预测:通过每个用户的历史数据为每个用户生成一个预测模型;(40)生成参考好友选择模型:首先确定参考好友的相关特征,然后建立参考好友选择模型,最后对参考好友模型进行求解;(50)转发预测:当用户接受到一条新的微博时,首先判断该用户是否拥有自己的转发预测模型,如果有则使用该用户自己的转发模型进行预测,如果没有则使用参考好友选择模型选择一个参考好友,通过该参考好友的转发预测模型进行预测。

【技术特征摘要】
1.基于个体用户特征的信息传播方法,其特征在于,包括如下步骤:(10)转发特征提取:提取影响用户转发行为的相关特征;(20)历史数据提取:从社交网络中提取出用户的转发微博和未转发微博;(30)转发预测:通过每个用户的历史数据为每个用户生成一个预测模型;(40)生成参考好友选择模型:首先确定参考好友的相关特征,然后建立参考好友选择模型,最后对参考好友模型进行求解;(50)转发预测:当用户接受到一条新的微博时,首先判断该用户是否拥有自己的转发预测模型,如果有则使用该用户自己的转发模型进行预测,如果没有则使用参考好友选择模型选择一个参考好友,通过该参考好友的转发预测模型进行预测。2.根据权利要求1所述的基于个体用户特征的信息传播方法,其特征在于,所述步骤(10)转发特征提取步骤具体为:提取影响用户转发行为的相关特征,信息在社交网络中的传播可以划分为点到点的传播,每一个传播实例都会涉及到三个实体:信息发送者、信息接收者、传播的信息,实体间的关系;影响用户转发行为的特征包括:信息发送者和信息接收者的属性特征、传播信息的特征、实体之间关系的特征;转发特征表示如下:1)节点的影响力:用户所有微博的转发量(AR),微博的数量为(AN);2)节点的权威度:M(Ui)是关注Ui的用户集合,Uj是Ui的一个粉丝,L(Uj)是Uj关注的数量,N是网络中总的用户数量;3)节点是否认证:1表示认证,0表示未认证;4)节点的活跃度:posts为发送微博的总数量,days为天数;5)转发者转发微博的意愿:用户转发微博量retweet_post,关注数量fellowings_num;6)是否包含URL:1未包含,0为未包含;7)是否包含标签:1未包含,0为未包含;18)是否为好友:相互关注的用户互称为好友,1表示好友,0表示不是好友关系;9)是否提及过对方:1表示提及,0表示未提及;10)信息发送者和信息转发者的兴趣相似度:公式(11)为改进后的KL公式,p和q分别表示两个用户的兴趣向量;11)信息接收者对信息感兴趣的程度:其中p代表用户的兴趣向量,q代表微博主题向量;3.根据权利要求1所述的基于个体用户特征的信息传播方法,其特征在于,所述(20)历史数据提取步骤包括:(21)提取用户转发的微博:可以直接提取,用户ui的转发微博集合表示为(22)提取用户未转发的微博:用户ui关注的用户集合为用户ui的转发微博集合对应的上一级微博集合为用户ui对应的未转发微博集合为4.根据权利要求1所述的基于个体用户特征的信息传播方法,其特征在于,所述(30)为每个用户生成预测模型具体步骤为:首先判断用户历史转发微博数据是否大于100条。如果小于100条,则结束;如果大于100条,进行如下步骤:1)按照步骤10所提取的特征,对步骤20所提取的数据进行处理,将用户数据表示成向量的形式;2)使用处理后的向量,生成SVM预测模型。5.根据权利要求1所述的基于个体用户特征的信息传播方法,其特征在于,所述(40)生成参考好友选择模型步骤具体为:(41)参考好友特征选择,选择如下特征:1)性别是否相同:gender1,gender2分别代表两个用户的性别;2)年龄的相似度:Age1,Age2分别表示两个用户的年龄,年龄越相近,相似度越高值越接近1;

【专利技术属性】
技术研发人员:张乐君赵伟杰薛霄雷晓颖
申请(专利权)人:扬州大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1