一种基于影响等级的网络用户责任指数计算方法技术

技术编号:21714619 阅读:33 留言:0更新日期:2019-07-27 19:16
本发明专利技术请求保护一种基于影响等级的网络用户责任指数计算方法,属于数据挖掘领域,该方法包括以下步骤:首先,对收集到的具体网络空间群体性事件数据(包括用户信息、用户历史微博、事件相关微博、用户关系)进行预处理、打标,得到用户数据和微博数据两个数据表;其次,根据用户基本属性计算用户基础影响等级,并基于PageRank算法的思想计算用户关联影响等级,由此得到事件中的用户影响等级,然后结合用户行为,计算得到用户的普通责任指数;最后,根据打标好的数据,判断用户行为是否涉及法律法规,计算得到用户的潜在法律责任指数,进而由用户的普通责任指数和潜在法律责任指数得到具体事件中的用户责任指数,最终排序得到事件中的责任主体用户。

A Calculating Method of Network User Responsibility Index Based on Impact Level

【技术实现步骤摘要】
一种基于影响等级的网络用户责任指数计算方法
本专利技术属于数据挖掘领域,具体涉及一种基于影响等级的网络用户责任指数计算方法。
技术介绍
随着互联网的不断发展,越来越多的人利用互联网这一工具获取信息、发表言论、评论等,从而使得网络聚集增多,网络平台也逐渐成为社会舆论新的中心点。由于网络信息的传播比较开放,而且其传播速度和广度都远远超过传统媒体,因此网络话题能在短时间内聚集大量的信息,这些信息在被进一步的讨论和放大后,就容易造成网络空间群体性事件(简称“网群事件”)。网群事件通常涉及社会民生等话题,其中可能充斥着散布、传播虚假信息等违法违规的网络行为。因此,对网群事件的管控不仅关乎网民个人的利益,也与营造清朗的网络空间密不可分。网群事件中之所以可能出现虚假信息、违规违法行为等,一定程度上是因为大部分的网络用户存在着“法不责众”的心理。这也反映出网群事件发生后,责任主体的界定是一大难题。用户责任与用户对网群事件的影响有关,根据用户个人的信息、所产生的行为以及用户在事件中的关系网络等,可以计算得到用户在事件中的影响等级,并结合用户行为的合法性等因素,最终计算得到用户的责任指数,从而界定出网群事件中的责任主体用户,以便对其行为进行不同程度的约束。现有的研究中缺少网群事件用户责任的量化分析,用户影响等级算法大多针对静态的社交网络,单纯从用户属性等静态特征进行分析,并不适用于网群事件用户真实影响的计算。本专利技术主要从用户行为的角度出发,分析用户在网群事件中通过交互行为产生的关系网络,并结合用户属性等静态特征对用户影响等级进行衡量,然后基于用户影响等级,从普通责任和潜在法律责任两个方面对用户责任进行量化。
技术实现思路
本专利技术旨在解决以上现有技术的问题。提出了一种识别出网络空间群体性事件中的责任主体用户,以便对其加以管理的基于影响等级的网络用户责任指数计算方法。本专利技术的技术方案如下:一种基于影响等级的网络用户责任指数计算方法,其包括以下步骤:首先,收集包括用户信息、用户历史微博、事件相关微博、用户关系在内的具体网络空间群体性事件数据,并对具体网络空间群体性事件数据进行包括缺失值处理、异常值处理、数值归一化在内的预处理操作以及用户特征打标,得到用户数据和微博数据两个数据表;其次,根据用户基本属性计算用户基础影响等级,并基于PageRank算法的计算用户关联影响等级,由此得到事件中的用户影响等级,然后结合用户行为,计算得到用户的普通责任指数;最后,根据打标好的数据,结合用户行为,计算得到用户的潜在法律责任指数,进而由用户的普通责任指数和潜在法律责任指数得到具体事件中的用户责任指数,最终排序得到事件中的责任主体用户。进一步的,所述对具体网络群体性事件数据进行预处理、打标具体步骤包括:首先,对用户信息数据和用户历史微博数据进行处理,得到用户在事件周期内发布微博的总数量以及所发布微博的转发量、评论量、点赞数,并对认证用户和普通用户身份认证进行打标;其次,根据用户关系数据和事件相关微博数据,对用户行为进行打标,包括发布、转发、评论、点赞四种行为;最后,根据先验知识和事件相关微博数据,对用户行为是否涉及法律法规进行打标,得到最终处理完成的用户数据和事件微博数据。进一步的,所述根据用户基本属性计算用户基础影响等级的具体步骤包括:根据包括粉丝数、关注数、认证信息、事件周期内发布的微博数、所发微博的转发量、评论量、点赞数在内的用户基本属性,分别计算用户的粉丝数、关注数加权值,活跃度、身份认证值,并归一化处理,最后加权计算得到用户基础影响等级,公式如下:INF_self(ui)=f1(ufriend,ufollower)+f2(Fui,Hui)+f3(ui)其中,INF_self(ui)表示用户ui基础影响等级,f1为用户ui的粉丝数、关注数加权值,f2为事件周期内用户ui的活跃度,f3为用户ui的身份认证值。进一步的,所述分别计算用户的粉丝数、关注数加权值,活跃度、身份认证值,并归一化处理,最后加权计算得到用户基础影响等级,具体包括:根据这些属性,可以分别构造出用户结构特征值f1,用户活跃度f2,用户身份认证值f3;用户结构特征值f1为用户粉丝数、关注数的加权值,表示用户能接触到的其他用户的范围,公式如下:f1(ufriend,ufollower)=(ufriend+ufollower)/2其中,ufriend,ufollower分别为归一化后的用户粉丝数和用户关注数;用户活跃度f2表示事件周期内用户的活跃度,由用户发布微博的频率和微博的热度决定,公式如下:其中,为事件周期内用户ui所发微博的频率,为用户ui在周期内发布的所有微博的热度之和,由转发率、评论率、点赞率加权计算得到:其中,表示用户ui在事件周期内发布、转发的微博集合,Rm表示微博m的转发率,Cm表示微博m的评论率,Lm表示微博m的点赞率,α,β,γ分别为转发率、评论率、点赞率的权重,其值满足条件α+β+γ=1;用户身份认证值f3表示用户的身份认证信息,取值范围为{0,0.5},其中0代表普通用户,0.5代表认证用户;分别对f1,f2,f3进行归一化处理,最后加权计算得到用户基础影响等级,公式如下:其中,INF_self(ui)表示用户ui基础影响等级。进一步的,所述计算用户关联影响等级的具体步骤包括:根据用户关系数据,构建出包括转发关系网络、评论关系网络、点赞关系网络在内的用户关系网络,分别在这三个关系网络上,基于PageRank算法的思想,计算用户关联影响等级,公式如下:其中,INF_rela(ui)表示用户ui的关联影响等级,Rela(i)为用户ui的关联用户,INF(uj)为用户uj的影响等级,d为阻尼系数,Wji为用户uj对用户ui的影响权重比例,由用户的响应事件决定。进一步的,所述基于PageRank算法计算用户关联影响等级的具体步骤包括:根据用户基础影响等级和转发、评论、点赞三个网络中的用户关联影响等级,进行加权计算得到用户影响等级,公式如下:INF(ui)=INF_self(ui)+INF_rela_all(ui)其中,INF_rela_all(ui)为用户ui在转发、评论、点赞三个网络中的用户关联等级的加权值。进一步的,所述计算用户普通责任指数的具体步骤包括:根据用户影响等级和打标好的用户行为系数,相乘计算得到用户普通责任指数,公式如下:NR(ui)=BI(ui)*INF(ui)其中,NR(ui)表示用户ui的普通责任指数,BI(ui)为用户ui的行为系数。进一步的,所述计算用户潜在法律责任指数的具体步骤包括:根据打标好的用户行为系数,以及用户行为是否涉及法律法规的标记值,计算得到用户潜在法律责任指数,公式如下:LR(ui)=BI(ui)*L(ui),L(ui)∈{0,e}其中,LR(ui)表示用户ui的潜在法律责任指数,L(ui)为用户ui是否涉及法律法规的标记值。本专利技术的优点及有益效果如下:本专利技术通过结合用户结构特征、用户活跃度、用户身份特征等用户基本属性,引入用户之间的响应时间,以响应时间的快慢来衡量用户间影响等级的传递比例,基于PageRank算法的思想计算网群事件中的用户影响等级。然后在用户影响等级的基础上,分析网群事件用户责任的构成,并提出一本文档来自技高网
...

【技术保护点】
1.一种基于影响等级的网络用户责任指数计算方法,其特征在于,包括以下步骤:首先,收集包括用户信息、用户历史微博、事件相关微博、用户关系在内的具体网络空间群体性事件数据,并对具体网络空间群体性事件数据进行包括缺失值处理、异常值处理、数值归一化在内的预处理操作以及用户特征打标,得到用户数据和微博数据两个数据表;其次,根据用户基本属性计算用户基础影响等级,并基于PageRank算法的计算用户关联影响等级,由此得到事件中的用户影响等级,然后结合用户行为,计算得到用户的普通责任指数;最后,根据打标好的数据,结合用户行为,计算得到用户的潜在法律责任指数,进而由用户的普通责任指数和潜在法律责任指数得到具体事件中的用户责任指数,最终排序得到事件中的责任主体用户。

【技术特征摘要】
1.一种基于影响等级的网络用户责任指数计算方法,其特征在于,包括以下步骤:首先,收集包括用户信息、用户历史微博、事件相关微博、用户关系在内的具体网络空间群体性事件数据,并对具体网络空间群体性事件数据进行包括缺失值处理、异常值处理、数值归一化在内的预处理操作以及用户特征打标,得到用户数据和微博数据两个数据表;其次,根据用户基本属性计算用户基础影响等级,并基于PageRank算法的计算用户关联影响等级,由此得到事件中的用户影响等级,然后结合用户行为,计算得到用户的普通责任指数;最后,根据打标好的数据,结合用户行为,计算得到用户的潜在法律责任指数,进而由用户的普通责任指数和潜在法律责任指数得到具体事件中的用户责任指数,最终排序得到事件中的责任主体用户。2.根据权利要求1所述的一种基于影响等级的网络用户责任指数计算方法,其特征在于,所述对具体网络群体性事件数据进行预处理、打标具体步骤包括:首先,对用户信息数据和用户历史微博数据进行处理,得到用户在事件周期内发布微博的总数量以及所发布微博的转发量、评论量、点赞数,并对认证用户和普通用户身份认证进行打标;其次,根据用户关系数据和事件相关微博数据,对用户行为进行打标,包括发布、转发、评论、点赞四种行为;最后,根据先验知识和事件相关微博数据,对用户行为是否涉及法律法规进行打标,得到最终处理完成的用户数据和事件微博数据。3.根据权利要求1所述的一种基于影响等级的网络用户责任指数计算方法,其特征在于,所述根据用户基本属性计算用户基础影响等级的具体步骤包括:根据包括粉丝数、关注数、认证信息、事件周期内发布的微博数、所发微博的转发量、评论量、点赞数在内的用户基本属性,分别计算用户的粉丝数、关注数加权值,活跃度、身份认证值,并归一化处理,最后加权计算得到用户基础影响等级,公式如下:其中,INF_self(ui)表示用户ui基础影响等级,f1为用户ui的粉丝数、关注数加权值,f2为事件周期内用户ui的活跃度,f3为用户ui的身份认证值。4.根据权利要求3所述的一种基于影响等级的网络用户责任指数计算方法,其特征在于,所述分别计算用户的粉丝数、关注数加权值,活跃度、身份认证值,并归一化处理,最后加权计算得到用户基础影响等级,具体包括:根据这些属性,可以分别构造出用户结构特征值f1,用户活跃度f2,用户身份认证值f3;用户结构特征值f1为用户粉丝数、关注数的加权值,表示用户能接触到的其他用户的范围,公式如下:f1(ufriend,ufollower)=(ufriend+ufollower)/2其中,ufriend,ufollower分别为归一化后的用户粉丝数和用户关注数;用户活跃度f2表示事件周期...

【专利技术属性】
技术研发人员:吴渝林江鹏李红波艾伟东
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1