当前位置: 首页 > 专利查询>深圳大学专利>正文

一种基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法技术

技术编号:24169045 阅读:24 留言:0更新日期:2020-05-16 02:21
本发明专利技术公开一种基于主题意见分析和意见领袖的挖掘社交网络用户影响关系方法,包括:采集用户行为产生的文本内容建立用户群行为文本;对用户群行为文本进行主题意见分析得到恒稳态的意见分布:定义用户间影响关系的矩阵权重,建立用户对主题意见由初始态转为恒稳态的转移模型;将由初始态转为恒稳态时意见不改变的用户为意见领袖,由初始态转为恒稳态时意见会改变的用户为普通用户,求解转移模型中的普通用户受意见领袖的影响关系和普通用户之间的影响关系;将普通用户受意见领袖的影响关系和普通用户之间的影响关系拼接得到用户群用户间影响关系。本发明专利技术更加精准地挖掘出了社交网络用户之间的影响关系。

A mining method of network user influence relationship based on topic opinion analysis and opinion leader

【技术实现步骤摘要】
一种基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法
本专利技术涉及互联网领域,特别涉及一种基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法。
技术介绍
当社交网络中用户交互取代web成为默认的社交网络运作模式后,用户之间的影响关系问题变得尤为突出。尽管在线社交网络和社交媒体可以让用户很直观地看到用户之间的关注关系。然而每个用户只可能知道其邻居用户的一小部分好友,无法轻易掌握整个网络的关系,并且无法直观的获得关注程度的强弱。相关工作人员必须有方法来推断所有用户之间影响关系,从而进行精准的好友推荐服务或者其它个性化服务。这一问题已成为社交网络领域研究的热点,越来越多的用户关系研究旨在增强在线社区用户忠诚度以及活跃度,提升社区的信息服务准确性和效率纵观社交网络用户关系的创建因素大体分为两种:显示和隐式。在包含显示连接的社交网络中,用户之间的所有联系都是用户有意行为的直接结果,如直接互动,关注。每个用户都在通过明确定义与他人的联系来建立自己的拓扑网络;在包含隐式连接的社交网络中,用户之间的联系是基于对用户资料、行为信息等的“第三方”推理,从而导致拥有相似隐藏信息的用户之间自动或半自动连接。关于从数据中挖掘社会影响的现有技术,有很大一部分是关于在给定的社会图中搜索特征的。例如,在先验知识下的社交网络结构中的影响矩阵,而本专利给出的技术方案与这类研究不同,仅在在只使用社交网络用户群体用户行为所产生文本的情况下,评估出了社交网络结构图和影响关系矩阵。有研究人员在其具体的方法论假定了用户的置信度转移过程是能被直接观测的。
技术实现思路
本专利技术的主要目的是提出一种基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法,旨在克服以上问题。为实现上述目的,本专利技术提出的一种基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法,包括如下步骤:S10采集用户行为产生的文本内容建立用户群行为文本;S20对用户群行为文本进行主题意见分析得到t时刻用户群对K个主题恒稳态的意见分布Xt:S30定义用户间影响关系的矩阵权重W,为所有用户在t时刻对主题k的意见分布,为所有用户在t+1时刻对主题k的意见分布,建立用户对主题意见由初始态转为恒稳态的转移模型:Xt+1=W·Xt(1);S40将由初始态转为恒稳态时意见不改变的用户为意见领袖,由初始态转为恒稳态时意见会改变的用户为普通用户,求解转移模型中的普通用户受意见领袖的影响关系B和普通用户之间的影响关系D;S50将普通用户受意见领袖的影响关系B和普通用户之间的影响关系D拼接得到用户群用户间影响关系W。优选地,所述S40具体为:视由初始态转为恒稳态时意见不会改变的用户为意见领袖,由初始态转为恒稳态时意见会改变的用户为普通用户,从稳态意见分布划分为稳态时意见领袖的意见分布和普通用户的意见分布矩阵Xt表示用户群所有用户在t时刻对于网络中所有K个主题的意见分布;将用户间影响关系的矩阵权重W划分为普通用户受意见领袖的影响关系B和普通用户之间的影响关系D:其中I为单位对角矩阵,表示意见领袖受自己的影响程度为1,不受其他意见领袖的影响,O表示意见领袖不受普通用户的影响;假设t趋向无穷,得到意见分布由恒稳态至初始态的关系:将矩阵分块原理将公式(5)拆分公式(6)、(7)、(8):基于公式(1)、(6)、(7)、(8),根据分块矩阵乘法得到:因为意见领袖的意见分布由初始态转为恒稳态不会改变,故由于:故Y=(I-D)-1·B·Z。优选地,所述意见领袖的选取方法包括:将那些发表意见且被互动频率高于预定值的用户视为意见领袖;及将用户的意见分布进行聚类,离类中心最近的用户视为意见领袖;及为每个用户提供一个利用专家知识计算出来的意识形态得分,得分偏激的用户视为意见领袖。优选地,所述S20中主题意见分析的方法为:通过使用概率生成法对用户主题意见进行建模得到用户主题意见模型,假设用户群行为文本中包括K个主题,通过用户主题意见模型求解用户群的主题意见分布。优选地,所述用户对主题意见的初始态为:用户在t=0时对主题所持有一个初始意见状态;所述用户对主题意见的恒稳态为:用户在t→∞时观测到其他用户对主题的意见时,用户根据其他用户对自已的影响关系融合其他用户对主题的意见,从而用户对意见的初始态经过多轮融合后得到最终用户主题意见。优选地,所述S50的方法具体为:S501建立恒稳态时普通用户意见分布的优化模型进行优化,得到优化后的B和D:其中为F范数,是该优化问题的误差项,||[B,D]||为L1正则项,ρ为用于平衡误差项和正则项的可调节参数,让误差值与正则项在求解B和D的过程中趋向相等,最终保证B和D的唯一性;S502将优化得到的B和D,代入公式(4),得到用户间影响关系的矩阵权重W。优选地,优化模型优化的约束条件为:[B,D]·e=ediag(D)=L其中,e为n*1维的列向量,e中的元素全部为1,n为用户数量,[B,D]·e=e表示普通用户受用户群所有用户的影响权重总和为1,L是普通成员对自己的自信度向量,是一个一维行向量,其元素个数等于普通用户的数量,diag(D)表示取出D矩阵的对角线元素组成的行向量L=[L,L,...,L]。优选地,所述普通用户意见分布的优化模型采用MATLAB软件的CVX优化工具包进行黑盒计算。优选地,所述S10中采集用户行为产生的文本内容的方法为采用网络爬虫的方法爬取网络上用户行为产生的文本内容。优选地,所述S10之后,所述S20之前还包括:S60对采集到的用户行为产生的文本内容进行质量筛选,筛选出相对规范的文本内容。本专利技术相比于现有技术的有益效果是:本专利技术通过对用户群行为文本进行主题意见分析得到恒稳态的意见分布,再对通过意见动态变化建立恒稳态的转移模型,将用户群区分出意见领袖和普通用户,分别求解普通用户受意见领袖的影响关系和普通用户之间的影响关系,再通过拼接普通用户受意见领袖的影响关系和普通用户之间的影响关系得到用户群用户间影响关系,即便在恒稳态,用户群所有用户对某个特定主题的意见不再达成一致,而是各有分歧,可见本专利技术更加精准地挖掘出了社交网络用户之间的影响关系。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1为本专利技术一实施例的方法流程图;图2为用户群影响关系矩阵W示例;图3为用户群对主题k的意见由时刻t转移至时刻t+1时意见转移推量示例;图4为所述优化模型优本文档来自技高网
...

【技术保护点】
1.一种基于主题意见分析和意见领袖的挖掘社交网络用户影响关系方法,其特征在于,包括:/nS10采集用户行为产生的文本内容建立用户群行为文本;/nS20对用户群行为文本进行主题意见分析得到t时刻趋近于无穷时刻的用户群对K个主题恒稳态的意见分布

【技术特征摘要】
20191213 CN 20191128362481.一种基于主题意见分析和意见领袖的挖掘社交网络用户影响关系方法,其特征在于,包括:
S10采集用户行为产生的文本内容建立用户群行为文本;
S20对用户群行为文本进行主题意见分析得到t时刻趋近于无穷时刻的用户群对K个主题恒稳态的意见分布
S30定义用户间影响关系的矩阵权重W,为所有用户在t时刻对主题k的意见分布,为所有用户在t+1时刻对主题k的意见分布,建立用户对主题意见由初始态转为恒稳态的转移模型:
S40将由初始态转为恒稳态时意见不改变的用户为意见领袖,由初始态转为恒稳态时意见会改变的用户为普通用户,求解转移模型中的普通用户受意见领袖的影响关系B和普通用户之间的影响关系D;
S50将普通用户受意见领袖的影响关系B和普通用户之间的影响关系D拼接得到用户群用户间影响关系W。


2.如权利要求1所述的基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法,其特征在于,所述S40具体为:
视由初始态转为恒稳态时意见不会改变的用户为意见领袖,由初始态转为恒稳态时意见会改变的用户为普通用户,从稳态意见分布划分为稳态时意见领袖的意见分布和普通用户的意见分布



矩阵X表示用户群所有用户在t→∞时刻对于网络中所有K个主题的意见分布;
将用户间影响关系的矩阵权重W划分为普通用户受意见领袖的影响关系B和普通用户之间的影响关系D,即其中I为单位对角矩阵,单位对角矩阵中对角元素1表示意见领袖受自己的影响程度为1,不受其他意见领袖的影响,其他元素0表示意见领袖不受普通用户的影响,即普通用户对意见领袖的影响程度为0;
假设t趋向无穷,得到意见分布由恒稳态至初始态的关系:



利用矩阵分块原理将公式(5)拆分公式(6)、(7)、(8):









基于公式(1)、(6)、(7)、(8),根据分块矩阵乘法得到:






因为意见领袖的意见分布由初始态转为恒稳态不会改变,故
由于:故Y=(I-D)-1·B·Z。


3.如权利要求1所述的基于主题意见分析和意见领袖的网络用户影响关系的挖掘方法,其特征在于,所述意见领袖的选取方法包括:
将那些发表意见且被互动频率高于预定值的用户视为意见领袖;及
将用户的意见分布进行聚类,离类中心最近的用户视为意见领袖;及
为每个用户提供一个利用专家知识计算出来的意识形态得分,得分偏激的用户视为意见领袖。


4.如权利要求1所述的基于主...

【专利技术属性】
技术研发人员:邹新宇吴晓晓王晖
申请(专利权)人:深圳大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1