当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于社交网络的情感交互的社团检测方法技术

技术编号:27581159 阅读:17 留言:0更新日期:2021-03-09 22:35
本发明专利技术公开了一种基于社交网络的情感交互的社团检测方法,本发明专利技术通过有效的引用了两条拓扑边,即好友关系和情感传播网络,综合的考虑了他们之间的关系,并合理的划分出自发文档和转发文档,使得社团划分更加精确;还利用了情感传播信息,用概率图模型结合数据中的文档内容和情感连接,通过变分推断的方法优化模型的参数,依照用户对特定事件的情感状态,合理的划分出不同社团,得到社团的表示更加精准。准。准。

【技术实现步骤摘要】
一种基于社交网络的情感交互的社团检测方法


[0001]本专利技术属于机器学习的
,具体涉及一种基于社交网络的情感交互的社团检测方法。

技术介绍

[0002]如今,随着互联网技术和应用的快速发展,在线社会网络交互平台将传统人类社会网络中人或人的群体之间的关系通过网络有机地关联起来,这类在线社会网络除了具有信息以及信息属性之间的关系之外,一个突出的特点是按一定方式定义的人与人之间的社会关系以及人的参与互动。直观地,在线社会网络可以使用图或网络表示,图中的节点或网络中的顶点表示社会网络中的一个个体,而节点或顶点间的边表示个体间的关系。
[0003]在社交网络领域,社团检测具有很多的应用,目前有三大类检测方法被提出,第一类,基于纯拓扑结构的,大多数传统的社区检测方法仅利用网络拓扑信息,并且由于可以使社区中的成员更可能与社区中的其他成员建立联系的定义,他们将会处于同一社区。研究人员已经提出并使用不同的算法,包括层次聚类,通过基于模块化的方法捕捉群体的信息、频谱算法、动态算法等等。第二类,考虑到了文档信息内容的聚类,研究人员已经提出了结合这两种信息源的算法,包括基于主题模型的方法,生成或判别模型以及一些启发式方法。另外,节点内容,也可以用于查找社区的解释,也可以结合混合成员身份随机块模型和主题模型的各个方面,以通过联合建模链接和有关链接实体的文本来改进实体链接模型,也可以以另一种判别概率的方法来检测社区。该模型使用节点流行度来计算两个节点之间链接的可能性,然后将其与内容信息组合到链接模型中以估计社区成员身份。第三种是考虑到了社团间的交互传播性质,认为不光要考虑到社交网络中的特有信息,还应考虑社团间的相互影响,需综合考虑异构信息,时间节点,还有考虑个人社交爱好等边缘信息。研究人员还提出社团剖析的概念,综合考虑到社团外部与内部的连接。
[0004]但现有的方法中,没有考虑好友关系和情感传播网络,导致社团划分准确度较低。

技术实现思路

[0005]本专利技术的目的在于:针对现有技术的不足,提供一种基于社交网络的情感交互的社团检测方法,能够通过变分期望最大化算法对参数进行优化,精确刻画情感在社团间传播的影响,从而获得更加精准得到社团结构。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]一种基于社交网络的情感交互的社团检测方法,包括如下步骤:
[0008]步骤一,构建出所对应的概率图模型,并刻画出模型中各个变量;
[0009]步骤二,根据概率图模型中各参数服从的概率分布,刻画模型生成过程,得到完全数据的似然函数;
[0010]步骤三,固定可见变量、拓扑、自发文档词、转发文档词及情感极性的值,通过最大化后验概率,再结合变分参数和分布,得到证据下界;
[0011]步骤四,为了最大化证据下界,对证据下界内每个参数求导,利用杰森不等式,使每个偏导结果为0;
[0012]步骤五,固定步骤四循环优化所获得的九个变分参数;
[0013]步骤六,随机初始化参数,利用步骤四和步骤五所得的参数更新规则建立模型训练过程,然后,将处理好的数据集放入模型中训练,直至参数更新收敛;
[0014]步骤七,将所获得的参数结果记录到相关文档中,获得用户和社团概率、社团和主题概率、主题和词概率及传播中的各情感极性概率,并将处理好的情感数据进行可视化分析,通过模型求解出来的更新规则进行训练,获得高质量的社团检测效果。
[0015]作为本专利技术所述的一种基于社交网络的情感交互的社团检测方法的一种改进,所述步骤一中,所述概率图模型包括用户拓扑、文档内容和情感拓扑。
[0016]作为本专利技术所述的一种基于社交网络的情感交互的社团检测方法的一种改进,所述步骤五中,九个所述变分参数包括隐变量的变分参数和参数的变分参数,所述隐变量的变分参数为三个,所述参数的变分参数为六个。
[0017]作为本专利技术所述的一种基于社交网络的情感交互的社团检测方法的一种改进,所述步骤五中,还包括:
[0018]先随机初始化隐变量的三个变分参数,之后的迭代不需要再初始化,然后归一化,以此迭代另六个参数的变分参数;
[0019]通过所得参数的变分参数,依次更新隐变量的三个变分参数,使得三个变分参数最终收敛。
[0020]作为本专利技术所述的一种基于社交网络的情感交互的社团检测方法的一种改进,所述步骤五中,还包括:
[0021]提取证据下界中与主题嵌入有关的部分,求偏导;
[0022]通过步骤一中所得数值算出步骤二的数值,再根据步骤二的数值更新步骤一的数值,循环更新,直至收敛。
[0023]本专利技术的有益效果在于,本专利技术包括步骤一,构建出所对应的概率图模型,并刻画出模型中各个变量;步骤二,根据概率图模型中各参数服从的概率分布,刻画模型生成过程,得到完全数据的似然函数;步骤三,固定可见变量、拓扑、自发文档词、转发文档词及情感极性的值,通过最大化后验概率,再结合变分参数和分布,得到证据下界;步骤四,为了最大化证据下界,对ELBO内每个参数求导,利用杰森不等式,使每个偏导结果为0;步骤五,固定步骤四循环优化所获得的九个变分参数;步骤六,随机初始化参数,利用步骤四和步骤五所得的参数更新规则建立模型训练过程,然后,将处理好的数据集放入模型中训练,直至参数更新收敛;步骤七,将所获得的参数结果记录到相关文档中,获得用户和社团概率、社团和主题概率、主题和词概率及传播中的各情感极性概率,并将处理好的情感数据进行可视化分析,通过模型求解出来的更新规则进行训练,获得高质量的社团检测效果。本专利技术通过有效的引用了两条拓扑边,即好友关系和情感传播网络,综合的考虑了他们之间的关系,并合理的划分出自发文档和转发文档,使得社团划分更加精确;并利用了情感传播信息,用概率图模型结合数据中的文档内容和情感连接,通过变分推断的方法优化模型的参数,依照用户对特定事件的情感状态,合理的划分出不同社团,得到社团的表示更加精准;结合了社交网络中大量的信息来评判社团,并通过建立概率图模型,使得该方法的的解释是合理的,
最终利用了高效的变分方法求解各个参数,变分求解的好处是收敛时间短,可以作用到较广的网络,具有以下特点:除了传统的内容信息外,还分析了大量有用的信息,有效结合了网络中的链接信息;通过概率图模型来建立具有强解释性的模型;更新规则易于表示、理解及循环快速;可扩展写诸如个人喜好,时间的其它信息。
附图说明
[0024]下面将参考附图来描述本专利技术示例性实施方式的特征、优点和技术效果。
[0025]图1为本专利技术的概率图模型的示意图。
具体实施方式
[0026]如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于社交网络的情感交互的社团检测方法,其特征在于,包括如下步骤:步骤一,构建出所对应的概率图模型,并刻画出模型中各个变量;步骤二,根据概率图模型中各参数服从的概率分布,刻画模型生成过程,得到完全数据的似然函数;步骤三,固定可见变量、拓扑、自发文档词、转发文档词及情感极性的值,通过最大化后验概率,再结合变分参数和分布,得到证据下界;步骤四,为了最大化证据下界,对证据下界每个参数求导,利用杰森不等式,使每个偏导结果为0;步骤五,固定步骤四循环优化所获得的九个变分参数;步骤六,随机初始化参数,利用步骤四和步骤五所得的参数更新规则建立模型训练过程,然后,将处理好的数据集放入模型中训练,直至参数更新收敛;步骤七,将所获得的参数结果记录到相关文档中,获得用户和社团概率、社团和主题概率、主题和词概率及传播中的各情感极性概率,并将处理好的情感数据进行可视化分析,通过模型求解出来的更新规则进行训练,获得高质量的社团检测效果。2.如权利要求1所述...

【专利技术属性】
技术研发人员:金弟冯炳道焦鹏飞
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1