当前位置: 首页 > 专利查询>天津大学专利>正文

基于在线社会媒体信息自动化度量社会关系主观性强度的方法技术

技术编号:15504118 阅读:74 留言:0更新日期:2017-06-04 00:15
本发明专利技术公开了一种基于在线社会媒体信息自动化度量社会关系主观性强度的方法,步骤是:抽取关系双方互动次数均不小于15的用户对以及用户对双方各自的互动语言内容;基于用户对双方各自的互动语言内容,分别抽取并计算用户对双方的语言特征值(频率、长度、流畅性和情感极性)得到一个特征值列表文件;基于个人语言习惯规范特征值列表文件得到一个相对特征值列表文件,而后转化为相对特征值序列;以有向图表示一给定的社交网络,找出具有互动关系的用户对的双方同时主动与第三方沟通,以用户对的双方和第三方作为顶点所构成的有向三角形;建立并求解计算用户对双方对彼此的主观看法的最优化模型,最终得出所有用户对双方对彼此的主观看法。

Method for measuring subjective strength of social relations based on online social media information automation

The invention discloses a method for measurement of the social relationship, subjective strength of online social media information automation based on the interactive relationship between the extraction steps are: both times were not less than 15 of users and users of their respective interactive language content; users in their respective interactive language based on content, were selected and calculate the users of the language features of both sides the value (frequency, length, fluency and polarity) have a characteristic value list file; personal language customary norms have a characteristic value list file list file based on the relative eigenvalue, and then transformed into relative eigenvalue sequence; said a given social network graph to find out, there is an interactive relationship between the on both sides of an active user and third party communication, to users of the parties and the third party as a vertex to a triangle; And to solve the user's subjective view of both sides of the optimization model, and ultimately get all users of both sides of each other's subjective views.

【技术实现步骤摘要】
基于在线社会媒体信息自动化度量社会关系主观性强度的方法
本专利技术涉及社会计算领域的一种社会网络建模方法,尤其涉及一种基于在线社会媒体信息自动化度量社会关系主观性强度的方法。
技术介绍
在强度研究方面,Granovetter在其开创性研究[1]中首先阐述了关系强度的概念,并建议了大量可用于分析强度的典型行为特征。近年来,基于互动行为信息的关系强度度量是较为主流的方法[2-4],例如将行为作为隐变量来度量关系强度[2],或采用核方法将多种行为特征进行整合[3]等。除行为信息外,由于关系的拓扑信息客观性强,易于表达和计算,且可以与复杂网络研究相结合,因而成为最常用的手段并取得了显著成果,但其局限性也逐渐显现:相对静态且信息量较小,对于后验关系的动态性和主观性难以实时和准确的把握。相比之下,互动信息,尤其是互动中的语言内容由于具有时效性强、语义和场景信息丰富,且与关系参与者的主观认知密切相关等特点,成为在拓扑信息的基础上,社会关系研究的重要发展趋势。近年来,研究者们开始尝试在社会关系分析中引入互动信息,但是现有研究主要尝试从第三者的客观角度度量和分析既定关系的属性和演化规律,并未明确打破关系的第一性和客观性假设,从而未能充分发挥互动信息,尤其是语言内容信息的优势。例如,文献[5]的工作采用了互动中的标志性词汇作为特征之一,但未用到更丰富的语言元素。[参考文献][1]M.Granovetter,TheStrengthofWeakTies,TheAmericanJournalofSociology,78(6):1360–1380,1973。[2]RongjingXiang,JenniferNeville,MonicaRogati,ModelingRelationshipStrengthinOnlineSocialNetworks,InProc.WWW’10.2010。[3]JinfengZhuang,TaoMei,StevenC.H.Hoi,Xian-ShengHua,ShipengLi,ModelingSocialStrengthinSocialMediaCommunityviaKernel-basedLearning.InMM’11,2011。[4]IndikaKahanda,JenniferNeville,Usingtransactionalinformationtopredictlinkstrengthinonlinesocialnetworks.InProc.ICWSM’09,2009。[5]SibelAdal1,FredSisenda,MalikMagdon-Ismail,ActionsSpeakasLoudasWords:PredictingRelationshipsfromSocialBehaviorData,InProc.WWW’12:689-698.2012。
技术实现思路
针对现有技术中存在的问题,本专利技术提出了一种基于在线社会媒体信息自动化度量社会关系主观性强度的方法,通过分析关系双方各自的互动语言内容特征,以人际互动中语言内容的深入分析为主要手段,结合行为和拓扑结构信息,研究关系属性的主观化分析,自动化度量关系双方对彼此的主观看法,并为社会计算相关研究提供支持。为了解决上述技术问题,本专利技术提出的一种基于在线社会媒体信息自动化度量社会关系主观性强度的方法,包括以下步骤:步骤一、抽取关系双方互动次数均不小于m的用户对以及用户对双方各自的互动语言内容,m为阈值,m的取值为15;步骤二、基于用户对双方各自的互动语言内容,分别抽取用户对双方的四个语言特征值,所述四个语言特征值分别是频率、长度、流畅性以及情感极性,所述频率是指定时间段内的互动次数,所述长度是交互式语言的字的数量,所述流畅性用于反映互动语言中词和语法的规范度和质量,所述情感极性用于反映交互式语言的情绪倾向;对每个用户对双方均分别计算以上四个特征值,从而得到一个特征值列表文件备用;所述频率的计算公式如下:式(1)中,frequency_scorei,j表示用户对中的用户i对用户j的互动语言内容的互动频率,N表示用户i对用户j的互动语言内容的互动次数,t1和t2分别表示用户i对用户j的互动语言内容的最早和最晚的互动时间;所述长度的计算公式如下:式(2)中,length_scorei,j表示用户对中的用户i对用户j的互动语言内容的长度,w表示用户i对用户j的互动语言内容的单词数目;所述流畅性的计算公式如下:perplexity_scorei,j=10(-logprob/(words-oovs+1))(3)式(3)中,perplexity_scorei,j表示用户对中的用户i对用户j的互动语言内容的混乱度,prob是用户i对用户j的互动语言内容的句子的生成概率,words和oovs分别是指用户i对用户j的互动语言内容的句子中的词汇数和该句子中不在SRI语言建模工具包中的词典中的单词数量;所述情感极性的计算公式如下:式(4)中,Sentiment_scorei,j表示用户对中的用户i对用户j的互动语言内容的情感极性,S是用户i对用户j的互动语言内容的句子数目,这些句子的所有情绪词得分为W,所述情绪词得分W的计算方法是基于情感词典统计出用户对中的用户i对用户j的互动语言内容中出现的正面及负面情感词及评价词数量,对于互动语言内容中每出现一个正面词计+1、一个负面词计-1;所述情绪词得分W为互动语言内容中正面词和负面词得分的代数和;步骤三、基于个人语言习惯将步骤二获得的特征值列表文件中用户对双方的语言特征值规范化,得到一个相对特征值列表文件备用;个人语言习惯值通过公式(5)得到:式(5)中,Hf(i)是用户i的个人语言习惯值,f(i,j)是由步骤二获得的用户i对用户j所说的语言的语言特征值,C是与用户i通信的所有用户的集合,|C|表示与用户i通信的所有用户的数目;语言特征值规范化的结果通过公式(6)得到:式(6)中,f'(i,j)是用户i对用户j所说的语言规范化后的语言特征值;步骤四、将步骤三获得的相对特征值列表转化为相对特征值序列,从而获得一个包含全部用户对双向的相对特征值序列;步骤五、以有向图表示一给定的社交网络,在该社交网络中找出有向三角形,所述有向三角形是指具有互动关系的用户对的双方同时主动与第三方沟通,以用户对的双方和第三方作为顶点所构成的三角形;步骤六、建立计算用户对双方对彼此的主观看法的最优化模型,利用matlab求解该最优化模型,从而得出所有用户对双方对彼此的主观看法;所述最优化模型如下表示:式(7)中,s*表示用户对双方对彼此的主观看法的集合,该集合s*是n*1维的向量,n表示嵌入社交网络的边缘的数目,边缘符号向量集合s∈[0,1]|E|表示用户对彼此之间相互关系的主观强度;第一项是总边缘成本,其中,|E|表示嵌入社交网络的边缘的数目,fe∈{f1e,f2e,f3e,f44}表示基于语言内容测量的边缘e的四个语言特征值,四个语言特征值分别是频率,长度,流畅性和情感极性,表示边缘e∈E的边缘符号se偏离语言特征值fe的成本;式(8)中,为单条边缘成本,λ1,λ0∈R+是可调参数,λ1,λ0分别用于调整最高或最低的不对称成本,边缘本文档来自技高网
...
基于在线社会媒体信息自动化度量社会关系主观性强度的方法

【技术保护点】
一种基于在线社会媒体信息自动化度量社会关系主观性强度的方法,其特征在于,包括以下步骤:步骤一、抽取关系双方互动次数均不小于m的用户对以及用户对双方各自的互动语言内容,m为阈值,m的取值为15;步骤二、基于用户对双方各自的互动语言内容,分别抽取用户对双方的四个语言特征值,所述四个语言特征值分别是频率、长度、流畅性以及情感极性,所述频率是指定时间段内的互动次数,所述长度是交互式语言的字的数量,所述流畅性用于反映互动语言中词和语法的规范度和质量,所述情感极性用于反映交互式语言的情绪倾向;对每个用户对双方均分别计算以上四个特征值,从而得到一个特征值列表文件备用;所述频率的计算公式如下:

【技术特征摘要】
1.一种基于在线社会媒体信息自动化度量社会关系主观性强度的方法,其特征在于,包括以下步骤:步骤一、抽取关系双方互动次数均不小于m的用户对以及用户对双方各自的互动语言内容,m为阈值,m的取值为15;步骤二、基于用户对双方各自的互动语言内容,分别抽取用户对双方的四个语言特征值,所述四个语言特征值分别是频率、长度、流畅性以及情感极性,所述频率是指定时间段内的互动次数,所述长度是交互式语言的字的数量,所述流畅性用于反映互动语言中词和语法的规范度和质量,所述情感极性用于反映交互式语言的情绪倾向;对每个用户对双方均分别计算以上四个特征值,从而得到一个特征值列表文件备用;所述频率的计算公式如下:式(1)中,frequency_scorei,j表示用户对中的用户i对用户j的互动语言内容的互动频率,N表示用户i对用户j的互动语言内容的互动次数,t1和t2分别表示用户i对用户j的互动语言内容的最早和最晚的互动时间;所述长度的计算公式如下:式(2)中,length_scorei,j表示用户对中的用户i对用户j的互动语言内容的长度,w表示用户i对用户j的互动语言内容的单词数目;所述流畅性的计算公式如下:perplexity_scorei,j=10(-logprob/(words-oovs+1))(3)式(3)中,perplexity_scorei,j表示用户对中的用户i对用户j的互动语言内容的混乱度,prob是用户i对用户j的互动语言内容的句子的生成概率,words和oovs分别是指用户i对用户j的互动语言内容的句子中的词汇数和该句子中不在SRI语言建模工具包中的词典中的单词数量;所述情感极性的计算公式如下:式(4)中,Sentiment_scorei,j表示用户对中的用户i对用户j的互动语言内容的情感极性,S是用户i对用户j的互动语言内容的句子数目,这些句子的所有情绪词得分为W,所述情绪词得分W的计算方法是基于情感词典统计出用户对中的用户i对用户j的互动语言内容中出现的正面及负面情感词及评价词数量,对于互动语言内容中每出现一个正面词计+1、一个负面词计-1;所述情绪词得分W为互动语言内容中正面词和负面词得分的代数和;步骤三、基于个人语言习惯将步骤二获得的特征值列表文件中用户对双方的语言特征值规范化,得到一个相对特征值列表文件备用;个人语言习惯值通过公式(5)得到:式(5)中,Hf(i)是用户i的个人语言习惯值,f(i,j)是由步骤二获得的用户i对用户j所说的语言的语言特征值,C是与用户i通信的所有用户的集合,|C|表示与用户i通信的所有用户的数目;语言特征值规范化的结果通过公式(6)得到:

【专利技术属性】
技术研发人员:王博武贤丽郁延书
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1