当前位置: 首页 > 专利查询>安徽大学专利>正文

一种社交网络中基于人格信息的网络结构隐藏方法、装置制造方法及图纸

技术编号:36449756 阅读:16 留言:0更新日期:2023-01-25 22:45
本发明专利技术属于大数据分析领域,具体涉及一种社交网络中基于人格信息的网络结构隐藏方法、装置。该网络结构隐藏方法包括如下步骤:S1:基于社交网络中的用户关系图谱转换为图形结构数据。S2:基于每个用户发布的社交内容,通过文本分析工具生成每个用户的五维人格向量。S3:采用多元线性回归的方法基于网络结构的各项中心性指标分别构建用于表征所有用户各项人格的人格特征矩阵。S4:通过进化算法生成在度分量上人格变化最大的匿名k度序列。S5:根据获取的匿名k度序列对原始的图G进行相应的修改,从而生成满足k度匿名图的新图G

【技术实现步骤摘要】
一种社交网络中基于人格信息的网络结构隐藏方法、装置


[0001]本专利技术属于大数据分析领域,具体涉及一种社交网络中基于人格信息的网络结构隐藏方法,以及采用该方法的一种基于人格信息的用户关系图谱预处理装置。

技术介绍

[0002]近年来,随着移动通信和网络技术的快速发展,数字虚拟生活已经逐渐成为人们日常生活的一部分。用户在社交网络平台上的交互产生了大量的数据。基于这些数据可以分析出用户间的关系,以及各个用户的喜好。通过充分分析相关数据可以得到图形格式的用户关系图谱数据,在这种用户关系图谱中,每个节点代表一个用户,节点之间的边或链接以一种更丰富、更直观的方式代表了用户或实体之间的关系。
[0003]社交网络平台上的信息的充分公开也会带来一定的安全风险,例如网络攻击者可以通过爬虫等技术获取大量及时的社交网络关系数据,然后利用这些数据可以获取用户间关系并分析出用户的人格信息等。攻击者获取到用户所处的社交网络的结构以及推测出的用户的相应人格,可以对用户进行定向的信息推送,这种信息推送既可以服务于积极的经济目的,如广告投放。也可能被用于非法目的。因此,如何保护用户在社交网络中隐私信息,避免用户的人格特征和喜好被正确提取,成为社交网络服务商亟待解决的技术问题。通常来说,实现社交网络中用户信息保护的其中一个手段是对部分用户或其发布的内容进行匿名化处理,进而消除用户间关系或用户特征容易被抓取的风险。但是在社交网络中,还没有能够有效隐藏用户人格特征的信息匿名化发布的方法。

技术实现思路

[0004]为了克服现有现有社交网络中的信息发布可能存在泄露用户人格特征或隐私信息的问题,本专利技术提供一种社交网络中基于人格信息的网络结构隐藏方法,以及一种基于人格信息的用户关系图谱预处理装置。
[0005]本专利技术采用以下技术方案实现:
[0006]一种社交网络中基于人格信息的网络结构隐藏方法,该网络结构隐藏方法包括如下步骤:
[0007]S1:基于社交网络中用户间关系生成一个对应的用户关系图谱;将用户关系图谱转换为图形结构数据的图G:G=(V,E)。
[0008]S2:基于每个用户发布的社交内容,通过文本分析工具生成每个用户的五维人格向量。其中,五维人格包括宜人性,责任心,外倾性,神经质性和开放性。
[0009]S3:采用多元线性回归的方法基于网络结构的各项中心性指标分别构建用于表征所有用户各项人格的人格特征矩阵。其中,中心性指标包括度中心性、中介中心性、紧密中心性、特征向量中心性和局部聚集系数。
[0010]S4:基于图G通过进化算法生成满足预设匿名度值k且在度分量上人格变化最大的匿名k 度序列。
[0011]S5:根据获取的匿名k度序列对原始的图G进行相应的修改,从而生成满足k度匿名图的新图G


[0012]作为本专利技术进一步的改进,步骤S1的图G中,V为用户集合,E为用户间的链接集合, n=|V|为节点的数量,m=|E|为链接的数量。
[0013]作为本专利技术进一步的改进,步骤S2中,五维人格向量的生成方法如下:
[0014]收集用户在社交网络上发布的所有信息,并提取信息中的文本数据。对文本数据进行预处理,删除非字母字符并将大写字母统一调整为小写;最后采用基于词语计量的文本分析工具对预处理后的文本数据进行分析,生成用户五个维度上的人格特征的得分值,即为所需的五维人格向量。
[0015]作为本专利技术进一步的改进,步骤S3的中心性指标中,度中心性表示当前节点与其他节点发生直接联系的数目。节点v
i
标准化后的度中心性d(v
i
,A)的计算公式如下:
[0016][0017]其中,A为图G的邻接矩阵,维度为n*n;a
ij
为邻接矩阵A第i行第j列的元素。
[0018]中介中心性表示当前节点出现在其他节点对之间最短路径的比例,用来衡量节点对其他节点传播的控制能力。节点v
i
标准化后的中介中心性b(v
i
,A)的计算公式如下:
[0019][0020]其中,l
jk
(i)为从节点v
j
到节点v
k
的最短路径中经过节点v
i
的数目,l
jk
节点v
j
到节点v
k
的最短路径的数目。
[0021]紧密中心性表示当前节点到其余所有节点的接近程度,为节点到其余所有节点的均值的倒数,节点v
i
的紧密中心性c(v
i
,A)的计算公式如下:
[0022][0023]其中,d
ij
为节点v
i
到节点v
j
的最短距离。
[0024]特征向量中心性反映节点的重要性;节点v
i
的特征向量中心性v(v
i
,A)的计算公式如下:
[0025]p为中第i行的元素,为r
max
对应的n*1维向量。
[0026]局部聚集系数反映节点的邻居节点间的相互连接的程度,节点v
i
的局部聚集系数 clu(v
i
,A)的计算公式如下:
[0027][0028]其中,V
i
为节点v
i
的邻接点的集合。
[0029]作为本专利技术进一步的改进,步骤S3中,基于各节点的度中心性、中介中心性、局部聚集系数构建用于表征所有用户宜人性的人格特征矩阵,公式如下:
[0030][0031]其中,为残差,表示用户真实的宜人性人格值与多元线性回归求出的宜人性人格值之间的差异,α1,α2,α3,C
agre
为常数,为n*1维全1向量。
[0032]基于各节点的度中心性,紧密中心性,中介中心性,局部聚集系数构建用于表征所有用户责任心的人格特征矩阵,公式如下:
[0033][0034]其中,为残差,表示用户真实的责任心人格值与多元线性回归求出的责任心人格值之间的差异,β1,β2,β3,β4,C
cons
为常数。
[0035]基于度中心性,紧密中心性,中介中心性和特征向量中心性构建用于表征所有用户外倾性的人格特征矩阵,公式如下:
[0036][0037]其中,为残差,表示用户真实的外倾性人格值与多元线性回归求出的外倾性人格值之间的差异,γ1,γ2,γ3,γ4,C
extr
为常数。
[0038]基于度中心性,紧密中心性,中介中心性和特征向量中心性构建用于表征所有用户神经质的人格特征矩阵,公式如下:
[0039][0040]其中,为残差,表示用户真实的神经质人格值与多元线性回归求出的宜神经质人格值之间的差异,v1,δ2,δ3,v4,C
neur
为常数。
[0041]基于度中心性,中介中心性构建用于表征所有用户开放本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种社交网络中基于人格信息的网络结构隐藏方法,其特征在于,所述网络结构隐藏方法包括如下步骤:S1:基于社交网络中用户间关系生成一个对应的用户关系图谱;将用户关系图谱转换为图形结构数据的图G:G=(V,E);S2:基于每个用户发布的社交内容,通过文本分析工具生成每个用户的五维人格向量;所述五维人格包括宜人性,责任心,外倾性,神经质性和开放性;S3:采用多元线性回归的方法基于网络结构的各项中心性指标分别构建用于表征所有用户各项人格的人格特征矩阵;其中,所述中心性指标包括度中心性、中介中心性、紧密中心性、特征向量中心性和局部聚集系数;S4:基于所述图G通过进化算法生成满足预设匿名度值k且在度分量上人格变化最大的匿名k度序列;S5:根据获取的所述匿名k度序列对原始的图G进行相应的修改,从而生成满足k度匿名图的新图G

。2.如权利要求1所述的社交网络中基于人格信息的网络结构隐藏方法,其特征在于:步骤S1的图G中,V为用户集合,E为用户间的链接集合,n=|V|为节点的数量,m=|E|为链接的数量。3.如权利要求2所述的社交网络中基于人格信息的网络结构隐藏方法,其特征在于:步骤S2中,五维人格向量的生成方法如下:收集用户在社交网络上发布的所有信息,并提取信息中的文本数据;对所述文本数据进行预处理,删除非字母字符并将大写字母统一调整为小写;最后采用基于词语计量的文本分析工具对预处理后的文本数据进行分析,生成用户五个维度上的人格特征的得分值,即为所需的五维人格向量。4.如权利要求3所述的社交网络中基于人格信息的网络结构隐藏方法,其特征在于:步骤S3的中心性指标中,度中心性表示当前节点与其他节点发生直接联系的数目;节点v
i
标准化后的度中心性d(v
i
,A)的计算公式如下:其中,A为图G的邻接矩阵,维度为n*n;a
ij
为邻接矩阵A第i行第j列的元素;中介中心性表示当前节点出现在其他节点对之间最短路径的比例,用来衡量节点对其他节点传播的控制能力;节点v
i
标准化后的中介中心性b(v
i
,A)的计算公式如下:其中,l
jk
(i)为从节点v
j
到节点v
k
的最短路径中经过节点v
i
的数目,l
jk
节点v
j
到节点v
k
的最短路径的数目;紧密中心性表示当前节点到其余所有节点的接近程度,为节点到其余所有节点的均值的倒数,节点v
i
的紧密中心性c(v
i
,A)的计算公式如下:
其中,d
ij
为节点v
i
到节点v
j
的最短距离;特征向量中心性反映节点的重要性;节点v
i
的特征向量中心性v(v
i
,A)的计算公式如下:局部聚集系数反映节点的邻居节点间的相互连接的程度,节点v
i
的局部聚集系数clu(v
i
,A)的计算公式如下:其中,V
i
为节点v
i
的邻接点的集合;基于各节点的度中心性、中介中心性、局部聚集系数构建用于表征所有用户宜人性的人格特征矩阵,公式如下:其中,为残差,表示用户真实的宜人性人格值与多元线性回归求出的宜人性人格值之间的差异;α1,α2,α3,C
agre
为常数,为n*1维全1向量;基于各节点的度中心性,紧密中心性,中介中心性,局部聚集系数构建用于表征所有用户责任心的人格特征矩阵,公式如下:其中,为残差,表示用户真实的责任心人格值与多元线性回归求出的责任心人格值之间的差异;β1,β2,β3,β4,C
cons
为常数;基于度中心性,紧密中心性,中介中心性和特征向量中心性构建用于表征所有用户外倾性的人格特征矩阵,公式如下:其中,为残差,表示用户真实的外倾性人格值与多元线性回归求出的外倾性人格值之间的差异;γ1,γ2,γ3,γ4,C
extr
为常数;基于度中心性,紧密中心性,中介中心性和特征向量中心性构建用于表征所有用户神经质的人格特征矩阵,公式如下:
其中,为残差,表示用户真实的神经质人格值与多元线性回归求出的神经质人格值之间的差异;v1,v2,v3,δ4,C
neur
为常数;基于度中心性,中介中心性构建用于表征所有用户开放性的人格特征矩阵,公式如下:其中,为残差,表示用户真实的开放性人格值与多元线性回归求出的开放性人格值之间的差异;θ1,θ2,C
open
为常数。5.如权利要求4所述的社交网络中基于人格信息的网络结构隐藏方法,其特征在于:所述匿名k度序列的构建方法如下:S41;获取图G中n个节点的度,构成度序列d={d1,d2,

,d
n
},其中,d
i
为节点i的度;设置进化过程中的迭代次数epcoh以及匿名度值k;S42:获取当前图G中节点的度d
i
大于预设的匿名度值k的节点数量num,并将mum相对于节点总数n的占比作为图G的得分值radio;S42:初始化进化过程的系统参数,包括最高得分max_radio,最佳度序列best_d,人格在度分量上的最大改变量best_cange,系统参数的初始值如下:max_radio=radiobest_d=dbest_cange=0;S43:按照预设的迭代次数epcoh循环执行变异操作,每轮变异操作过程中随机选择图G两个节点的度值进行更新,更新过程对其中一个节点的度加1,另一个节点的度减1;得到每轮变异后的度序列d
i
;S44:通过步骤S42的方法更新每轮变异后的度序列d
i
对应的得分值radio
i
,并将其与max_radio比较:当radio
i
>max_radio,则对d
i
进行归一化处理得到归一化的度序列d_nor
i
,然后计算隐藏的人格在度分量上的改变量Δd_nor
i
;S45:判断每轮变异中各个人格特征的改变量Δd_nor
i
是否大于best_cange,是则对系统参数进行更新;系统参数的更新方式如下:max_radio=radio
i
best_d=d
i
best_cange=Δd_nor
i
;S46:获取系统参数更新后每个节点的d
i
在d中的出现次数c
i
,进而构建一个用于表征每个节点的...

【专利技术属性】
技术研发人员:颜登程孟庆可崔杰屈诗琴仲红张以文
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1