【技术实现步骤摘要】
一种基于GAN的用户人格隐私保护方法
[0001]本专利技术属于社会工程学领域,尤其涉及一种基于GAN的用户人格隐私保护方法。
技术介绍
[0002]网络空间威胁逐步聚焦在目标“人”上,针对“人”的社会工程学攻击层出不穷并造成了巨大损失,社会工程学利用人的心理弱点进行攻击,攻击者借助大数据、人工智能等更深入地了解目标,发现目标心理属性,从而采取对目标形成更精准的攻击,大幅提高攻击成功率。但目前针对社会工程学的防御手段主要集中在网络钓鱼方面,主要通过技术手段对社会工程学攻击的载体进行被动防御,近年来大量的案件显示其效果并不理想。
[0003]究其根本,当前的防御技术主要考虑攻击的信息特征,并没有抓住社会工程学的核心——目标“人”的特殊性,且防御方法过于被动,而不同目标在社攻击中的脆弱性差异巨大,击者的侧重点也有所不同,一封对大多数人没有任何危害的邮件对某一类人可能是致命威胁。发现攻击者如何找到“人”的弱点并利用的原理,在关键环节上进行阻断或干扰,是有效进行社会工程学攻击防护的重要前提。
[0004]人是一个复杂多变的综合体,对人的分析涉及复杂的心理学因素,在诸多心理学因素中,“人格”是一个相对稳定、全面的心理学特征,广泛应用于安全领域与人有关的研究中。人格理论分为精神分析流派、特质流派、生物学流派、人本主义流派、行为主义流派及认知流派六个流派,最常用的人格模型就是特质流派中最为主流的大五人格模型,如图1所示,它从开放性、尽责性、外向性、宜人性和神经质五个方面描述人格。
[0005]人格作为一个稳 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于GAN的用户人格隐私保护方法,其特征在于,步骤如下:步骤1、生成器借助鉴别器提取的特征引导向量生成文本;步骤2、将生成的文本序列按照规定的序列长度,利用蒙特卡洛搜索补全;步骤3、将补全后的文本序列和源文本序列输入到鉴别器中使用softmax函数计算概率分布,作为真假样本分类得分;步骤4、使用语义模块计算真实样本和生成样本之间的语义相似度;步骤5、使用人格模块计算真实样本和生成样本的人格差异得分;步骤6、根据强化学习,将鉴别器的真假分类得分、语义模块的语义相似度和人格模块的人格差异得分加权处理后,作为奖励值传递给生成器,优化文本生成过程。2.根据权利要求1所述的方法,其特征在于包括如下步骤:步骤1、生成器借助鉴别器提取的特征引导向量生成文本生成器G被划分为文本生成模块和特征引导模块两部分,两个模块均采用长短期记忆网络结构;其中,文本生成模块使用随机的词符作为初始值,将其经过预训练的词嵌入模型处理后得到的嵌入向量x0作为LSTM的输入,根据规定的文本序列长度sequence_length=T,逐个生成每个时间步(0,1,2,
…
,T)的预测值,设置序列长度T最大为40,并且将LSTM上一个时间步的输出作为下一个时间步的输入,如公式(1)所示;h
t
=G
θ
(h
t
‑1,x
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中θ代表生成器的参数,即LSTM网络结构中的参数,其关键结构为一个记忆细胞,参数包括隐藏单元个数hidden_size、序列长度sequence_length和每个训练批次的大小batch_size;设置为以下参数值:隐藏单元个数hidden_size=32、序列长度sequence_length=40和每个训练批次的大小batch_size=64;h
t
‑1是前一个时间步的隐藏状态,x
t
表示当前时间步的输入向量,其向量维数由预训练的词嵌入模型确定,emb_dim=32;对于每个样本x,鉴别器将会输出样本x是否为真实数据的概率D
φ
(x),并将其反馈给生成器作为强化学习中的奖励信号;鉴于鉴别器反馈信号的弱引导,在生成器网络中增加了一个特征引导模块;特征引导模块的目的是从鉴别器获得更丰富的文本特征来引导生成;在鉴别器中,对生成序列和真实序列利用CNN提取潜在特征f
t
,将此向量使用LSTM网络进行转换得到特征引导向量g
t
,保持与文本生成模块的特征一致性,过程如公式(2)所示;其中C代表LSTM构建的特征引导模块,f
t
为鉴别中CNN提取出的潜在特征,θ
C
为特征引导模块的参数集,h
tC
表示特征引导模块中当前时间步的隐藏状态向量,g
t
表示潜在向量f
t
经过特征引导模块C转换得到的特征引导向量;由于特征引导模块也采用LSTM网络结构,所以特征引导模块和生成器模块进行参数共享;将近邻k个时间步的特征向量使用线性转换得到w
t
,随后连接到文本生成模块来决定序列的下一个词符,过程如公式(3)所示;其中W
c
表示维度变换矩阵,w
t
为将线性变换后的特征引导向量;
结合特征引导模块,文本生成模块中第t个时间步的生成过程如公式(4
‑
5)所示:P(
·
|x1,
…
,x
t
)=z
t
(h
t
)=softmax(W
s
(h
t
w
t
)+c
s
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(4)y
t
P(
·
|x1,
…
,x
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(5)将当前时间步的隐藏状态输出h
t
与特征引导模块生成的引导向量w
t
结合,并在输入到softmax函数之前,进行线性变换,其中W
s
为权重矩阵,c
s
为偏置系数;通过softmax层,计算当前时间步的概率分布z
t
,并从概率分布P(
·
|x1,
…
,x
t
)中对词符y
t
进行采样;维度变换矩阵W
c
、权重矩阵W
s
和偏置系数c
s
三者的初始数值一般取随机值,在训练模型时通过反向传播来自动更新该值;在反向传播过程中,随着we和be的变化,不断调整概率分布,从而生成器的损失函数不断减小,直至收敛,三者的值便不再变化;生成器的损失函数见步骤5;步骤2、将生成的文本序列按照规定的序列长度,利用蒙特卡洛搜索补全;蒙特卡罗采样补充不完整序列,因此需要在中间时间进行大量的采样操作来填充不完整序列;然后将完整的序列Y
1:T
送入鉴别器,确定当前令牌的奖励,并根据反馈指导进行后续生成;采样K次的蒙特卡洛搜索过程MC如公式(6)所示:其中Y
1:TK
表示第K次采样得到的完整序列,K值设置为4;步骤3、将补全后的文本序列和源文本序列输入到鉴别器中使用softmax函数计算概率分布,作为真假样本分类得分;鉴别器D采用卷积神经网络结构,首先对输入数据经过词嵌入层做矢量化处理;然后将词向量输入卷积层,使用不同大小的卷积核提取文本特征;随后通过完全连接层处理后将文本特征送入输出层;其中,输出层使用softmax函数;鉴别器由生成器生成的负样本和真实数据集中的正样本进行训练,本质上是一个二分类任务;对于每个样本x,鉴别器将会输出样本x是否为真实数据的概率D
φ
(x),并将其反馈给生成器作为强化学习中的奖励信号;概率值的计算过程如(7)所示:D
φ
(x)=softmax(φ
o
F(x))
ꢀꢀꢀꢀꢀꢀ
(7)在鉴别器中,正样本得到的概率应该接近1,负样本得到的概率应该接近0,而鉴别器训练的目标是提高鉴别正、负样本的准确率,即最大化公式(8)中的目标:其中,φ是鉴别器的参数集,包括输出层和卷积层、池化层的参数;φ
o
代表输出层的参数,包括类别个数num_classes,以及在softmax函数处理前的线性变换的权重矩阵W
d
和偏置系数c
d
;由于鉴别器的作用是区分输入文本的真假,因此num_classes=2;权重矩阵W
d
和偏置系数c
d
技术研发人员:王秀娟,随艺,郑康锋,石雨桐,曹思玮,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。