一种基于GAN的用户人格隐私保护方法技术

技术编号：31162394 阅读：29 留言：0更新日期：2021-12-04 10:32

一种基于GAN的用户人格隐私保护方法属于社会工程学领域。本发明专利技术使用结合强化学习的生成式对抗网络来进行文本的转换，其中策略梯度来解决GAN对于文本离散性的不可导问题。我们将鉴别器中的隐层语义特征“泄露”给生成器类提高生成文本语义相似性，同时在GAN的原始目标上加入真实文本和生成文本特征向量间的语义相似度和人格差异得分，因此鉴别器的样本分类器得分J(G

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GAN的用户人格隐私保护方法

[0001]本专利技术属于社会工程学领域，尤其涉及一种基于GAN的用户人格隐私保护方法。

技术介绍

[0002]网络空间威胁逐步聚焦在目标“人”上，针对“人”的社会工程学攻击层出不穷并造成了巨大损失，社会工程学利用人的心理弱点进行攻击，攻击者借助大数据、人工智能等更深入地了解目标，发现目标心理属性，从而采取对目标形成更精准的攻击，大幅提高攻击成功率。但目前针对社会工程学的防御手段主要集中在网络钓鱼方面，主要通过技术手段对社会工程学攻击的载体进行被动防御，近年来大量的案件显示其效果并不理想。
[0003]究其根本，当前的防御技术主要考虑攻击的信息特征,并没有抓住社会工程学的核心——目标“人”的特殊性，且防御方法过于被动，而不同目标在社攻击中的脆弱性差异巨大，击者的侧重点也有所不同，一封对大多数人没有任何危害的邮件对某一类人可能是致命威胁。发现攻击者如何找到“人”的弱点并利用的原理，在关键环节上进行阻断或干扰,是有效进行社会工程学攻击防护的重要前提。
[0004]人是一个复杂多变的综合体，对人的分析涉及复杂的心理学因素，在诸多心理学因素中,“人格”是一个相对稳定、全面的心理学特征，广泛应用于安全领域与人有关的研究中。人格理论分为精神分析流派、特质流派、生物学流派、人本主义流派、行为主义流派及认知流派六个流派，最常用的人格模型就是特质流派中最为主流的大五人格模型，如图1所示，它从开放性、尽责性、外向性、宜人性和神经质五个方面描述人格。
[0005]人格作为一个稳...

【技术保护点】

【技术特征摘要】
1.一种基于GAN的用户人格隐私保护方法，其特征在于，步骤如下：步骤1、生成器借助鉴别器提取的特征引导向量生成文本；步骤2、将生成的文本序列按照规定的序列长度，利用蒙特卡洛搜索补全；步骤3、将补全后的文本序列和源文本序列输入到鉴别器中使用softmax函数计算概率分布，作为真假样本分类得分；步骤4、使用语义模块计算真实样本和生成样本之间的语义相似度；步骤5、使用人格模块计算真实样本和生成样本的人格差异得分；步骤6、根据强化学习，将鉴别器的真假分类得分、语义模块的语义相似度和人格模块的人格差异得分加权处理后，作为奖励值传递给生成器，优化文本生成过程。2.根据权利要求1所述的方法，其特征在于包括如下步骤：步骤1、生成器借助鉴别器提取的特征引导向量生成文本生成器G被划分为文本生成模块和特征引导模块两部分，两个模块均采用长短期记忆网络结构；其中，文本生成模块使用随机的词符作为初始值，将其经过预训练的词嵌入模型处理后得到的嵌入向量x0作为LSTM的输入，根据规定的文本序列长度sequence_length＝T，逐个生成每个时间步(0,1,2,
…
,T)的预测值，设置序列长度T最大为40，并且将LSTM上一个时间步的输出作为下一个时间步的输入，如公式(1)所示；h
t
＝G
θ
(h
t
‑1,x
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中θ代表生成器的参数，即LSTM网络结构中的参数，其关键结构为一个记忆细胞，参数包括隐藏单元个数hidden_size、序列长度sequence_length和每个训练批次的大小batch_size；设置为以下参数值：隐藏单元个数hidden_size＝32、序列长度sequence_length＝40和每个训练批次的大小batch_size＝64；h
t
‑1是前一个时间步的隐藏状态，x
t
表示当前时间步的输入向量，其向量维数由预训练的词嵌入模型确定，emb_dim＝32；对于每个样本x，鉴别器将会输出样本x是否为真实数据的概率D
φ
(x)，并将其反馈给生成器作为强化学习中的奖励信号；鉴于鉴别器反馈信号的弱引导，在生成器网络中增加了一个特征引导模块；特征引导模块的目的是从鉴别器获得更丰富的文本特征来引导生成；在鉴别器中，对生成序列和真实序列利用CNN提取潜在特征f
t
，将此向量使用LSTM网络进行转换得到特征引导向量g
t
，保持与文本生成模块的特征一致性，过程如公式(2)所示；其中C代表LSTM构建的特征引导模块，f
t
为鉴别中CNN提取出的潜在特征，θ
C
为特征引导模块的参数集，h
tC
表示特征引导模块中当前时间步的隐藏状态向量，g
t
表示潜在向量f
t
经过特征引导模块C转换得到的特征引导向量；由于特征引导模块也采用LSTM网络结构，所以特征引导模块和生成器模块进行参数共享；将近邻k个时间步的特征向量使用线性转换得到w
t
，随后连接到文本生成模块来决定序列的下一个词符，过程如公式(3)所示；其中W
c
表示维度变换矩阵，w
t
为将线性变换后的特征引导向量；
结合特征引导模块，文本生成模块中第t个时间步的生成过程如公式(4
‑
5)所示：P(
·
|x1,
…
,x
t
)＝z
t
(h
t
)＝softmax(W
s
(h
t
w
t
)+c
s
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(4)y
t
P(
·
|x1,
…
,x
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(5)将当前时间步的隐藏状态输出h
t
与特征引导模块生成的引导向量w
t
结合，并在输入到softmax函数之前，进行线性变换，其中W
s
为权重矩阵，c
s
为偏置系数；通过softmax层，计算当前时间步的概率分布z
t
，并从概率分布P(
·
|x1,
…
,x
t
)中对词符y
t
进行采样；维度变换矩阵W
c
、权重矩阵W
s
和偏置系数c
s
三者的初始数值一般取随机值，在训练模型时通过反向传播来自动更新该值；在反向传播过程中，随着we和be的变化，不断调整概率分布，从而生成器的损失函数不断减小，直至收敛，三者的值便不再变化；生成器的损失函数见步骤5；步骤2、将生成的文本序列按照规定的序列长度，利用蒙特卡洛搜索补全；蒙特卡罗采样补充不完整序列，因此需要在中间时间进行大量的采样操作来填充不完整序列；然后将完整的序列Y
1:T
送入鉴别器，确定当前令牌的奖励，并根据反馈指导进行后续生成；采样K次的蒙特卡洛搜索过程MC如公式(6)所示：其中Y
1:TK
表示第K次采样得到的完整序列，K值设置为4；步骤3、将补全后的文本序列和源文本序列输入到鉴别器中使用softmax函数计算概率分布，作为真假样本分类得分；鉴别器D采用卷积神经网络结构，首先对输入数据经过词嵌入层做矢量化处理；然后将词向量输入卷积层，使用不同大小的卷积核提取文本特征；随后通过完全连接层处理后将文本特征送入输出层；其中，输出层使用softmax函数；鉴别器由生成器生成的负样本和真实数据集中的正样本进行训练，本质上是一个二分类任务；对于每个样本x，鉴别器将会输出样本x是否为真实数据的概率D
φ
(x)，并将其反馈给生成器作为强化学习中的奖励信号；概率值的计算过程如(7)所示：D
φ
(x)＝softmax(φ
o
F(x))
ꢀꢀꢀꢀꢀꢀ
(7)在鉴别器中，正样本得到的概率应该接近1，负样本得到的概率应该接近0，而鉴别器训练的目标是提高鉴别正、负样本的准确率，即最大化公式(8)中的目标：其中，φ是鉴别器的参数集，包括输出层和卷积层、池化层的参数；φ
o
代表输出层的参数，包括类别个数num_classes，以及在softmax函数处理前的线性变换的权重矩阵W
d
和偏置系数c
d
；由于鉴别器的作用是区分输入文本的真假，因此num_classes＝2；权重矩阵W
d
和偏置系数c
d

【专利技术属性】
技术研发人员：王秀娟，随艺，郑康锋，石雨桐，曹思玮，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人