基于条件变分自编码的密码攻击评估方法技术

技术编号:20944712 阅读:24 留言:0更新日期:2019-04-24 02:29
本发明专利技术提出基于条件变分自编码的密码攻击评估方法,包括以下步骤:构建变分自编码模型、构建条件变分自编码模型、构建密码攻击模型和综合利用条件变分自编码模型与密码攻击模型;本发明专利技术通过利用条件变分自编码模型,将用户个人信息中的用户名、邮箱地址和电话号码等条件特征,训练密码攻击模型,并且在编码器端分别使用双向GRU循环神经网络和CNN文本卷积神经网络,可以实现对密码序列和用户个人信息的编码和特征的抽象提取,本发明专利技术方法可以有效地拟合密码数据的分布和字符组合规律,生成高质量的猜测密码数据,对提高用户密码强度和安全性具有显著效果。

A Cryptographic Attack Evaluation Method Based on Conditional Variational Self-coding

The present invention proposes a method for evaluating cryptographic attacks based on conditional variational self-coding, which includes the following steps: constructing a variational self-coding model, constructing a conditional variational self-coding model, constructing a cryptographic attack model and a comprehensive utilization conditional variational self-coding model and a cryptographic attack model; by using the conditional variational self-coding model, the invention uses the user name and mailbox location in the user's personal information. Conditional features such as address and telephone number, training cipher attack model, and using bi-directional GRU cyclic neural network and CNN text convolution neural network at the encoder end, can realize the abstract extraction of encoding and features of cipher sequence and user's personal information. The method of the invention can effectively fit the distribution of cipher data and the law of character combination, and generate high-quality guessing cipher. Code data has a significant effect on improving user password strength and security.

【技术实现步骤摘要】
基于条件变分自编码的密码攻击评估方法
本专利技术涉及互联网数据加密领域,尤其涉及基于条件变分自编码的密码攻击评估方法。
技术介绍
变分自编码(variationalAutoencoder,VAE)是一种基于标准自编码模型正则化版本的生成模型。密码是数据加密和用户认证的普遍方式,用户设置的密码并不完全是随机性的,因此很容易受到密码破解工具的攻击。使用密码猜测算法是评估用户密码强度和安全性的有效方法。但是,用户密码容易出现一些弊端,多个密码数据库泄漏表明用户倾向选择容易猜到的密码,主要由常见的字符串和数字组成,并且有不少密码创建规则中包含多种多样的个人信息组合方式,所以容易受到密码破译算法攻击,确认用户密码设置是否安全,是一个十分重要的安全问题;一些现有的传统的统计方法无法准确地学习到用户的密码设置习惯,同时需要耗费大量的计算资源和时间代价,不适合实时密码强度评估,而且大部分现有的密码安全性检测算法,只考虑了密码数据集中字符放入的概率分布,并没有把用户个人信息(如邮箱、用户名等)纳入特征条件,而这些个人信息往往与密码有很强的相关性。因此,本专利技术提出基于条件变分自编码的密码攻击评估方法,以解决现有技术中的不足之处。
技术实现思路
针对上述问题,本专利技术通过利用条件变分自编码模型,将用户个人信息中的用户名、邮箱地址和电话号码等条件特征,训练密码攻击模型,并且在编码器端分别使用双向GRU循环神经网络和CNN文本卷积神经网络,可以实现对密码序列和用户个人信息的编码和特征的抽象提取,本专利技术方法可以有效地拟合密码数据的分布和字符组合规律,生成高质量的猜测密码数据,对提高用户密码强度和安全性具有显著效果。本专利技术提出基于条件变分自编码的密码攻击评估方法,包括以下步骤:步骤一:构建变分自编码模型先基于标准自编码模型正则化后生成一个变分自编码模型,再将一个先验分布强加到隐变量上,并进行替换编码器;步骤二:构建条件变分自编码模型在上述步骤一中的变分自编码模型上加上生成条件,利用变分自编码模型构建出条件变分自编码模型,然后生成特定条件下的生成数据;步骤三:构建密码攻击模型采用一个两层双向GRU循环神经网络和CNN文本卷积神经网络组成密码攻击模型编码器,然后计算出密码攻击模型最后时刻输出状态,再将最后时刻输出状态经过两个全连接层生成μ和σ,然后从标准正态分布中采样出与μ同维度的随机向量,再经过重参数化后得到中间编码z′,然后根据用户个人信息生成条件编码向量,最后生成用户密码猜测序列;步骤四:综合利用条件变分自编码模型与密码攻击模型通过标准高斯先验分布生成的隐编码z生成密码序列,再利用密码攻击模型生成条件编码向量y,再将隐变量和条件编码向量y输入解码器,生成此用户的猜测密码序列。进一步改进在于:所述步骤一中先验分布是规整的几何形式,取标准高斯分布,使得模型能够生成更接近原始数据分布的样本,先利用变分自编码模型将一个先验分布强加到隐变量上,再通过变分自编码模型将标准自编码中的编码器替换为学习得到的后验识别模型,采用神经网络作为编码器函数,参数化隐变量的后验分布使其逼近强加的先验分布,然后通过变分自编码模型最小化样本的重构损失、最小化编码隐变量和先验分布的KL散度。进一步改进在于:所述步骤一中变分自编码模型的损失函数如公式(1)所示:公式(1)中,表示的先验分布和模型编码器后验分布之间的KL散度,KL散度度量的是两个分布中的相似度,当两个分布越相似时KL散度越小;代表解码器pθ(x|z)对数据样本的重构损失。进一步改进在于:所述步骤二中条件变分自编码模型的损失函数如公式(2)所示:公式(2)中,y是条件变量,解码器会在条件y下生成特定的数据。进一步改进在于:所述步骤二中生成条件为用户的个人信息,具体包括用户名、邮箱地址和电话号码等。进一步改进在于:所述步骤三中先采用一个两层双向GRU循环神经网络和CNN文本卷积神经网络组成密码攻击模型编码器,然后根据公式(3)计算出密码攻击模型最后时刻输出状态,再将最后时刻输出状态经过两个全连接层生成μ和σ,其中μ和σ表达式如公式(4)和公式(5)所示:ht=BiGRUe(ht-1,xt-1)(3)μ=tanh(wμht)(4)σ=tanh(wσht)(5)再根据公式(6)从标准正态分布中采样出与μ同维度的随机向量,经过重参数化后得到中间编码z′,然后把用户个人信息当作字符串串联起来,经过CNN文本卷积神经网络对其编码生成条件编码向量,所述编码向量的表达公式如公式(7)所示,然后再根据公式(8)将中间编码z′与条件编码拼接在一起形成最终隐编码,最后根据公式(9)生成用户密码猜测序列;z′=randn·μ+σ(6)y=CNN(g)(7)z=[z′,y](8)ht,xt′=GRUd([ht-1,y,z],x′t-1)(9)进一步改进在于:所述步骤三中双向GRU循环神经网络用来对用户密码序列进行编码,CNN文本卷积神经网络用来对用户个人信息进行编码。进一步改进在于:所述步骤四中编码器在先验分布的控制下,将数据集中的密码序列抽象编码填充在一个高维的先验分布空间,在生成密码时,通过在隐编码的先验分布中采样出的隐变量将符合训练数据的真实编码分布,结合条件编码向量,然后生成用户密码猜测序列。本专利技术的有益效果为:通过利用条件变分自编码模型,将用户个人信息中的用户名、邮箱地址和电话号码等条件特征,训练密码攻击模型,并且在编码器端分别使用双向GRU循环神经网络和CNN文本卷积神经网络,可以实现对密码序列和用户个人信息的编码和特征的抽象提取,同时在解码器端使用双向GRU循环神经网络,可以实现对用户个人信息和密码数据隐编码的解码,生成密码序列,本专利技术方法可以有效地拟合密码数据的分布和字符组合规律,生成高质量的猜测密码数据,对提高用户密码强度和安全性具有显著效果,并且可以准确计算出所需猜测次数,匹配出尚未泄漏的密码,具有对密码安全提供预警的优点。附图说明图1为本专利技术密码攻击模型结构示意图。具体实施方式为了加深对本专利技术的理解,下面将结合实施例对本专利技术做进一步详述,本实施例仅用于解释本专利技术,并不构成对本专利技术保护范围的限定。根据图1所示,本实施例提出基于条件变分自编码的密码攻击评估方法,包括以下步骤:步骤一:构建变分自编码模型先基于标准自编码模型正则化后生成一个变分自编码模型,利用变分自编码模型将一个先验分布强加到隐变量上,再通过变分自编码模型将标准自编码中的编码器替换为学习得到的后验识别模型,采用神经网络作为编码器函数,参数化隐变量的后验分布使其逼近强加的先验分布,然后通过变分自编码模型最小化样本的重构损失、最小化编码隐变量和先验分布的KL散度,先验分布是规整的几何形式,取标准高斯分布,使得模型能够生成更接近原始数据分布的样本,变分自编码模型的损失函数如公式(1)所示:公式(1)中,表示的先验分布和模型编码器后验分布之间的KL散度,KL散度度量的是两个分布中的相似度,当两个分布越相似时KL散度越小;代表解码器pθ(x|z)对数据样本的重构损失;步骤二:构建条件变分自编码模型在上述步骤一中的变分自编码模型上加上生成条件,生成条件为用户的个人信息,具体包括用户名、邮箱地址和电话号码,利用变分自编码模型构建出条件变分自编码模型,然后生本文档来自技高网...

【技术保护点】
1.基于条件变分自编码的密码攻击评估方法,其特征在于:包括以下步骤:步骤一:构建变分自编码模型先基于标准自编码模型正则化后生成一个变分自编码模型,再将一个先验分布强加到隐变量

【技术特征摘要】
1.基于条件变分自编码的密码攻击评估方法,其特征在于:包括以下步骤:步骤一:构建变分自编码模型先基于标准自编码模型正则化后生成一个变分自编码模型,再将一个先验分布强加到隐变量上,并进行替换编码器;步骤二:构建条件变分自编码模型在上述步骤一中的变分自编码模型上加上生成条件,利用变分自编码模型构建出条件变分自编码模型,然后生成特定条件下的生成数据;步骤三:构建密码攻击模型采用一个两层双向GRU循环神经网络和CNN文本卷积神经网络组成密码攻击模型编码器,然后计算出密码攻击模型最后时刻输出状态,再将最后时刻输出状态经过两个全连接层生成μ和σ,然后从标准正态分布中采样出与μ同维度的随机向量,再经过重参数化后得到中间编码z′,然后根据用户个人信息生成条件编码向量,最后生成用户密码猜测序列;步骤四:综合利用条件变分自编码模型与密码攻击模型通过标准高斯先验分布生成的隐编码z生成密码序列,再利用密码攻击模型生成条件编码向量y,再将隐变量和条件编码向量y输入解码器,生成此用户的猜测密码序列。2.根据权利要求1所述的基于条件变分自编码的密码攻击评估方法,其特征在于:所述步骤一中先验分布是规整的几何形式,取标准高斯分布,使得模型能够生成更接近原始数据分布的样本,先利用变分自编码模型将一个先验分布强加到隐变量上,再通过变分自编码模型将标准自编码中的编码器替换为学习得到的后验识别模型,采用神经网络作为编码器函数,参数化隐变量的后验分布使其逼近强加的先验分布,然后通过变分自编码模型最小化样本的重构损失、最小化编码隐变量和先验分布的KL散度。3.根据权利要求2所述的基于条件变分自编码的密码攻击评估方法,其特征在于:所述步骤一中变分自编码模型的损失函数如公式(1)所示:公式(1)中,表示的先验分布和模型编码器后验分布之间的KL散度,KL散度度量的是两个分布中的相似度,当两个分布越相似时KL散度越小;代表解码器pθ(x|z)对数据样本的重构损失。4.根据权利要求1所述的基于条件变分自编码...

【专利技术属性】
技术研发人员:段大高莫倩
申请(专利权)人:网智天元科技集团股份有限公司
类型:发明
国别省市:西藏,54

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1