一种基于长度切割的口令字典生成方法及系统技术方案

技术编号:35459353 阅读:23 留言:0更新日期:2022-11-03 12:24
本发明专利技术公开了一种基于长度切割的口令字典生成方法及系统,基于长度切割方法,通过建立神经网络模型计算字段概率,并按生成口令出现的频次降序排列,进而生成口令字典。本发明专利技术通过预设口令片段长度,将口令训练集切分为字符组合;使用序列预测模型计算各字段的条件概率;最后按生成口令出现的频次降序排列,进而生成口令字典。本发明专利技术打破了字母、数字、字符间的分割界限,优化了生成口令字典集,提高了口令猜测的成功率。令猜测的成功率。令猜测的成功率。

【技术实现步骤摘要】
一种基于长度切割的口令字典生成方法及系统


[0001]本专利技术属于数据安全
,具体涉及一种基于长度切割的口令字典生成方法及系统。

技术介绍

[0002]身份认证可以保护用户的信息与财产安全,而通过文本口令进行认证的方式由于具有部署简单、成本低等特点,成为现在及未来互联网中最主流的身份认证方式。然而,文本口令的安全性相比于生物特征口令或图形口令却差很多。一方面,用户在设置口令时,为了方便记忆,通常会设置易于记忆的流行语、单词、纪念日等作为口令,同时,会在不同网站使用相同的口令,使得口令的安全性不断下降。另一方面,随着近年来口令泄露事件的频发,口令在统计学上的特征研究越来越丰富,为口令的攻击提供了良好的理论支持。为了提高用户口令的安全性,很多开发人员强制将用户创建口令时的规则进行了设定,例如必须包含8位以上字符、必须有特殊字符等。这一改变能够降低口令的危险性,增加口令的破解难度。而用户在设置口令时,为了方便记忆,衍生出了基于键盘模式、Leet模式等特殊的字符变换模式来应对开发人员的强制规则设定。
[0003]近年来,口令猜测技术在日新月异地提升,从最早期的启发式字典猜测,到基于概率统计模型的猜测,再到近两年提出的一些基于机器学习的猜测,猜测的效果不断提升,而用户口令面临的威胁越来越强。字典攻击作为目前一种主流的口令攻击方法,经过发展,现有的主流口令字典生成方法主要有基于概率上下文无关文法(probabilistic context

free grammar,PCFG)、基于Markov链的算法、基于对抗生成网络GAN的算法等。这些算法研究了口令字段与字段间的概率关系,能够有效提升猜解效率。但是这些方法会受限于字符种类的限制,无法进行跨字符种类的文本识别,例如“p@ss”在字段切割时会被切割为三段,无法识别为一个整体。为此,需要提出一种基于长度切割的口令字典生成方法,打破已有算法中的种类界限,提升字典的命中率。

技术实现思路

[0004]本专利技术技术解决问题:克服现有技术的不足,提供一种基于长度切割的口令字典生成方法及系统,通过预设口令片段长度,将口令训练集切分为字符组合;使用序列预测模型计算各字段的条件概率;最后按生成口令出现的频次降序排列,进而生成口令字典。本专利技术打破了字母、数字、字符间的分割界限,优化了生成口令字典集,提高了口令猜测的成功率。
[0005]本专利技术技术解决方案:一种基于长度切割的口令字典生成方法,包括以下步骤:
[0006]步骤1、对训练集中的口令进行预处理,按照预设的字符长度进行切分,获取口令字段集合,具体包括:
[0007](11)初始化l
p
的值为s
min

[0008](12)对于原始数据集L中的口令pwd
i
,若存在口令字段的集合D
str
中的口令片段p,
则以p为切割节点,对口令pwd
i
进行切割;
[0009](13)对口令pwd
i
切割后的剩余部分pwd
i

部分进行长度切割,将不同种类的字符均计算口令片段pwd
i

所包含的字符种类type,若type≥2,则l
p
=s
min
;字符种类type包括字母L、数字D、其他字符S;
[0010](14)若字符种类type=1,则增加l
p
的取值,l
p
加1,否则,将口令片段pwd
i

添加至口令字段的集合D
str
中;
[0011](15)若l
p
≤s
max
则重复执行步骤(13)至(14),否则,将口令片段pwd
i

添加至口令字段的集合D
str
中。
[0012]步骤2、建立神经网络模型,并使用切割后的口令字段集合进行训练,直至模型稳定。具体步骤包括:
[0013](21)初始化神经网络模型的网络参数,所述神经网络模型包括编码器和解码器;编码为序列模型,使用时序卷积网络,解码器为两层全连接层;编码其为序列模型,使用时序卷积网络,解码器为两层全连接层;卷积核的长度K
size
=3,卷积层数为4层,每层设置70个卷积核,分别设置每层的膨胀系数分别为d1=1、d2=2、d3=4、d4=8;
[0014](22)将切割后的口令字段进行零填充,填充至切割最大阈值s
max
,并使用One Hot编码生成矩阵M
Y
作为编码器的输入,解码器输出概率分布矩阵M
p_d

[0015](23)将概率分布矩阵M
p_d
与One Hot矩阵相乘,得到稀疏矩阵M
p

[0016](24)将稀疏矩阵M
p
中非零的元素相乘,依据条件概率的原理,得到各口令字段的概率。
[0017]步骤3、使用训练后的模型生成口令集,并按照口令出现的频次降序排列,得到口令猜测字典。具体过程如下:
[0018]从正态分布中进行抽样,并使用训练后的模型生成口令集;
[0019]统计每个口令在猜测口令及中出现的频次,依据口令出现的频次进行降序排列,最终得到口令字典。
[0020]本专利技术中的一种基于长度切割的口令字典生成系统,如图1所示,包括:口令切割模块、模型训练模块和口令字典生成模块;
[0021]口令切割模块,对原始数据集L中的口令进行预处理,基于长度的切割方法,按照预设的字符长度进行切割,获取口令字段的集合D
str
;所述按照预设的字符长度具体为:
[0022]设置α作为预处理参数,α∈[1,3];设置s
min
=2
α
‑1为切割最小阈值,s
max
=2
α

1为切割最大阈值,在按照预设的字符长度进行切割时,对于任意口令字段的集合D
str
中的口令片段p应满足口令片段p的长度l
p
∈[s
min
,s
max
];
[0023]模型训练模块,建立神经网络模型,并使用切割后的口令字段集合进行训练,直至神经网络模型稳定后,输出口令字段的集合D
str
中的各字段概率;
[0024]口令字典生成模块,使用训练后的神经网络模型生成的口令字段与各字段概率,将D
str
中的口令按照口令的出现的频次降序排列,得到口令猜测字典D
pwd

[0025]本专利技术的有益效果如下:
[0026](1)本专利技术引入了基于长度的切割方法即按照预设的字符长度进行切割,避免了字符种类对口令切割的限制,打破了字母、数字、字符间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于长度切割的口令字典生成方法,应用于口令猜解时的字典优化,其特征在于,包括如下步骤:(1)对原始数据集L中的口令进行预处理,按照预设的字符长度进行切割,获取口令字段的集合D
str
;(2)建立神经网络模型,并使用切割后的口令字段集合进行训练,直至神经网络模型稳定后,输出口令字段的集合D
str
中的各字段概率;(3)使用训练后的神经网络模型生成的口令字段与各字段概率,将D
str
中的口令按照口令的出现的频次降序排列,得到口令猜测字典D
pwd
;所述步骤(1)中,按照预设的字符长度具体为:设置α作为预处理参数,α∈[1,3];设置s
min
=2
α
‑1为切割最小阈值,s
max
=2
α

1为切割最大阈值,在按照预设的字符长度进行切割时,对于任意口令字段的集合D
str
中的口令片段p应满足口令片段p的长度l
p
∈[s
min
,s
max
]。2.根据权利要求1所述的基于长度切割的口令字典生成方法,其特征在于:所述口令片段p的长度l
p
的取值方法具体包含以下步骤:(21)初始化l
p
的值为s
min
;(22)对于原始数据集L中的口令pwd
i
,若存在口令字段的集合D
str
中的口令片段p,则以p为切割节点,对口令pwd
i
进行切割;(23)对口令pwd
i
切割后的剩余部分pwd
i

部分进行长度切割,将不同种类的字符均计算口令片段pwd
i

所包含的字符种类type,若type≥2,则l
p
=s
min
;字符种类type包括字母L、数字D、其他字符S;(24)若字符种类type=1,则增加l
p
的取值,l
p
加1,否则,将口令片段pwd
i

添加至口令字段的集合D
str
中;(25)若l
p
≤s
max
,...

【专利技术属性】
技术研发人员:李云春王郁含李巍
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1