一种基于长度切割的口令字典生成方法及系统技术方案

技术编号：35459353 阅读：23 留言：0更新日期：2022-11-03 12:24

本发明专利技术公开了一种基于长度切割的口令字典生成方法及系统，基于长度切割方法，通过建立神经网络模型计算字段概率，并按生成口令出现的频次降序排列，进而生成口令字典。本发明专利技术通过预设口令片段长度，将口令训练集切分为字符组合；使用序列预测模型计算各字段的条件概率；最后按生成口令出现的频次降序排列，进而生成口令字典。本发明专利技术打破了字母、数字、字符间的分割界限，优化了生成口令字典集，提高了口令猜测的成功率。令猜测的成功率。令猜测的成功率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于长度切割的口令字典生成方法及系统

[0001]本专利技术属于数据安全
，具体涉及一种基于长度切割的口令字典生成方法及系统。

技术介绍

[0002]身份认证可以保护用户的信息与财产安全，而通过文本口令进行认证的方式由于具有部署简单、成本低等特点，成为现在及未来互联网中最主流的身份认证方式。然而，文本口令的安全性相比于生物特征口令或图形口令却差很多。一方面，用户在设置口令时，为了方便记忆，通常会设置易于记忆的流行语、单词、纪念日等作为口令，同时，会在不同网站使用相同的口令，使得口令的安全性不断下降。另一方面，随着近年来口令泄露事件的频发，口令在统计学上的特征研究越来越丰富，为口令的攻击提供了良好的理论支持。为了提高用户口令的安全性，很多开发人员强制将用户创建口令时的规则进行了设定，例如必须包含8位以上字符、必须有特殊字符等。这一改变能够降低口令的危险性，增加口令的破解难度。而用户在设置口令时，为了方便记忆，衍生出了基于键盘模式、Leet模式等特殊的字符变换模式来应对开发人员的强制规则设定。
[0003]近年来，口令猜测技术在日新月异地提升，从最早期的启发式字典猜测，到基于概率统计模型的猜测，再到近两年提出的一些基于机器学习的猜测，猜测的效果不断提升，而用户口令面临的威胁越来越强。字典攻击作为目前一种主流的口令攻击方法，经过发展，现有的主流口令字典生成方法主要有基于概率上下文无关文法(probabilistic context
‑
free grammar，PCFG)、基于Markov...

【技术保护点】

【技术特征摘要】
1.一种基于长度切割的口令字典生成方法，应用于口令猜解时的字典优化，其特征在于，包括如下步骤：(1)对原始数据集L中的口令进行预处理，按照预设的字符长度进行切割，获取口令字段的集合D
str
；(2)建立神经网络模型，并使用切割后的口令字段集合进行训练，直至神经网络模型稳定后，输出口令字段的集合D
str
中的各字段概率；(3)使用训练后的神经网络模型生成的口令字段与各字段概率，将D
str
中的口令按照口令的出现的频次降序排列，得到口令猜测字典D
pwd
；所述步骤(1)中，按照预设的字符长度具体为：设置α作为预处理参数，α∈[1,3]；设置s
min
＝2
α
‑1为切割最小阈值，s
max
＝2
α
‑
1为切割最大阈值，在按照预设的字符长度进行切割时，对于任意口令字段的集合D
str
中的口令片段p应满足口令片段p的长度l
p
∈[s
min
,s
max
]。2.根据权利要求1所述的基于长度切割的口令字典生成方法，其特征在于：所述口令片段p的长度l
p
的取值方法具体包含以下步骤：(21)初始化l
p
的值为s
min
；(22)对于原始数据集L中的口令pwd
i
，若存在口令字段的集合D
str
中的口令片段p，则以p为切割节点，对口令pwd
i
进行切割；(23)对口令pwd
i
切割后的剩余部分pwd
i
′
部分进行长度切割，将不同种类的字符均计算口令片段pwd
i
′
所包含的字符种类type，若type≥2，则l
p
＝s
min
；字符种类type包括字母L、数字D、其他字符S；(24)若字符种类type＝1，则增加l
p
的取值，l
p
加1，否则，将口令片段pwd
i
′
添加至口令字段的集合D
str
中；(25)若l
p
≤s
max
,...

【专利技术属性】
技术研发人员：李云春，王郁含，李巍，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人