【技术实现步骤摘要】
本专利技术涉及密码安全 ,尤其涉及一种密码猜测方法、装置、电子设备及介质。
技术介绍
1、现有密码猜测模型对密码关联性的处理不足:现有的密码猜测模型(如概率上下文无关文法(probabilistic context free grammar,pcfg)、马尔可夫模型、基于神经网络的方法)主要关注密码的整体特征,忽略了不同密码之间的潜在关联性。这导致这些模型在用户使用相似密码的情况下,无法有效捕捉这些关联,从而降低了预测的准确性,增加了账户被破解的风险。
2、基于规则的密码猜测模型的局限性:现有基于规则的密码猜测方法严重依赖于人工选择和设计规则。规则的有效性直接影响密码破解的效率和准确性。由于规则选择和设计依赖于经验,这些方法在处理复杂和多样化的密码模式时,效率和效果都受到限制。
3、对专家经验的依赖过强:传统的密码破解技术通常需要大量专家经验来选择和优化规则。这种依赖限制了自动化技术的应用,并使得规则设计变得复杂且不易适应各种密码模式。
4、生成密码质量受限于规则选择:在基于规则的密码猜测中,生成的密码质量高度依赖于选择的规则。不适合的规则会降低生成密码的质量和破解成功率,尤其是在面对复杂密码模式时,现有方法的表现会显著下降。
5、在许多安全技术中,文本密码仍然是最常用的用户认证方式。这种方法因其实用性和易实现性而受到广泛青睐。尽管用户通常意识到密码安全的重要性,但在易记性和随机性之间的矛盾作用下,他们往往降低密码的强度。例如,用户可能会使用包含常见短语的密码模板,或在不同网站上重
6、主流的密码猜测模型包括概率上下文无关文法(pcfg)、马尔可夫模型以及基于神经网络的方法。这些数据驱动的概率模型通过学习大量密码数据来捕捉生成模式。pcfg模型通过学习大量密码数据来捕捉生成密码的规则和结构。它基于上下文无关文法的概念,将密码生成看作是一种符合一定文法规则的过程,从而推测密码的可能形式。而马尔可夫模型通过分析密码字符的序列概率来预测密码生成的模式。它关注密码字符之间的依赖关系,并根据这些依赖关系来推测新密码。基于神经网络的方法利用深度学习技术来建模密码生成的复杂模式。通过训练神经网络,模型可以识别密码数据中的高级特征,从而提高密码猜测的准确性。
7、通常使用的技术方案一般包含如下步骤:数据收集:收集大量的密码数据,包括用户在不同网站上使用的密码;特征提取:从密码数据中提取特征,包括密码的长度、字符组成及其序列等;模型训练:使用收集到的数据和提取的特征,训练pcfg模型、马尔可夫模型或神经网络模型;密码生成与猜测:基于训练好的模型,生成可能的密码,并进行猜测;密码验证:与实际密码进行比对,确定猜测的准确性。
8、主流的密码猜测模型,如概率上下文无关文法(pcfg)、马尔可夫模型和基于神经网络的方法,通过学习大量密码数据来捕捉密码生成模式。然而,这些模型主要关注密码的整体性特征,如密码结构和字符序列的概率分布,却较少考虑不同密码之间的潜在关联性。这一局限性在实践中表现为,当用户在多个网站上使用具有相似结构的密码时,现有模型的预测能力显著降低,无法有效识别和利用这些密码间的关联,增加了账户安全风险。
9、在基于规则的密码猜测领域,尽管研究覆盖面广,但现有基于规则的模型和工具在实际应用中仍然存在明显的不足。现有技术通常依赖于经验和知识来选择规则,这使得规则的选择和设计成为关键因素。由于密码生成的规则复杂多变,规则的选择直接影响密码猜测的效率和成功率。现有模型在处理复杂密码模式时,往往无法适应这些变化,导致破解效果不佳。
技术实现思路
1、本专利技术提供一种密码猜测方法、装置、电子设备及介质,用以解决现有技术中依赖于经验和知识来选择密码猜测规则影响密码猜测的效率和成功率的缺陷,实现减少人工依赖、提升密码猜测效率和准确率、增强适应性和智能性。
2、本专利技术提供一种密码猜测方法,包括:
3、获取待猜测的目标密码;
4、通过自注意力机制的密码语言模型猜测所述目标密码可能发生字符变换的目标位置;
5、基于所述自注意力机制的密码语言模型在训练过程中学习的多个字符替换规则对所述目标位置的字符进行替换,得到猜测密码数据集;
6、其中,所述自注意力机制的密码语言模型通过以下步骤训练得到:
7、收集多个用户密码数据并对所述多个用户密码数据进行数据预处理,筛选得到密码长度在预设范围内且ascii码可打印字符的用户密码数据,作为样本用户密码数据集;
8、筛选所述样本用户密码数据集中具有公共子串的密码对;
9、基于所述密码对对生成式预训练transformer模型进行训练,得到所述自注意力机制的密码语言模型。
10、在一个可能的实施方式中,所述方法还包括:
11、分析所述目标密码与所述猜测密码数据集之间的第一映射关系;
12、基于所述第一映射关系提取密码猜测规则,并基于所述密码猜测规则对所述自注意力机制的密码语言模型进行优化。
13、在一个可能的实施方式中,所述方法还包括:
14、所述样本用户密码数据集中的各样本用户密码数据均包括用户账户信息和所述用户账户信息对应的全部密码;
15、基于预设筛选条件对比所述样本用户密码数据集中的全部密码,筛选得到所述样本用户密码数据集中具有公共子串的密码对;
16、其中,所述预设筛选条件至少包括密码对字符是否相同、密码对是否互为子字符串、密码对是否为大小写变换、密码对是否符合leet变换、密码对是否倒序、密码对是否符合顺序键、密码对是否存在公共字符串。
17、在一个可能的实施方式中,所述方法还包括:
18、将所述密码对输入至生成式预训练transformer模型中,通过所述生成式预训练transformer模型学习所述密码对之间的第二映射关系、所述密码对之间发生字符变换的位置和每个发生字符变换的位置的权重;
19、将学习完成的生成式预训练transformer模型作为所述自注意力机制的密码语言模型。
20、在一个可能的实施方式中,所述方法还包括:
21、将所述待猜测的目标密码输入至所述自注意力机制的密码语言模型中,猜测所述目标密码可能发生字符变换的多个位置,以及每个位置的权重分布;
22、基于所述权重分布确定每个位置发生字符变换的概率;
23、筛选所述概率大于预设阈值的位置作为所述目标密码可能发生字符变换的目标位置。
24、在一个可能的实施方式中,所述方法还包括:
25、对所述目标位置根据发生字符变换的概率进行排序,保留多个概率差异小于预设差异阈值的目标位置;
26、对所述多个概率差异小于预设差异阈值的目标位置的起始字符本文档来自技高网...
【技术保护点】
1.一种密码猜测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述样本用户密码数据集中的各样本用户密码数据均包括用户账户信息和所述用户账户信息对应的全部密码;
4.根据权利要求3所述的方法,其特征在于,所述基于所述密码对对生成式预训练Transformer模型进行训练,得到自注意力机制的密码语言模型,包括:
5.根据权利要求1或2所述的方法,其特征在于,所述获取待猜测的目标密码,并通过自注意力机制的密码语言模型猜测所述目标密码可能发生字符变换的目标位置,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述自注意力机制的密码语言模型在训练过程中学习的多个字符替换规则对所述目标位置的字符进行替换,得到猜测密码数据集,包括:
7.根据权利要求6所述的方法,其特征在于,所述第一映射关系包括密码猜测的覆盖率;
8.一种密码猜测装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的密码猜测方法。
...【技术特征摘要】
1.一种密码猜测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述样本用户密码数据集中的各样本用户密码数据均包括用户账户信息和所述用户账户信息对应的全部密码;
4.根据权利要求3所述的方法,其特征在于,所述基于所述密码对对生成式预训练transformer模型进行训练,得到自注意力机制的密码语言模型,包括:
5.根据权利要求1或2所述的方法,其特征在于,所述获取待猜测的目标密码,并通过自注意力机制的密码语言模型猜测所述目标密码可能发生字符变换的目标位置,包括:
6.根据权利要求5所述的方法,其...
【专利技术属性】
技术研发人员:邱卫东,袁欣雨,王杨德,唐鹏,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。