一种基于深度学习算法的口令字典生成方法技术

技术编号:18350810 阅读:194 留言:0更新日期:2018-07-02 00:17
一种基于深度学习算法的口令字典生成方法,该方法包括以下步骤:搜集常用口令字典样本;建立序贯模型,生成实例;将实例添加网络层,设置各个网络层参数;将各个网络层配置优化器和损失函数参数,编译训练模型学习过程;生成权值文件;对训练后的模型进行性能评估,确定训练达到预期效果;加载权值文件,进行模型评估,输出新的字典文件。与现有技术相比,本发明专利技术借助LSTM算法具有处理和预测时间序列中间隔和延迟非常长的特性,通过分析口令样本文件特征,生成权值文件,根据权值文件以及生成口令选项,生成新的口令字典,可以将新的字典作为样本重新输入到长短期记忆算法。不仅能够节约大量人力时间,而且处理效率大大提升,口令字典生成针对性强。

【技术实现步骤摘要】
一种基于深度学习算法的口令字典生成方法
本专利技术涉及口令字典生成
,特别涉及一种基于深度学习算法的口令字典生成方法。
技术介绍
在现代社会,随着信息化和互联网化的不断发展,用户口令作为鉴别用户身份的重要手段已经渗透到生活的方方面面,口令安全在保障个人和组织的信息安全方面有着重大的意义。口令猜测攻击是利用信息系统可以进行自动化身份验证的特点,采用手工或自动化工具多次尝试目标用户可能使用的口令,直到身份验证成功为止的一种攻击方式。口令猜测攻击最初的理论依据是由于信息系统组成口令的字符集是有限,因此只要采用穷举法的方式理论上一定能够找出正确的口令,也就是常说的暴力破解攻击。但是随着口令长度的增加,如果仅仅依靠穷举法来进行口令猜测,完成口令猜测花费的时间也会大大增加,当口令猜测花费的时间长到一定的程度时,由于无法及时获取口令或者投入过大很可能会导致攻击行为失去了原本的意义。为了解决这个问题,人们对口令猜测的结果进行了研究,发现有许多口令是经常被使用的,在进行暴力破解时如果先尝试这些口令,则有很大的可能性在较短的时间内成功完成身份验证。于是,人们将这些口令总结出来,形成一系列优先尝试的口令集合,也被称为“口令字典”。不同国家、组织、机构和个人在设置口令时,通常都有一定规律。在渗透测试工作中,为了更好检测机构网络、系统和个人主机是否存在弱口令等安全隐患,通常需要生成针对性的口令字典。在渗透测试过程中,为了生成有针对性的口令字典,通常有两种口令字典处理方式:一种是人工分析方法,渗透测试人员人工分析口令出现频率和规律,根据特征,手动添加生成新的字典;另外一种采用程序生成方式,通常采用添加词频分析、添加后缀和单词组合的方式生成字典。第一种方式针对性强,但是需要耗费大量时间,而且对于大的字典这种方式需要几周或者几个月时间。第二种方式处理速度较快,但是针对性不强,对于各种新的口令生成特征,无法检测和发现。
技术实现思路
本专利技术目的在于提供一种基于深度学习算法的口令字典生成方法,以解决现有技术中口令字典生成不能兼顾处理速度快与针对性强的技术性缺陷。本专利技术的技术方案是这样实现的:一种基于深度学习算法的口令字典生成方法,该方法包括以下步骤:1)搜集常用口令字典样本,对所述口令字典样本进行排序,排序结果为非重复的口令以及对应口令出现的次数,对于出现两次及以上的口令进行去重操作;2)将上述排序以及去重后的口令序列建立序贯模型,生成实例;3)将实例添加网络层,层的添加顺序即是各层连接的顺序,也是数据流经模型被处理的顺序,设置各个网络层参数;4)将各个网络层配置优化器和损失函数参数,编译训练模型学习过程;5)采用LSTM算法输入,输入文件是口令样本文件,通过分析口令样本文件特征,确定神经元间连接权值,生成权值文件;6)对训练后的模型进行性能评估,确定训练达到预期效果;7)加载权值文件,进行模型评估,输出新的字典文件。优选地,所述建立序贯模型包括多个网络层的线性叠加。优选地,所述搜集常用口令字典样本可搜索目标机构、单位以及个人常用的口令字典样本。优选地,完成新的字典文件后,可以将该字典文件作为步骤1)所搜索新的样本。与现有技术相比,本专利技术有以下有益效果:本专利技术的基于深度学习算法的口令字典生成方法,借助LSTM算法具有处理和预测时间序列中间隔和延迟非常长的特性,提出基于LSTM算法的口令生成方法。LSTM算法输入文件是口令样本文件,通过分析口令样本文件特征,生成权值文件,根据权值文件以及生成口令选项,生成新的口令字典,根据实际需求,可以将新的字典作为样本重新输入到长短期记忆算法。这种方法不仅能够节约大量人力时间,而且处理效率大大提升,口令字典生成针对性强。附图说明图1为本专利技术基于深度学习算法的口令字典生成方法的流程图;图2为本专利技术长短期记忆算法的逻辑运算图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术进行清楚、完整地描述。如图1所示,一种基于深度学习算法的口令字典生成方法,该方法包括以下步骤:1)搜集常用口令字典样本,对所述口令字典样本进行排序,排序结果为非重复的口令以及对应口令出现的次数,对于出现两次及以上的口令进行去重操作;2)将上述排序以及去重后的口令序列建立序贯模型,生成实例;3)将实例添加网络层,层的添加顺序即是各层连接的顺序,也是数据流经模型被处理的顺序,设置各个网络层参数;4)将各个网络层配置优化器和损失函数参数,所述损失函数用于衡量损失和错误程度,编译训练模型学习过程;5)采用LSTM算法输入,输入文件是口令样本文件,通过分析口令样本文件特征,确定神经元间连接权值,生成权值文件;6)对训练后的模型进行性能评估,确定训练达到预期效果;7)加载权值文件,进行模型评估,输出新的字典文件。所述建立序贯模型包括多个网络层的线性叠加。所述搜集常用口令字典样本可搜索目标机构、单位以及个人常用的口令字典样本。完成新的字典文件后,可以将该字典文件作为步骤1)所搜索新的样本。本专利技术采用的深度学习是一种机器学习的方法,它试图使用包含复杂结构或由多重非线性变换构成的多个处理层(神经网络)对数据进行高层抽象的算法。在深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着深度增加,节点所能识别的特征也就越来越复杂,因为每一层会整合并重组前一层的特征。长短期记忆算法是一种时间递归的深度学习算法,适合于处理和预测时间序列中间隔和延迟非常长的重要事件。所述长短期记忆算法(LongShortTermMemory-LSTM)是一种深度学习算法,包含网络中能够长时间或者短时间记忆数值的记忆单元。每个记忆单元是一个“记忆细胞”,细胞里面有输入门、遗忘门和输出门,俗称“三重门”。记忆单元包含了能够控制信息流入或者流出该单元的一些门。输入门控制什么时候新的信息可以流入记忆单元。遗忘门控制一段信息在记忆单元中存留的时间。最后,输出门控制输出何时使用记忆单元中包含的信息。记忆单元还包括控制每一个门的权重。训练算法(通常是通过时间的反向传播,反向传播算法的一种变体)基于所得到的误差来优化这些权重。如图2所示,LSTM用两个门来控制单元状态c的内容,一个是遗忘门,它决定了上一时刻的单元状态ct-1有多少保留到当前时刻;另一个是输入门,它决定了当前时刻网络的输入xt有多少保存到单元状态。LSTM用输出门来控制单元状态ct有多少输出到LSTM的当前输出值ht。Wf是遗忘门的权重矩阵,σ是sigmoid函数,输出的激活函数为tanh函数。综合本专利技术的口令字典生成方法与原理可知,本专利技术的基于深度学习算法的口令字典生成方法,借助LSTM算法具有处理和预测时间序列中间隔和延迟非常长的特性,提出基于LSTM算法的口令生成方法。LSTM算法输入文件是口令样本文件,通过分析口令样本文件特征,生成权值文件,根据权值文件以及生成口令选项,生成新的口令字典,根据实际需求,可以将新的字典作为样本重新输入到长短期记忆算法。这种方法不仅能够节约大量人力时间,而且处理效率大大提升,口令字典生成针对性强。本文档来自技高网
...
一种基于深度学习算法的口令字典生成方法

【技术保护点】
1.一种基于深度学习算法的口令字典生成方法,其特征在于:该方法包括以下步骤:1)搜集常用口令字典样本,对所述口令字典样本进行排序,排序结果为非重复的口令以及对应口令出现的次数,对于出现两次及以上的口令进行去重操作;2)将上述排序以及去重后的口令序列建立序贯模型,生成实例;3)将实例添加网络层,层的添加顺序即是各层连接的顺序,也是数据流经模型被处理的顺序,设置各个网络层参数;4)将各个网络层配置优化器和损失函数参数,编译训练模型学习过程;5)通过分析口令样本文件特征,确定神经元间连接权值,生成权值文件;6)对训练后的模型进行性能评估,确定训练达到预期效果;7)加载权值文件,进行模型评估,输出新的字典文件。

【技术特征摘要】
1.一种基于深度学习算法的口令字典生成方法,其特征在于:该方法包括以下步骤:1)搜集常用口令字典样本,对所述口令字典样本进行排序,排序结果为非重复的口令以及对应口令出现的次数,对于出现两次及以上的口令进行去重操作;2)将上述排序以及去重后的口令序列建立序贯模型,生成实例;3)将实例添加网络层,层的添加顺序即是各层连接的顺序,也是数据流经模型被处理的顺序,设置各个网络层参数;4)将各个网络层配置优化器和损失函数参数,编译训练模型学习过程;5)通过分析口令样本文件特征,确定神经元间连接权值,生成权...

【专利技术属性】
技术研发人员:孙勇曹文钊
申请(专利权)人:浙江九州量子信息技术股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1