口令强度检测方法及装置、模型训练方法及装置制造方法及图纸

技术编号:35127215 阅读:15 留言:0更新日期:2022-10-05 09:58
本申请提供了一种口令强度检测方法及装置、模型训练方法及装置。其中,口令强度检测方法包括:确定待检测口令;利用预先训练好的口令强度检测模型,对所述待检测口令进行检测;输出检测结果;其中,所述口令强度检测模型是采用半监督方式训练得到的。半监督学习方式训练口令强度检测模型的过程,不需要花费过多的成本对数据进行标注,可以降低模型训练的成本。同时,降低因强度标准不一导致的标记数据的不一致性,提高口令强度检测模型的训练效果。利用训练好的口令强度检测模型可以对待检测口令进行较为精准的检测。测口令进行较为精准的检测。测口令进行较为精准的检测。

【技术实现步骤摘要】
口令强度检测方法及装置、模型训练方法及装置


[0001]本申请涉及数据处理
,尤其是涉及一种口令强度检测方法及装置、模型训练方法及装置。

技术介绍

[0002]随着网络技术的发展,人们的通信、娱乐等活动都越来越依赖于网络。为了保护用户的信息安全,各类软件、各大网站、数据库等都会为用户提供口令设置功能,供用户设置口令。用户可以利用自己设置的口令访问自己的账户,其他人无从知晓用户的口令,则无法访问用户的账户,从而达到限制访问的效果。
[0003]一般,口令设置功能会限制口令的长度和字符组成类型,使得用户创建的口令的复杂度提高可用性降低,从而尽量提升口令被破解的难度。同时,设置一些口令强度检测方法来检测用户创建口令的强度,以便于发现强度过低的口令时提示用户进行修改。
[0004]但是,复杂度高的口令同样也会提升用户的记忆难度。因此,很多用户为了方便记忆会使用规避策略,创建和自身信息相关的口令,或者包含顺序字符、重复字符等固定模式的口令。一旦用户信息被他人掌握,则很容易破解用户口令。所以,这种口令的强度实际上并不高。但是,目前使用的口令强度检测方法的准确性比较低,会误将此类口令识别为高强度口令,允许口令创建成功,从而造成弱口令漏洞,提升用户口令被破解的风险。

技术实现思路

[0005]本申请提供一种口令强度检测方法及装置、模型训练方法及装置,提升口令强度检测的准确度。
[0006]第一方面,本申请提供一种口令强度检测方法,包括:确定待检测口令;利用预先训练好的口令强度检测模型,对所述待检测口令进行检测;输出检测结果;其中,所述口令强度检测模型是采用半监督方式训练得到的。
[0007]可选的,所述口令强度检测模型的训练过程,包括:确定第一有标签样本数据、无标签样本数据、预设训练次数;基于所述第一有标签样本数据,对所述SVM分类器进行预训练,更新所述SVM分类器;循环执行如下步骤,直至达到所述训练次数:利用更新后的所述SVM分类器,对所述无签样本数据进行分类;将分类置信度高于预设置信度阈值的无签样本数据,确定为第二有标签样本数据;基于所述第一有标签样本数据、所述第二有标签样本数据,对更新后的所述SVM分类器进行训练,更新所述SVM分类器。
[0008]可选的,在所述基于所述第一有标签样本数据,对所述SVM分类器进行预训练,更新所述SVM分类器之后,所述方法还包括:根据所述第一有标签样本数据,从无标签样本数据中确定候选样本数据,所述候选样本数据与所述第一有标签样本数据的特征相似度大于预设阈值;所述利用更新后的所述SVM分类器,对所述无签样本数据进行分类,包括:利用更新后的所述SVM分类器,对所述候选样本数据进行分类;所述将分类置信度高于预设置信度阈值的无签样本数据,确定为第二有标签样本数据,包括:将分类置信度大于预设置信度阈值的候选样本数据,确定为第二有标签样本数据。
[0009]可选的,所述根据所述第一有标签样本数据,从无标签样本数据中确定候选样本数据,所述候选样本数据与所述第一有标签样本数据的特征相似度大于预设阈值,包括:基于样本的标签,利用半监督模糊c均值算法SFCM模型对所述第一有标签样本数据进行半监督聚类,得到若干类样本数据;针对每一类样本数据,确定所述类样本数据对应的聚类中心;针对每一聚类中心,确定所述无标签样本数据对所述聚类中心的隶属度;针对每一聚类中心,将对所述聚类中心的隶属度大于预设隶属度阈值的无标签样本数据,确定为候选样本数据。
[0010]可选的,所述基于所述第一有标签样本数据,对所述SVM分类器进行预训练,包括:确定所述第一有标签样本数据对应的特征属性;利用所述第一有标签样本数据对应的特征属性,对所述SVM分类器进行预训练。
[0011]可选的,所述第一有标签样本数据对应的特征属性包括如下至少一项:口令长度、字符类型数、不同字符个数、字符组合种类变化次数、口令中字符所属的类别值总和、口令中顺序字符个数、口令中键盘字符个数、口令中重复字符个数、口令是否包含英文单词、是否包含中文词汇的拼音及变体、N

gram词频特征。
[0012]第二方面,本申请提供一种模型训练方法,包括:确定第一有标签样本数据、无标签样本数据、预设训练次数;基于所述第一有标签样本数据,对所述SVM分类器进行预训练,更新所述SVM分类器;循环执行如下步骤,直至达到所述训练次数:利用更新后的所述SVM分类器,对所述无签样本数据进行分类;将分类置信度高于预设置信度阈值的无签样本数据,确定为第二有标签样本数据;基于所述第一有标签样本数据、所述第二有标签样本数据,对更新后的所述SVM分类器进行训练,更新所述SVM分类器。
[0013]可选的,在所述基于所述第一有标签样本数据,对所述SVM分类器进行预训练,更新所述SVM分类器之后,所述方法还包括:根据所述第一有标签样本数据,从无标签样本数据中确定候选样本数据,所述候选样本数据与所述第一有标签样本数据的特征相似度大于预设阈值;
所述利用更新后的所述SVM分类器,对所述无签样本数据进行分类,包括:利用更新后的所述SVM分类器,对所述候选样本数据进行分类;所述将分类置信度高于预设置信度阈值的无签样本数据,确定为第二有标签样本数据,包括:将分类置信度大于预设置信度阈值的候选样本数据,确定为第二有标签样本数据。
[0014]可选的,所述根据所述第一有标签样本数据,从无标签样本数据中确定候选样本数据,所述候选样本数据与所述第一有标签样本数据的特征相似度大于预设阈值,包括:基于样本的标签,利用半监督模糊c均值算法SFCM模型对所述第一有标签样本数据进行半监督聚类,得到若干类样本数据;针对每一类样本数据,确定所述类样本数据对应的聚类中心;针对每一聚类中心,确定所述无标签样本数据对所述聚类中心的隶属度;针对每一聚类中心,将对所述聚类中心的隶属度大于预设隶属度阈值的无标签样本数据,确定为候选样本数据。
[0015]可选的,所述基于所述第一有标签样本数据,对所述SVM分类器进行预训练,包括:确定所述第一有标签样本数据对应的特征属性;利用所述第一有标签样本数据对应的特征属性,对所述SVM分类器进行预训练。
[0016]可选的,所述第一有标签样本数据对应的特征属性包括如下至少一项:口令长度、字符类型数、不同字符个数、字符组合种类变化次数、口令中字符所属的类别值总和、口令中顺序字符个数、口令中键盘字符个数、口令中重复字符个数、口令是否包含英文单词、是否包含中文词汇的拼音及变体、N

gram词频特征。
[0017]第三方面,本申请提供一种口令强度检测装置,包括:待检测口令确定模块,用于确定待检测口令;强度检测模块,用于利用预先训练好的口令强度检测模型,对所述待检测口令进行检测;检测结果输出模块,用于输出检测结果;其中,所述口令强度检测模型是采用半监督方式训练得到的。
[0018]可选的,所述口令强度检测装置还包括模型训练模块,用于:确定第一有标签样本数据、无标签样本数据、预设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种口令强度检测方法,其特征在于,包括:确定待检测口令;利用预先训练好的口令强度检测模型,对所述待检测口令进行检测;输出检测结果;其中,所述口令强度检测模型是采用半监督方式训练得到的。2.根据权利要求1所述的方法,其特征在于,所述口令强度检测模型的训练过程,包括:确定第一有标签样本数据、无标签样本数据、预设训练次数;基于所述第一有标签样本数据,对所述SVM分类器进行预训练,更新所述SVM分类器;循环执行如下步骤,直至达到所述训练次数:利用更新后的所述SVM分类器,对所述无签样本数据进行分类;将分类置信度高于预设置信度阈值的无签样本数据,确定为第二有标签样本数据;基于所述第一有标签样本数据、所述第二有标签样本数据,对更新后的所述SVM分类器进行训练,更新所述SVM分类器。3.根据权利要求2所述的方法,其特征在于,在所述基于所述第一有标签样本数据,对所述SVM分类器进行预训练,更新所述SVM分类器之后,所述方法还包括:根据所述第一有标签样本数据,从无标签样本数据中确定候选样本数据,所述候选样本数据与所述第一有标签样本数据的特征相似度大于预设阈值;所述利用更新后的所述SVM分类器,对所述无签样本数据进行分类,包括:利用更新后的所述SVM分类器,对所述候选样本数据进行分类;所述将分类置信度高于预设置信度阈值的无签样本数据,确定为第二有标签样本数据,包括:将分类置信度大于预设置信度阈值的候选样本数据,确定为第二有标签样本数据。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一有标签样本数据,从无标签样本数据中确定候选样本数据,所述候选样本数据与所述第一有标签样本数据的特征相似度大于预设阈值,包括:基于样本的标签,利用半监督模糊c均值算法SFCM模型对所述第一有标签样本数据进行半监督聚类,得到若干类样本数据;针对每一类样本数据,确定所述类样本数据对应的聚类中心;针对每一聚类中心,确定所述无标签样本数据对所述聚类中心的隶属度;针对每一聚类中心,将对所述聚类中心的隶属度大于预设隶属度阈值的无标签样本数据,确定为候选样本数据。5.根据权利要求2

4任一项所述的方法,其特征在于,所述基于所述第一有标签样本数据,对所述SVM分类器进行预训练,包括:...

【专利技术属性】
技术研发人员:刘全明王娟马超于娟娟李金美王齐
申请(专利权)人:山西晋信安科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1