模型训练、网站安全检测方法、装置以及存储介质制造方法及图纸

技术编号:38757711 阅读:11 留言:0更新日期:2023-09-10 09:42
本公开提供了一种模型训练、网站安全检测方法、装置以及存储介质,其中的模型训练方法包括:基于网站路径向量获得多个路径样本向量、与各个路径样本向量相对应的输出字符向量;根据路径样本向量以及输出字符向量生成训练样本集;使用训练样本集对网站路径预测模型进行训练;根据网站路径预测模型的损失函数对网站路径预测模型进行调整处理。本公开通过网站路径预测模型自动获得网站路径,并通过灵活使用域名变更方法生成网站路径,可以自动生成网站路径,降低人工收集网站路径的工作量,提高了对于网站路径的发现能力,增强对于敏感网站路径等识别的准确性和时效性,提高了防渗透测试的效率和准确性,提高了网站安全。提高了网站安全。提高了网站安全。

【技术实现步骤摘要】
模型训练、网站安全检测方法、装置以及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种模型训练、网站安全检测方法、装置以及存储介质。

技术介绍

[0002]随着信息化技术的快速发展以及网站的增多,网站的安全问题也越来越重要。在网站站点上线之前,需要网络安全人员对此网站站点进行防渗透测试。在进行防渗透测试时,需要对网站路径进行扫描,用于防止非网络维护人员等通过访问网站站点的/admin、/manage、/user等网站路径获取配置文件、网站的源代码等重要信息,引发安全隐患。目前,网站路径通过访问路径库获得,如果路径库内的路径较少,则进行防渗透测试的结果不理想,降低了网站运行的安全性;并且,收集网站路径需要大量人工参与,工作量大并且效率低。

技术实现思路

[0003]有鉴于此,本专利技术要解决的一个技术问题是提供一种模型训练、网站安全检测方法、装置以及存储介质。
[0004]根据本公开的第一方面,提供一种模型训练方法,包括:基于网站路径向量获得多个路径样本向量、与各个路径样本向量相对应的输出字符向量;根据所述路径样本向量以及所述输出字符向量生成训练样本集;使用所述训练样本集对网站路径预测模型进行训练;根据所述网站路径预测模型的损失函数对所述网站路径预测模型进行调整处理。
[0005]可选地,获取网站路径信息并进行向量化处理,获得所述网站路径向量。
[0006]可选地,所述获取网站路径信息包括:从网站路径文件中获取包含有多个网站路径的路径文本信息;在所述多个网站路径之间设置有替换目标符号的情况下,在所述路径文本信息中使用目标替代字符对所述替换目标符号进行替换处理;从所述路径文本信息中提取包含有预设数量的网站路径的字符串,作为所述网站路径信息。
[0007]可选地,所述替换目标符号包括:换行符号或回车符号;所述目标替换字符包括:路径隔离字符。
[0008]可选地,所述基于网站路径向量获得多个路径样本向量、与各个路径样本向量相对应的输出字符向量包括:根据预设的样本字符数量对所述网站路径向量进行划分处理,获得多个所述路径样本向量;在所述网站路径向量中,获得所述路径样本向量的下一个字符所对应的字符向量,作为所述输出字符向量。
[0009]可选地,所述网站路径预测模型包括:长短期记忆LSTM网络模型。
[0010]根据本公开的第二方面,提供一种网站安全检测方法,包括:获取训练好的网站路径预测模型;其中,所述网站路径预测模型是通过权利如上所述的模型训练方法训练得到;使用所述网站路径预测模型获得第一网站检测路径;根据目标网站网址以及文件格式信息,生成第二网站检测路径;基于所述第一网站检测路径和所述第二网站检测路径,对目标
网站进行安全检测处理。
[0011]可选地,所述使用所述网站路径预测模型获得第一网站检测路径包括:使用所述网站路径预测模型获得具有预设长度的地址信息字符串;其中,所述地址信息字符串包含有多个第一网站检测路径;将所述地址信息字符串内的目标替代字符替换为替换目标符号,用以分隔所述多个第一网站检测路径。
[0012]可选地,所述根据目标网站网址以及文件格式信息,生成第二网站检测路径包括:从所述目标网站网址中提取域名信息;根据域名格式变换规则并基于所述域名信息,获得多个检测域名;将所述检测域名与所述文件格式信息进行拼接处理,生成所述第二网站检测路径。
[0013]可选地,所述基于所述第一网站检测路径和所述第二网站检测路径,对目标网站进行安全检测处理包括:根据所述第一网站检测路径和所述第二网站检测路径生成检测URL;基于所述检测URL模拟页面请求;向所述目标网站发送所述页面请求;根据所述目标网站对于所述页面请求的响应信息,确定对所述目标网站进行安全检测处理的结果。
[0014]根据本公开的第三方面,提供一种模型训练装置,包括:路径处理模块,用于基于网站路径向量获得多个路径样本向量、与各个路径样本向量相对应的输出字符向量;样本获取模块,用于根据所述路径样本向量以及所述输出字符向量生成训练样本集;训练处理模块,用于使用所述训练样本集对网站路径预测模型进行训练;模型调整模块,用于根据所述网站路径预测模型的损失函数对所述网站路径预测模型进行调整处理。
[0015]根据本公开的第四方面,提供一种模型训练装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的模型训练方法。
[0016]根据本公开的第五方面,提供一种网站安全检测装置,包括:模型获取模块,用于获取训练好的网站路径预测模型;其中,所述网站路径预测模型是通过如上所述的模型训练方法训练得到;第一路径获得模块,用于使用所述网站路径预测模型获得第一网站检测路径;第二路径获得模块,用于根据目标网站网址以及文件格式信息,生成第二网站检测路径;检测处理模块,用于基于所述第一网站检测路径和所述第二网站检测路径,对目标网站进行安全检测处理。
[0017]根据本公开的第六方面,提供一种网站安全检测装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的网站安全检测方法。
[0018]根据本公开的第七方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行如上所述的方法。
[0019]本公开的模型训练、网站安全检测方法、装置以及存储介质,通过网站路径预测模型自动获得网站路径,并通过灵活使用域名变更方法生成网站路径,可以自动生成网站路径,降低人工收集网站路径的工作量,提高了对于网站路径的发现能力,增强对于敏感网站路径等识别的准确性和时效性,提高了防渗透测试的效率和准确性,增强了漏洞防御机制,提高了网站安全,实现提前规避风险、降低业务损失,提高了用户使用感受。
附图说明
[0020]通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。下面结合具体的实施例,并参照附图,对本公开的上述和其它目的和优点做进一步的描述。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。
[0021]图1为根据本公开的模型训练方法的一个实施例的流程示意图;
[0022]图2为根据本公开的模型训练方法的一个实施例中的获得网站路径信息的流程示意图;
[0023]图3为根据本公开的网站安全检测方法的一个实施例的流程示意图;
[0024]图4为根据本公开的网站安全检测方法的一个实施例中的进行安全检测的流程示意图;
[0025]图5为根据本公开的模型训练装置的一个实施例的模块示意图;
[0026]图6为根据本公开的模型训练装置的另一个实施例的模块示意图;
[0027]图7为根据本公开的模型训练装置的又一个实施例的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:基于网站路径向量获得多个路径样本向量、与各个路径样本向量相对应的输出字符向量;根据所述路径样本向量以及所述输出字符向量生成训练样本集;使用所述训练样本集对网站路径预测模型进行训练;根据所述网站路径预测模型的损失函数对所述网站路径预测模型进行调整处理。2.如权利要求1所述的方法,还包括:获取网站路径信息并进行向量化处理,获得所述网站路径向量。3.如权利要求1所述的方法,所述获取网站路径信息包括:从网站路径文件中获取包含有多个网站路径的路径文本信息;在所述多个网站路径之间设置有替换目标符号的情况下,在所述路径文本信息中使用目标替代字符对所述替换目标符号进行替换处理;从所述路径文本信息中提取包含有预设数量的网站路径的字符串,作为所述网站路径信息。4.如权利要求3所述的方法,其中,所述替换目标符号包括:换行符号或回车符号;所述目标替换字符包括:路径隔离字符。5.如权利要求1所述的方法,所述基于网站路径向量获得多个路径样本向量、与各个路径样本向量相对应的输出字符向量包括:根据预设的样本字符数量对所述网站路径向量进行划分处理,获得多个所述路径样本向量;在所述网站路径向量中,获得所述路径样本向量的下一个字符所对应的字符向量,作为所述输出字符向量。6.如权利要求1至5任一项所述的方法,其中,所述网站路径预测模型包括:长短期记忆LSTM网络模型。7.一种网站安全检测方法,包括:获取训练好的网站路径预测模型;其中,所述网站路径预测模型是通过权利要求1至6中任一项所述的模型训练方法训练得到;使用所述网站路径预测模型获得第一网站检测路径;根据目标网站网址以及文件格式信息,生成第二网站检测路径;基于所述第一网站检测路径和所述第二网站检测路径,对目标网站进行安全检测处理。8.如权利要求7所述的方法,所述使用所述网站路径预测模型获得第一网站检测路径包括:使用所述网站路径预测模型获得具有预设长度的地址信息字符串;其中,所述地址信息字符串包含有多个第一网站检测路径;将所述地址信息字符串内的目标替代字符替换为替换目标符号,用以分隔所述多个第一网站检测路径。9.如权利要求7...

【专利技术属性】
技术研发人员:张道全王玉琪韩永根刘寅生吴涛
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1