【技术实现步骤摘要】
一种基于深度学习的漏洞场景识别方法
本专利技术涉及计算机
,具体是一种基于深度学习的漏洞场景识别方法。
技术介绍
随着计算机技术的不断发展,计算机网路的使用率也在不断上升。但是计算机网络再给人民生活带来便利的同时,计算机网络安全问题也频频发生。因此,发现网络中存在的安全隐患,对于改善计算机网络环境有着十分重要的现实意义。随着行业的发展,渗透测试逐渐在安全领域发展起来,当我们渗透过程进行漏洞检测时,需要对页面场景进行识别,便于我们后续进行更好的进行渗透。我们传统的方法是人工进行识别和进行规则匹配两种方式进行。第一种人为方式识别,通过请求URL地址,我们可以查看到相关页面,我们可以看到web页面的相关信息,然后我们根据以往经验和页面相关数据我们可以看到此URL的相关场景,首页、商品详情页、购物车页面、支付页面等信息。第二种方式是进行规则匹配进行识别,我们编写一些规则进行规则匹配相关场景页面。通过以上两种方式我们不难发现人为识别对人员能力的依赖程度特别大,受个人主观因素的影响页很大,而且效率低下。第二种编写规则需要依 ...
【技术保护点】
1.一种基于深度学习的漏洞场景识别方法,其特征在于,包含以下步骤:/nA、页面数据获取;/nB、进行特征工程;/nC、词嵌入处理;/nD、对页面内容进行卷积神经网络训练;/nE、对页面结构进行卷积神经网络训练;/nF、进入Softmax层进行分类。/n
【技术特征摘要】
1.一种基于深度学习的漏洞场景识别方法,其特征在于,包含以下步骤:
A、页面数据获取;
B、进行特征工程;
C、词嵌入处理;
D、对页面内容进行卷积神经网络训练;
E、对页面结构进行卷积神经网络训练;
F、进入Softmax层进行分类。
2.根据权利要求1所述的一种基于深度学习的漏洞场景识别方法,其特征在于,所述步骤A采用爬虫技术和人工手动收集的方式获取登录页面、修改密码页面、订单页面、支付页面等场景页面信息的数据,然后对每种页面数据进行标注,以便于后期做分类。
3.根据权利要求1所述的一种基于深度学习的漏洞场景识别方法,其特征在于,所述步骤B具体是:对获取的数数据进行清洗脏数据,对缺失值进行补全、降维等操作,然后进行网页内容和结构进行分别抽取,并统计高频词汇和低频词汇然后去除低频词汇,用以提高模型准确度,最后并把数据整理成统一格式。
4.根据权利要求1所述的一种基于深度学习的漏洞场景识别方法,其特征在于,所述步骤C使用神经网络来进行自然语言处理,创建一个词库表,并将词进行编码,其中每个词编成的号成为这个词的词向量,...
【专利技术属性】
技术研发人员:董昊辰,方仁贵,高晓辉,郭路路,何晓刚,何召阳,李克萌,刘兵,王欣宇,郗朝旭,谢鑫,赵岱翀,周欢,朱伟光,
申请(专利权)人:北京墨云科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。