【技术实现步骤摘要】
指纹识别方法、设备和存储介质
本公开涉及网络安全领域,尤其涉及指纹识别方法、设备和存储介质。
技术介绍
在web渗透过程中,web指纹是信息收集中非常重要的一个环节。目前,大部分的指纹提取更多的是通过规则匹配或者技术人员自己的经验进行判断,规则匹配导致其指纹的准确性不高,而人工维护使得人力成本的大大增加。
技术实现思路
本公开实施例提供一种web指纹识别方法、设备和存储介质,能够自动化进行指纹提取,提高指纹识别的准确度,降低人工成本。所述技术方案如下:根据本公开实施例的第一方面,提供一种指纹识别方法,该方法包括:获取目标网页的网址信息,网址信息包括目标网页的URL;通过网络爬虫对目标网页的网址信息进行爬取,获取目标网页的目标特征信息;获取目标特征信息的目标权重;在目标特征信息的目标权重满足预设条件时,将目标特征信息确定为目标网页的指纹信息。本公开实施例利用爬虫技术爬取流量后进行特征提取计算得到目标特征信息的权重值,对权重值进行提纯验证等操作,实现自动化指纹提 ...
【技术保护点】
1.一种指纹识别方法,其特征在于,所述方法包括:/n获取目标网页的网址信息,所述网址信息包括所述目标网页的URL;/n通过网络爬虫对所述目标网页的网址信息进行爬取,获取所述目标网页的目标特征信息;/n获取所述目标特征信息的目标权重;/n在所述目标特征信息的目标权重满足预设条件时,将所述目标特征信息确定为所述目标网页的指纹信息。/n
【技术特征摘要】
1.一种指纹识别方法,其特征在于,所述方法包括:
获取目标网页的网址信息,所述网址信息包括所述目标网页的URL;
通过网络爬虫对所述目标网页的网址信息进行爬取,获取所述目标网页的目标特征信息;
获取所述目标特征信息的目标权重;
在所述目标特征信息的目标权重满足预设条件时,将所述目标特征信息确定为所述目标网页的指纹信息。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标特征信息的目标权重包括:
根据所述目标特征信息和预设的目标特征库,获取所述目标特征信息的全局权重和应用权重;
根据所述目标特征信息的全局权重和应用权重,计算得到所述目标特征信息的目标权重。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标特征信息和预设的目标特征库,获取所述目标特征信息的全局权重和应用权重包括:
判断所述目标特征库中是否包含所述目标特征信息;
在所述目标特征库中未包含所述目标特征信息时,将预设的初始全局权重确定为所述目标特征信息的全局权重,将预设的初始应用权重确定为所述目标特征信息的应用权重;
在所述目标特征库中包含所述目标特征信息时,将所述目标特征信息在所述目标特征库所占的比例确定为所述目标特征信息的全局权重,将在原始应用权重的基础上增加预设步长后确定为所述目标特征信息的应用权重,所述原始应用权重用于指示上一次所述目标特征信息的应用权重。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标特征信息的全局权重和应用权重,计算得到所述目标特征信息的目标权重包括:
从所述目标特征库中获取与目标特征信息所关联的应用下所有特征信息的应用权重总和;
根据所述目标特征信息的应用权重M和所述与目标特征信息所关联的应用下所有特征信息的应用权重总和N,利用第一公式和第二公式计算得到第一参数TF和第二参数IDF;
根据所述第一参数TF、第二参数IDF和所述目标网页的全局权重P,利用第三公式计算得到所述目标特征信息的目标权重Q;
其中,所述第一公式为:TF=M/N,所述第二公式为:所述第三公式为:Q...
【专利技术属性】
技术研发人员:陈毅聪,刘浩杰,李宇欣,
申请(专利权)人:西安四叶草信息技术有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。