【技术实现步骤摘要】
网络安全巡检中资产确认的方法、装置、电子设备及介质
[0001]本专利技术涉及网络安全领域,更具体地,涉及一种网页信息相关性确定的方法、装置、电子设备及介质。
技术介绍
[0002]安全巡检,是通过人工的定期检查工作,来提高对服务器安全的管理。定期的巡检工作不但可以及时发现一些安全漏洞和异常,还可以及时发现一些日常管理的问题,为服务器的安全和管理措施的整改做好基础,具有非常重要的作用。
[0003]安全巡检之前首先要确认公司的网络资产范围,之后对管辖范围内的资产进行安全巡检,对于集团型企业来说,下属的分子机构非常多,并且业务范围也涉及各个领域,因此网络资产的分布非常广泛,并且这些散布的网络资产很难进行统一的登记和管理,故确认网络资产是一项必要且重要的工作。
[0004]在网络资产的确认过程中需要大规模扫描网页信息,通过分析其内容中是否含有目标公司的相关关键词,从而判断其所属IP是否为目标公司安全资产,在经过大规模的扫描之后,往往会在数据仓库中存入海量的数据,如何分析这些数据,从而筛选出公司的网络资产,是一项繁 ...
【技术保护点】
【技术特征摘要】
1.一种网络安全巡检中资产确认的方法,其特征在于,包括:确定多个已被判定为安全资产的网页信息为样本信息,生成词汇表,进而针对所述样本信息中的每一个网页信息生成词汇向量;将多个词汇向量组成矩阵,通过朴素贝叶斯算法,训练所述词汇表中的每一个特征词汇出现的条件下网页被判定为相关的条件概率;针对目标网页信息进行数据处理,获得对应的词汇向量,进而根据所述条件概率预测所述目标网页信息是否相关。2.根据权利要求1所述的网络安全巡检中资产确认的方法,其中,生成词汇表包括:通过分词算法将所述样本信息中的大写字母转换为小写,进行分词获得初始词汇表;针对所述初始词汇表进行数据清洗,生成所述词汇表。3.根据权利要求2所述的网络安全巡检中资产确认的方法,其中,针对所述初始词汇表进行数据清洗,生成所述词汇表包括:去除所述初始词汇表中重复的词、单个的英文字母、数字及标点符号,生成所述词汇表。4.根据权利要求1所述的网络安全巡检中资产确认的方法,其中,针对所述样本信息中的每一个网页信息生成词汇向量包括:针对所述样本信息中的每一个网页信息,依次判断词汇表中的特征词汇是否在该网页信息中出现,若出现,则赋值为1,若没有,则赋值为0,进而获得该网页信息对应的词汇向量。5.根据权利要求4所述的网络安全巡检中资产确认的方法,其中,所述词汇向量的长度与所述词汇表中特征词汇的数量相同。6.根据权利要求1所述的网络安全巡检中资产确认的方法,其中,通过每一个特征词汇出现的条件下网页被判定为相关的条件概率计算目标网页信息被判定为相关的条件概率。7.根据权...
【专利技术属性】
技术研发人员:吴旭,曹晶晶,才中宝,
申请(专利权)人:航天信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。