【技术实现步骤摘要】
结合混合随机森林的关键信息基础设施资产识别方法
本专利技术涉及一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学
技术介绍
关键信息基础设施在国民经济和社会发展中具有举足轻重的地位,是重要的国家战略资产。因此,很多国家都十分重视对关键信息基础设施的保护,而识别认定该流量是否为关键信息基础设施是对其进行安全保护的前提,同时也是实践中的难点之一。目前为止,业界对于关键信息基础设施的识别方法,主要是基于人为标定或规则匹配的识别认定方法,取得了一定的成果,但也存在这较多问题。1.基于人为标定的识别认定方法基于人为标定的识别认定算法在关键信息基础设施定义模糊、分类标准较为宏观的时期应用较多。这一方法借助了主观评价的手段,能够减轻关键信息基础设施定义模糊对识别认定的负面影响。但是这种方法的泛化能力较弱,且效率低。2.基于规则匹配的识别认定方法规则匹配是人为标定方法的改进。根据已知关键信息基础设施的通信协议、IP、端口、域名等重要信息生成规则,再根据已有的规则对未知设施进行识别认定。这一方法能够实现对资产的自动化识别,提高了识别效率。但是由于识别 ...
【技术保护点】
1.结合混合随机森林的关键信息基础设施资产识别方法,其特征在于所述方法包括如下步骤:步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;步骤1.1,将采集到的基础设施的设备日志、网络流量等复杂数据进行清洗优化获得原始资产数据;步骤1.2,以关键字、时段节点、行为组合、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量;步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量;步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成 ...
【技术特征摘要】
1.结合混合随机森林的关键信息基础设施资产识别方法,其特征在于所述方法包括如下步骤:步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;步骤1.1,将采集到的基础设施的设备日志、网络流量等复杂数据进行清洗优化获得原始资产数据;步骤1.2,以关键字、时段节点、行为组合、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量;步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量;步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量;步骤2.1,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重;步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对特征进行多轮经验分析,得到特征的重要性权重;步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,进行关键影响因素提取,获得最终的关键特征向量;步骤3,结合混合专家模型的设施资产识别是将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;步骤3.1,初始化设定每个样本被挑选为中心概率为并设定专家模型的数量为K;步骤3.2,依样本概率挑选其中的一个样本,并通过公式赋予每个样本的权重;步骤3.3,将赋权后的样本训练擅长此识别此区域下的随机森林;步骤3.4,依据公式和更新下一次迭代中每个样本被挑选为中心样本的概率值,将其归一化;步骤3.5,判定混合专家模型数量是否达标,若...
【专利技术属性】
技术研发人员:罗森林,门元昊,潘丽敏,陈传涛,秦枭喃,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。