一种信息资产识别方法及装置制造方法及图纸

技术编号:19822519 阅读:21 留言:0更新日期:2018-12-19 14:57
本发明专利技术公开了一种信息资产识别方法及装置,该方法包括:获取信息系统中每一逻辑实体的资产特征数据;根据资产特征数据,确定训练样本集合,训练样本集合中的每一样本对应唯一的逻辑实体;采用训练样本集合对机器学习模型进行训练,以得到信息系统资产识别分类模型;在更新周期到来时,获取信息系统中每一目标逻辑实体的目标资产特征数据;根据目标资产特征数据,由信息系统资产识别分类模型确定每一目标逻辑实体的分类。相对于现有技术,本实施例的方案不仅不用人工统计,而且能对逻辑层面中的资产进行识别。

【技术实现步骤摘要】
一种信息资产识别方法及装置
本专利技术涉及计算机安全
和机器学习
,特别是涉及一种信息资产识别方法及装置。
技术介绍
信息安全风险评估是信息系统建设和运维过程中不可或缺的一部分。而信息资产的识别是信息安全风险评估所要解决的首要问题。现有的信息资产识别方法主要通过人工统计或在信息系统中附着大量额外设备来实现。虽然通过人工统计的方法可以对信息系统进行较全面的资产识别,但考虑其中加入了人的因素,故该方法需要消耗大量的时间和人力资源,资产识别结果的更新时间较长,而且受统计人员素质能力等因素的限制,逻辑层面的资产识别结果往往存在一些错误或遗漏,主观性过强。而通过在信息系统中附着额外设备来完成信息系统资产识别的方法,同样存在无法在逻辑层面实现对系统中资产的识别的问题。
技术实现思路
为解决上述技术问题,本专利技术实施例提供了一种信息资产识别的方法及装置,技术方案如下:一种信息资产识别方法,包括:获取信息系统中每一逻辑实体的资产特征数据,所述资产特征数据包括系统指纹、网络指纹和虚拟身份信息;根据所述资产特征数据,确定训练样本集合,所述训练样本集合中的每一样本对应唯一的所述逻辑实体,所述每一样本包括由与该样本对应的逻辑实体的分类和资产特征数据构成的特征集合;采用所述训练样本集合对机器学习模型进行训练,以得到信息系统资产识别分类模型;在更新周期到来时,获取所述信息系统中每一目标逻辑实体的目标资产特征数据;根据所述目标资产特征数据,由所述信息系统资产识别分类模型确定所述每一目标逻辑实体的分类。优选地,所述根据所述资产特征数据,确定训练样本集合,包括:对于所述每一逻辑实体,将所述资产特征数据聚合成特征集合,并获得人工标注的每一逻辑实体的分类;生成样本集合,其中每个逻辑实体的特征集合与其关联的分类构成所述样本集合中的一个样本;从所述样本集合中随机确定部分样本作为所述训练样本集合。优选地,所述样本集合中除所述训练样本集合之外的样本构成测试样本集合;所述采用所述训练样本集合对机器学习模型进行训练,以得到信息系统资产识别分类模型之后,还包括:对于所述测试样本集合中的每一测试样本,判断所述信息系统资产识别分类模型根据所述测试样本中的特征集合输出的结果是否与所述测试样本中的分类一致;若否,利用所述样本集合,重新确定训练样本集合,并以重新确定的训练样本集合代替所述训练样本集合、返回执行采用所述训练样本集合对机器学习模型进行训练,以得到信息系统资产识别分类模型的步骤。优选地,还包括:依据分类结果,判断是否存在不能确定分类的目标逻辑实体,所述分类结果为所述信息系统资产识别分类模型根据所述目标资产特征数据所确定的所述每一目标逻辑实体的分类的结果;若是,接收用户对所述不能确定分类的目标逻辑实体的目标分类的标注;以所述不能确定分类的目标逻辑实体的资产特征数据和目标分类构成的样本更新所述样本集合,并以更新后的样本集合替代样本集合,并返回执行从所述样本集合中随机确定部分样本作为所述训练样本集合的步骤。优选地,所述获取信息系统中每一逻辑实体的资产特征数据之后,还包括:获取所述每一逻辑实体的第一属性和第二属性,所述第一属性包括所述资产特征数据、所述逻辑实体的分类、IP地址、MAC地址、端口信息索引表,所述第二属性包括源IP地址、目的IP地址、源端口号、目的端口号、协议类型、信息系统逻辑实体模型单元索引表;利用所述第一属性建立与所述每一逻辑实体对应的信息系统逻辑实体模型单元,同时利用所述第二属性建立信息系统逻辑实体关系模型单元,所述信息系统逻辑实体关系模型单元用于描述所述信息系统逻辑实体模型单元索引表中的不同信息系统逻辑实体模型单元索引对应的信息系统逻辑实体模型单元之间的连接关系。优选地,还包括:获取所述目标逻辑实体的第一属性;利用所述目标逻辑实体的第一属性和所述逻辑实体的第一属性,实现所述目标逻辑实体与所述逻辑实体的比对,得到比对结果;当所述比对结果表示所述目标逻辑实体为新增加的逻辑实体时,根据所述目标逻辑实体的第一属性建立对应的信息系统逻辑实体模型单元,并利用所述目标逻辑实体的第一属性中的网络通信情况建立对应的信息系统逻辑实体关系模型单元;当所述比对结果表示所述目标逻辑实体为所述信息系统中删除的逻辑实体时,删除与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元,或标记与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元。优选地,所述利用所述目标逻辑实体的第一属性和所述逻辑实体的第一属性,实现所述目标逻辑实体与所述逻辑实体的比对,得到比对结果,包括:对于每一所述目标逻辑实体,将所述目标逻辑实体的第一属性逐一与每一所述逻辑实体的第一属性进行比对,以判断是否存在与所述目标逻辑实体具有完全相同的第一属性的逻辑实体;若否,则表明所述目标逻辑实体为所述新增加的逻辑实体;判断是否已完成对所有所述目标逻辑实体的比对;若是,判断所有所述逻辑实体中是否存在与任一所述目标逻辑实体的第一属性不完全相同的逻辑实体;若是,表明所述与任一所述目标逻辑实体的第一属性不完全相同的逻辑实体为所述信息系统中删除的逻辑实体。优选地,所述利用所述第一属性建立与所述每一逻辑实体对应的信息系统逻辑实体模型单元,同时利用所述第二属性建立信息系统逻辑实体关系模型单元之后,还包括:根据所述信息系统逻辑实体模型单元和所述信息系统逻辑实体关系模型单元建立信息系统资产清单;相应地,所述在根据所述目标逻辑实体的第一属性建立对应的信息系统逻辑实体模型单元,并利用所述目标逻辑实体的第一属性中的网络通信情况建立对应的信息系统逻辑实体关系模型单元之后,还包括:将与所述目标逻辑实体的第一属性对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元增加至所述信息系统资产清单中;所述删除与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元,包括:删除所述信息系统资产清单中的、与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元;所述标记与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元,包括:在所述信息资产清单中标记与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元。优选地,所述利用所述第一属性建立与所述每一逻辑实体对应的信息系统逻辑实体模型单元,同时利用所述第二属性建立信息系统逻辑实体关系模型单元之前,还包括:预先建立信息系统资产清单;相应地,所述利用所述第一属性建立与所述每一逻辑实体对应的信息系统逻辑实体模型单元,同时利用所述第二属性建立信息系统逻辑实体关系模型单元之后,还包括:将所述信息系统逻辑实体模型单元和所述信息系统逻辑实体关系模型单元增加至所述信息系统资产清单中;相应地,所述在根据所述目标逻辑实体的第一属性建立对应的信息系统逻辑实体模型单元,并利用所述目标逻辑实体的第一属性中的网络通信情况建立对应的信息系统逻辑实体关系模型单元之后,还包括:将与所述目标逻辑实体的第一属性对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元增加至所述信息系统资产清单中;所述删除与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模本文档来自技高网...

【技术保护点】
1.一种信息资产识别方法,其特征在于,包括:获取信息系统中每一逻辑实体的资产特征数据,所述资产特征数据包括系统指纹、网络指纹和虚拟身份信息;根据所述资产特征数据,确定训练样本集合,所述训练样本集合中的每一样本对应唯一的所述逻辑实体,所述每一样本包括由与该样本对应的逻辑实体的分类和资产特征数据构成的特征集合;采用所述训练样本集合对机器学习模型进行训练,以得到信息系统资产识别分类模型;在更新周期到来时,获取所述信息系统中每一目标逻辑实体的目标资产特征数据;根据所述目标资产特征数据,由所述信息系统资产识别分类模型确定所述每一目标逻辑实体的分类。

【技术特征摘要】
1.一种信息资产识别方法,其特征在于,包括:获取信息系统中每一逻辑实体的资产特征数据,所述资产特征数据包括系统指纹、网络指纹和虚拟身份信息;根据所述资产特征数据,确定训练样本集合,所述训练样本集合中的每一样本对应唯一的所述逻辑实体,所述每一样本包括由与该样本对应的逻辑实体的分类和资产特征数据构成的特征集合;采用所述训练样本集合对机器学习模型进行训练,以得到信息系统资产识别分类模型;在更新周期到来时,获取所述信息系统中每一目标逻辑实体的目标资产特征数据;根据所述目标资产特征数据,由所述信息系统资产识别分类模型确定所述每一目标逻辑实体的分类。2.根据权利要求1所述的方法,其特征在于,所述根据所述资产特征数据,确定训练样本集合,包括:对于所述每一逻辑实体,将所述资产特征数据聚合成特征集合,并获得人工标注的每一逻辑实体的分类;生成样本集合,其中每个逻辑实体的特征集合与其关联的分类构成所述样本集合中的一个样本;从所述样本集合中随机确定部分样本作为所述训练样本集合。3.根据权利要求2所述的方法,其特征在于,所述样本集合中除所述训练样本集合之外的样本构成测试样本集合;所述采用所述训练样本集合对机器学习模型进行训练,以得到信息系统资产识别分类模型之后,还包括:对于所述测试样本集合中的每一测试样本,判断所述信息系统资产识别分类模型根据所述测试样本中的特征集合输出的结果是否与所述测试样本中的分类一致;若否,利用所述样本集合,重新确定训练样本集合,并以重新确定的训练样本集合代替所述训练样本集合、返回执行采用所述训练样本集合对机器学习模型进行训练,以得到信息系统资产识别分类模型的步骤。4.根据权利要求2所述的方法,其特征在于,还包括:依据分类结果,判断是否存在不能确定分类的目标逻辑实体,所述分类结果为所述信息系统资产识别分类模型根据所述目标资产特征数据所确定的所述每一目标逻辑实体的分类的结果;若是,接收用户对所述不能确定分类的目标逻辑实体的目标分类的标注;以所述不能确定分类的目标逻辑实体的资产特征数据和目标分类构成的样本更新所述样本集合,并以更新后的样本集合替代样本集合,并返回执行从所述样本集合中随机确定部分样本作为所述训练样本集合的步骤。5.根据权利要求1所述的方法,其特征在于,所述获取信息系统中每一逻辑实体的资产特征数据之后,还包括:获取所述每一逻辑实体的第一属性和第二属性,所述第一属性包括所述资产特征数据、所述逻辑实体的分类、IP地址、MAC地址、端口信息索引表,所述第二属性包括源IP地址、目的IP地址、源端口号、目的端口号、协议类型、信息系统逻辑实体模型单元索引表;利用所述第一属性建立与所述每一逻辑实体对应的信息系统逻辑实体模型单元,同时利用所述第二属性建立信息系统逻辑实体关系模型单元,所述信息系统逻辑实体关系模型单元用于描述所述信息系统逻辑实体模型单元索引表中的不同信息系统逻辑实体模型单元索引对应的信息系统逻辑实体模型单元之间的连接关系。6.根据权利要求5所述的方法,其特征在于,还包括:获取所述目标逻辑实体的第一属性;利用所述目标逻辑实体的第一属性和所述逻辑实体的第一属性,实现所述目标逻辑实体与所述逻辑实体的比对,得到比对结果;当所述比对结果表示所述目标逻辑实体为新增加的逻辑实体时,根据所述目标逻辑实体的第一属性建立对应的信息系统逻辑实体模型单元,并利用所述目标逻辑实体的第一属性中的网络通信情况建立对应的信息系统逻辑实体关系模型单元;当所述比对结果表示所述目标逻辑实体为所述信息系统中删除的逻辑实体时,删除与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元,或标记与所述目标逻辑实体对应的信息系统逻辑实体模型单元和信息系统逻辑实体关系模型单元。7.根据权利要求6所述的方法,其特征在于,所述利用所述目标逻辑实体的第一属性和所述逻辑实体的第一属性,实现所述目标逻辑实体...

【专利技术属性】
技术研发人员:胡卫华刘照辉冯永胜偰赓张磊杨宇晨张利易锦彭勇刘遥孟祥杰
申请(专利权)人:中国信息安全测评中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1