基于层次学习的跨架构漏洞挖掘方法技术

技术编号:23628744 阅读:80 留言:0更新日期:2020-03-31 23:55
本发明专利技术属于网络信息安全技术领域,特别涉及一种基于层次学习的跨架构漏洞挖掘方法,包含:获取训练样本数据;构建层次学习模型;并对层次学习模型进行克隆,得到克隆版层次学习模型;将训练样本数据函数对特征信息分别输入层次学习模型和克隆版层次学习模型进行模型训练学习,并计算两者获取的函数特征高维向量表示的相似度,依据相似标签判定调整层次模型参数和权重,以获取用于目标函数漏洞挖掘的层次模型;针对目标函数,提取作为层次模型输入的函数特征信息和函数调用关系,通过训练学习后的层次模型完成目标函数漏洞挖掘。本发明专利技术通过两级机器学习和丰富特征提取极大提升大规模漏洞搜索工作的效率和精度,对网络信息安全具有重要的指导意义。

【技术实现步骤摘要】
基于层次学习的跨架构漏洞挖掘方法
本专利技术属于网络信息安全
,特别涉及一种基于层次学习的跨架构漏洞挖掘方法。
技术介绍
Genius从控制流程图中学习高级特征表示,并将该图编码为嵌入(即高维数值向量)。Genius使用图匹配算法对相似的函数进行聚类,以在跨体系结构的不同编译环境中提取CFG的稳健特征,从而生成码本,并根据该码本生成函数嵌入;然后,建立固件数据库和漏洞功能数据库,并将LSH(局部敏感哈希)用于大规模漏洞搜索;嵌入生成效率不高,此外,Genius的搜索精度不足以满足数百万个固件中的大规模漏洞搜索工作。Gemini提出了一种基于深度神经网络来生成用于相似性检测的二进制函数的嵌入的方法,这在一定程度上提高了准确性和效率,Gemini提取跨架构的函数的健壮特征,并将提取的基本块级特征和CFG结构的表示提供给DNN模型;通过Structure2Vec的多层迭代,基本块节点特征被传播到与其相关的其他节点,并且所有基本块节点的表示被聚合以生成函数的高维向量表示;但其并没有克服Genius基于CFG图的匹配方法的局限性,未充分考虑不同编译选项对C本文档来自技高网...

【技术保护点】
1.一种基于层次学习的跨架构漏洞挖掘方法,其特征在于,包含如下内容:/n通过反汇编获取二进制函数对应的汇编程序,并对汇编程序中的汇编函数通过图形描述提取函数特征信息和函数调用关系,将汇编函数两两组合,并添加相似标签,形成函数对,作为训练样本数据;/n构建层次学习模型,所述层次学习模型包含基于深度神经网络构建函数内级别学习模块和基于图谱注意力网络构建函数间级别学习模块;并对层次学习模型进行克隆,得到克隆版层次学习模型;/n将训练样本数据函数对的汇编函数对应的特征信息分别输入层次学习模型和克隆版层次学习模型中,利用函数对中每个函数的函数特征信息分别对两个模型中的函数内级别学习模块进行训练学习,并获...

【技术特征摘要】
1.一种基于层次学习的跨架构漏洞挖掘方法,其特征在于,包含如下内容:
通过反汇编获取二进制函数对应的汇编程序,并对汇编程序中的汇编函数通过图形描述提取函数特征信息和函数调用关系,将汇编函数两两组合,并添加相似标签,形成函数对,作为训练样本数据;
构建层次学习模型,所述层次学习模型包含基于深度神经网络构建函数内级别学习模块和基于图谱注意力网络构建函数间级别学习模块;并对层次学习模型进行克隆,得到克隆版层次学习模型;
将训练样本数据函数对的汇编函数对应的特征信息分别输入层次学习模型和克隆版层次学习模型中,利用函数对中每个函数的函数特征信息分别对两个模型中的函数内级别学习模块进行训练学习,并获取作为中间嵌入的函数特征向量;将函数对中每个函数的函数调用关系及中间嵌入分别对应馈送至两个模型中的函数间特征学习模块进行训练学习,并获取函数特征高维向量表示;计算层次学习模型和克隆版层析学习模型两者获取的函数特征高维向量表示的相似度,并依据相似标签判定调整层次模型参数和权重,以获取完成训练学习用于目标函数漏洞挖掘的层次模型;
针对目标函数,通过反汇编获取其对应的汇编程序,并对汇编程序中的汇编函数创建控制流图,通过图形描述提取作为层次模型输入的函数特征信息和函数调用关系,通过训练学习后的层次模型完成目标函数漏洞挖掘。


2.根据权利要求1所述的基于层次学习的跨架构漏洞挖掘方法,其特征在于,图形描述中,针对汇编程序创建控制流图、数据流图和函数功能调用图,函数指令以基本块划分,控制流图和数据流图的节点由不同基本块组成,将数据传输信息附加到控制流图结构中,并添加用于表示两个基本块之间是否存在数据传输的符号标记,控制流图中节点之间的边缘代表控制流的方向,边缘的标签代表基本块之间是否存在数据传输;函数功能调用图采用有向图表示,图边表示函数调用关系,图节点由具有数据流信息的函数控制流图表示。


3.根据权利要求2所述的基于层次学习的跨架构漏洞挖掘方法,其特征在于,确定数据传输信息中,还包含:通过检查基本块中的指令是否访问同一地址寄存器来确定两个基本块之间是...

【专利技术属性】
技术研发人员:吴昊康绯卜文娟
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1