当前位置: 首页 > 专利查询>湘潭大学专利>正文

一种基于可微随机游走核和神经网络的二进制代码相似性检测方法技术

技术编号:38756419 阅读:26 留言:0更新日期:2023-09-10 09:41
本发明专利技术提出了一种基于可微随机游走核和神经网络的二进制代码相似性检测方法及系统。本发明专利技术方法包括获取待检测二进制代码对,将待检测二进制代码对进行反编译,获得其控制流程图;利用核函数提取待检测二进制代码流程图的结构特征;通过神经网络对待检测二进制代码的控制流程图的结构特征进行编码,并得到对应的结构嵌入和利用二进制代码对的控制流程图的结构信息嵌入和的相似性作为待检测二进制代码的相似性结果。本发明专利技术通过图核和神经网络结合的方法来提取二进制代码控制流程图的结构信息,能够很好的捕捉到隐藏在二进制代码中的控制依赖,从而有效地提升检测的精确率和效率,在二进制程序安全中有着非常重要的作用。要的作用。要的作用。

【技术实现步骤摘要】
一种基于可微随机游走核和神经网络的二进制代码相似性检测方法


[0001]本专利技术属于计算机安全领域,具体涉及一种基于可微随机游走核和神经网络的二进制代码相似性检测方法及系统。

技术介绍

[0002]二进制代码相似性检测用于检测两个给定的二进制代码中的函数是否相似。它在计算机安全方面具有广泛的应用,如剽窃检测、恶意软件检测、漏洞搜索、安全补丁分析等。随着计算机的迅速发展以及代码的重用和共享,恶意代码以及开源代码的相关漏洞可能会在不同的硬件架构和软件平台的设备传播,如果没有合适的检测技术,软件安全问题将会随着时间继续恶化。所以在计算机安全领域中,代码相似性检测显得尤为重要。但是在实际应用场景中,程序的源代码一般无法获得,所以基于二进制的代码相似性检测在软件安全分析领域中会更加适用。这也是建设网络强国的重要技术沉淀。
[0003]随着神经网络的流行,出现了许多基于神经网络的二进制代码相似性检测方法的研究。这些基于神经网络的二进制相似性检测方法中主要围绕于提取控制流程图中块的语义信息。这些方法将汇编语言类比于自然语言,利用自然语言中的技术来处本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于可微随机游走核和神经网络的二进制代码相似性检测方法,其特征在于,包括:1)将待检测二进制代码对进行反编译,获得其控制流程图对;2)利用可微随机游走核函数提取待检测二进制代码流程图的结构特征;3)通过神经网络对待检测二进制代码的控制流程图的结构特征进行编码,并得到对应的结构嵌入和4)利用非线性度量给二进制代码对的控制流程图的结构信息嵌入和打分,得到相似性分数,以该分数作为待检测二进制代码的相似性结果。2.根据权利要求1所述的一种基于可微随机游走核和神经网络的二进制代码相似性检测方法,其特征在于,步骤2)包括:随机初始化生成一定数量的隐藏图,分别将隐藏图与待检测的二进制代码的控制流程图组合生成直积图,在直积图上进行随机游走提取二进制代码控制流程图的结构特征。隐藏图的邻接矩阵是神经网络参数,可随模型进行反向传播优化,来拟合CFG中的子图。3.根据权利要求2所述的一种基于可微随机游走核和神经网络的二进制代码相似性检测方法,其特征在于,所述的在直积图上随机游走的表达式为:上式中l
(p)
(G,G

)为二进制代码控制流程图G与某个子图G

的匹配的随机游走路径的数量,p表示步长,用A
X
表示直积图的邻接矩阵。4.根据权利要求1所述的一种基于可微随机游走核和神经网络的二进制代码相似性检测方法,其特征在于,步骤3)中的神经网络为多层全连接神经网络,并以二进制代码的控制流程图和子图的匹配的随机游走路径数量为输入,并引入注意力机制加强神经网络对结构信息的感知。5.根据权利要求4所述的一...

【专利技术属性】
技术研发人员:程戈胡君钦
申请(专利权)人:湘潭大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1