一种基于代码块序列的二进制同源漏洞检测方法技术

技术编号:43949757 阅读:30 留言:0更新日期:2025-01-07 21:37
本发明专利技术提供一种基于代码块序列的二进制同源漏洞检测方法,包括以下步骤:步骤1:收集基于代码块序列样本,构建一个新的基于代码块序列的数据集;步骤2:使用Doc2Vec学习汇编语言中的词向量,将样本中的汇编代码块进行Block2Vec表示,并统一样本的向量维度;步骤3:基于Block2Vec的机器学习模型。应用本技术方案能够更加准确地识别和定位程序中的安全漏洞。

【技术实现步骤摘要】

本专利技术涉及电网终端程序,特别是一种基于代码块序列的二进制同源漏洞检测方法


技术介绍

1、电网终端程序在现代电力系统中扮演着至关重要的角色,因此其安全性对电网稳定和数据安全至关重要。传统的漏洞检测方法可能存在一定的局限性,特别是在处理复杂的电网终端程序时,传统的漏洞检测方法表现地不够精准。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种基于代码块序列的二进制同源漏洞检测方法,能够更加准确地识别和定位程序中的安全漏洞。

2、为实现上述目的,本专利技术采用如下技术方案:一种基于代码块序列的二进制同源漏洞检测方法,包括以下步骤:

3、步骤1:收集基于代码块序列样本,构建一个新的基于代码块序列的数据集;

4、步骤2:使用doc2vec学习汇编语言中的词向量,将样本中的汇编代码块进行block2vec表示,并统一样本的向量维度;

5、步骤3:基于block2vec的机器学习模型。

6、在一较佳的实施例中,样本收集步骤如下:p>

7、1)首本文档来自技高网...

【技术保护点】

1.一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,样本收集步骤如下:

3.根据权利要求1所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,采用Doc2Vec来映射汇编代码块具体包括训练Block2Vec网络,获得任意代码块的Block2Vec表示以及处理通过Block2vec处理过后的数据。

4.根据权利要求3所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,训练Block2Vec网络包括以下步骤:>

5.根据权利...

【技术特征摘要】

1.一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,样本收集步骤如下:

3.根据权利要求1所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,采用doc2vec来映射汇编代码块具体包括训练block2vec网络,获得任意代码块的block2vec表示以及处理通过block2vec处理过后的数据。

4.根据权利要求3所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,训练block2vec网络包括以下步骤:

5.根据权利要求3所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,使用训练好的block2vec模型对汇编代码块序列进行编码的具体步骤如下:

6.根据权利要求3所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,处理通过block2vec处理过后的数据具体包括:1)选取一个固定长度flen,这里选训练数据中的最大长度;2)如果某训练数据不足flen,使用0填充,使其长度正好为flen;3)如果预测的时候,数据长度大于flen,就截取长度为flen的数据。

7.根据权利要求1所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,基于block2vec的机器学习模型中假设某个汇编代码样本有l行,其中,每一行表示一个基本块;将汇编代码块序列中的每一行作为一个段落,通过block2vec映射为一个n维向量,最终得到l*n的向量;将这l行向量进行串联,再经过统一维度处理,得到一个f维向量,f的计算公式如下:

8.根据权利要求7所述的一种基于代码块序列的二进制同源漏洞检测方法,其特征在于,采用rnn-lstm模型和text-cnn模型进行训练;rnn-lstm模型中对于每一个样本,经过预处理后为一个f维向量,其中,f=m*n;每次从中取出n个数据作为lstm的输入,相当于每次通过lst...

【专利技术属性】
技术研发人员:张坤三陈玉明周方亮薛淑倩陈倩洪汛吕泓钊杨泓林晋煌卢黄平杨柳娟范宗贤程泽森李嘉琪
申请(专利权)人:国网福建省电力有限公司漳州供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1