System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于人工智能实现代码漏洞识别处理的方法、装置、处理器及其计算机可读存储介质制造方法及图纸_技高网

基于人工智能实现代码漏洞识别处理的方法、装置、处理器及其计算机可读存储介质制造方法及图纸

技术编号:41291313 阅读:2 留言:0更新日期:2024-05-13 14:42
本发明专利技术涉及一种基于人工智能实现代码漏洞识别处理的方法,包括以下步骤:(1)进行数据采集与标注;(2)进行数据预处理;(3)对预处理后的数据集进行样本扩充;(4)将扩充后的数据输入到图神经网络中进行特征提取;(5)训练分类器;(6)使用训练好的模型来对新样本进行代码漏洞的识别和分类。本发明专利技术还涉及一种用于实现基于人工智能的代码漏洞识别处理的装置、处理器及其计算机可读存储介质。采用了本发明专利技术的基于人工智能实现代码漏洞识别处理的方法、装置、处理器及其计算机可读存储介质,显著提升了代码漏洞自动识别的准确性和效率,能够更好地适应软件安全领域的复杂和多变的需,不仅提高了漏洞检测的精度,还提升了模型的泛化能力。

【技术实现步骤摘要】

本专利技术涉及数据资产管理领域,尤其涉及代码漏洞的识别和修复领域,具体是指一种基于人工智能实现代码漏洞识别处理的方法、装置、处理器及其计算机可读存储介质


技术介绍

1、在软件开发过程中,代码漏洞的识别和修复是保障软件安全性的重要环节。随着软件系统的日益复杂和多样,手动识别漏洞变得越来越困难和耗时。因此,自动化的代码漏洞识别技术应运而生,目的是减轻人工负担,提高漏洞检测的效率和准确性。然而,现有的自动漏洞识别技术面临着诸多挑战。首先,数据采集和标注方面的局限性导致了训练数据的质量和覆盖范围不足,这直接影响了模型的性能和泛化能力。此外,传统的数据预处理和特征提取方法未能充分挖掘代码的结构和语义信息,限制了识别算法的效果。同时,许多现有方法在模型训练过程中没有有效利用先进的技术如知识蒸馏和多任务学习,导致模型训练效率低下,漏洞识别的精度不高。

2、cn202310795809.7提出了一种基于高阶函数的代码依恋检测方法包括,程序预处理,生成可以识别多态调用方法名的虚函数表,构造函数调用图;构建每个过程高阶函数形式的函数摘要;通过生成的高阶函数形式的函数摘要,调用点处对函数摘要的函数参数进行相应代入,获取过程间由于过程调用和参数传递产生的代码依恋值信息;将计算得到的依恋值信息进行汇总,获取每个类中的每个方法的依恋度量值,检测程序中是否存在代码依恋。本专利技术解决了当前检测方法很少考虑上下文函数调用关系,以及类是否被具体实例化的不足,提高代码依恋检测的精度及其在生产生活中的应用价值。

3、cn202310873981.x提出了一种恶意代码检测方法、装置、电子设备及存储介质,涉及安全
该方法通过将待测代码中的字节值转换为图像中的像素值,实现图像编码,这样对编码图像进行多尺度特征提取可以更好地捕捉到待测代码中的相关特征,也就可以使得获得的多尺度特征可以更完整且准确地表征待测代码;最后再将多尺度特征进行自注意力编码,得到编码特征,也就使得的编码特征更加完善与准确,也可以理解为得到的编码特征可以更好地反映待测代码,从而根据编码特征进行检测的准确性更高。

4、cn202310879722.8提出了一种检测代码相似度的方法、装置、存储介质及电子设备,该方法包括:提取至少两个二进制程序文件中各个二进制程序文件的特征,得到各特征信息,其中,所述各特征信息包括:各伪代码文本和各字符串序列;将所述各特征信息输入至目标网络模型,获取所述各个二进制程序文件对应的各语义嵌入向量;确定所述各语义嵌入向量之间的相似度值。本申请的一些实施例可以获取代码结构层面的语义信息,实现对代码的相似度的准确检测。

5、现有技术创新性好,但仍然存在以下问题有待进一步提升:

6、1、数据扩充技术的缺失:

7、现有技术可能没有采用有效的数据扩充技术,导致数据集的多样性和质量受限。

8、2、特征提取方法的局限性:

9、现有技术可能没有利用高效的特征提取方法,限制了其在捕捉代码的结构和语义信息方面的能力。

10、3、模型训练和识别精度的不足:

11、现有技术可能存在模型训练效率低下和漏洞识别精度不高。


技术实现思路

1、本专利技术的目的是克服了上述现有技术的缺点,提供了一种满足识别精度高、训练效率高、适用范围较为广泛的基于人工智能实现代码漏洞识别处理的方法、装置、处理器及其计算机可读存储介质。

2、为了实现上述目的,本专利技术的基于人工智能实现代码漏洞识别处理的方法、装置、处理器及其计算机可读存储介质如下:

3、该基于人工智能实现代码漏洞识别处理的方法,其主要特点是,所述的方法包括以下步骤:

4、(1)进行数据采集与标注;

5、(2)进行数据预处理;

6、(3)基于投影梯度下降的稀疏自编码器算法,结合数据增强技术,对预处理后的数据集进行样本扩充;

7、(4)采用基于图神经网络的特征提取方法,将扩充后的数据输入到图神经网络中进行特征提取;

8、(5)训练分类器;

9、(6)使用训练好的模型来对新样本进行代码漏洞的识别和分类。

10、较佳地,所述的步骤(1)具体包括以下步骤:

11、(1.1)从源代码库中提取代码样本;

12、(1.2)收集与代码样本相关的元信息,提取元信息。

13、较佳地,所述的步骤(1)还包括以下步骤:

14、(1.3)对采集到的数据进行数据标注。

15、较佳地,所述的步骤(2)具体包括以下步骤:

16、(2.1)进行数据标准化;

17、(2.2)将专有词汇映射到一个统一的词汇空间;

18、(2.3)采用序列化处理来保留代码的结构信息,将每个标准化的代码样本byi转换为序列bzi;

19、(2.4)进行缺失值处理,采用bnull进行填充。

20、较佳地,所述的步骤(3)具体包括以下步骤:

21、(3.1)设定自编码器的参数,设置自编码器的输入层、隐藏层和输出层的神经元数量;

22、(3.2)将原始代码数据通过自编码器进行编码,生成稀疏表示;

23、(3.3)采用投影梯度下降优化稀疏表示,提升数据的表达能力;

24、(3.4)对优化后的稀疏表示进行数据增强处理;

25、(3.5)通过自适应方法选择有信息量的特征进行保留,使用梯度的大小作为特征重要性评分函数score;

26、(3.6)将增强后的数据通过自编码器进行重构,生成最终的扩充数据集。

27、较佳地,所述的步骤(4)具体包括以下步骤:

28、(4.1)将输入到特征提取模块的特征送入全连接神经网络中学习得到各个特征值的注意力系数,选取前k个注意力系数值较大的特征值作为关键特征值;

29、(4.2)以关键特征值作为节点构建图神经网络,利用注意力系数构建邻接矩阵,通过图神经网络进行特征之间的交互,得到特征提取后的特征。

30、较佳地,所述的步骤(4)还包括以下步骤:

31、(4.3)将权重系数c使用softmax函数归一化后得到注意力系数;

32、(4.4)选取前k个最大注意力系数,记录对应的特征值的索引值,根据索引值得到对应特征值;

33、(4.5)将具有前k个特征的数据输入到特征交互模块,以关键特征值为节点构建图神经网络,通过门控图神经网络实现节点特征的信息交互;

34、(4.6)采用门控循环更新机制通过图传递信息,并学习上下文的关联特征。

35、(4.7)基于聚合特征向量和上一个时间步每个节点通过门控机制更新其隐状态

36、较佳地,所述的步骤(5)具体包括以下步骤:

37、(5.1)定义ex为从数据特征提取步骤得到的特征向量;

38、(5.2)将从数据特本文档来自技高网...

【技术保护点】

1.一种基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的方法包括以下步骤:

2.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(1)具体包括以下步骤:

3.根据权利要求2所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(1)还包括以下步骤:

4.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(2)具体包括以下步骤:

5.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(3)具体包括以下步骤:

6.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(4)具体包括以下步骤:

7.根据权利要求6所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(4)还包括以下步骤:

8.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(5)具体包括以下步骤:

9.一种用于实现基于人工智能的代码漏洞识别处理的装置,其特征在于,所述的装置包括:

10.一种用于实现基于人工智能的代码漏洞识别处理的处理器,其特征在于,所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现权利要求1至8中任一项所述的基于人工智能实现代码漏洞识别处理的方法的各个步骤。

11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述的计算机程序可被处理器执行以实现权利要求1至8中任一项所述的基于人工智能实现代码漏洞识别处理的方法的各个步骤。

...

【技术特征摘要】

1.一种基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的方法包括以下步骤:

2.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(1)具体包括以下步骤:

3.根据权利要求2所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(1)还包括以下步骤:

4.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(2)具体包括以下步骤:

5.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(3)具体包括以下步骤:

6.根据权利要求1所述的基于人工智能实现代码漏洞识别处理的方法,其特征在于,所述的步骤(4)具体包括以下步骤:

7.根据权利要求6所述的基于...

【专利技术属性】
技术研发人员:苗巍魏明
申请(专利权)人:普元信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1