一种函数相似性检测方法、装置及电子设备制造方法及图纸

技术编号:37612240 阅读:10 留言:0更新日期:2023-05-18 12:04
本申请公开了一种函数相似性检测方法、装置及电子设备,涉及计算机处理技术领域,以解决现有函数相似性检测方案准确性较差的问题。该方法包括:获取待检测的至少两个函数;将至少两个函数输入函数相似性检测模型进行相似性检测,获取函数相似性检测模型输出的对至少两个函数的相似性检测结果;相似性检测包括:分别提取每个函数的函数特征,并通过对比每个函数的函数特征,确定相似性检测结果,每个函数的函数特征是通过函数相似性检测模型包括的多层感知机神经网络模型执行融合处理得到。本申请实施例通过采用多层感知机神经网络模型对各函数的特征进行多层提取和融合,可提升对函数语义特征的表达准确性,进而提升函数相似性检测的准确性。似性检测的准确性。似性检测的准确性。

【技术实现步骤摘要】
一种函数相似性检测方法、装置及电子设备


[0001]本申请涉及计算机处理
,尤其涉及一种函数相似性检测方法、装置及电子设备。

技术介绍

[0002]为确保计算机网络的安全问题,经常需要进行跨平台的漏洞、恶意代码等检测。目前,对于跨平台的程序代码(通常为二进制函数)间的相似性检测,常采用的检测方法是基于汇编指令的方法,具体实现方案为:经过循环神经网络(Recurrent Neural Network,RNN)提取函数特征矩阵,然后通过降维操作得到函数嵌入向量,进而基于得到的函数嵌入向量完成相似性比较。然而,这种方案只对二进制函数做了较为简单的特征提取和融合,导致对函数语义特征的表达不够准确,进而导致函数相似性检测结果的准确性较差。

技术实现思路

[0003]本申请实施例提供一种函数相似性检测方法、装置及电子设备,以解决现有函数相似性检测方案准确性较差的问题。
[0004]第一方面,本申请实施例提供了一种函数相似性检测方法,包括:
[0005]获取待检测的至少两个函数;
[0006]将所述至少两个函数输入预先训练好的函数相似性检测模型进行相似性检测,获取所述函数相似性检测模型输出的对所述至少两个函数的相似性检测结果;
[0007]其中,所述相似性检测包括:
[0008]分别提取每个函数的函数特征,并通过对比所述每个函数的函数特征,确定所述相似性检测结果,每个函数的函数特征是通过所述函数相似性检测模型包括的多层感知机神经网络模型执行融合处理得到。
[0009]可选地,所述分别提取每个函数的函数特征,包括:
[0010]从输入函数中提取得到词向量;
[0011]从所述词向量中提取得到第一特征矩阵;
[0012]对所述第一特征矩阵进行降维处理,得到第二特征矩阵;
[0013]通过所述多层感知机神经网络模型对所述词向量、所述第一特征矩阵和所述第二特征矩阵进行融合处理,得到所述输入函数的函数特征。
[0014]可选地,所述函数相似性检测模型还包括词嵌入模型、特征提取网络和特征转换网络;
[0015]其中,所述词嵌入模型用于对输入函数进行词向量提取,输出所述词向量;
[0016]所述特征提取网络用于从对所述词向量进行特征提取,输出所述第一特征矩阵;
[0017]所述特征转换网络用于对所述第一特征矩阵进行降维处理,输出所述第二特征矩阵。
[0018]可选地,所述多层感知机神经网络模型包括尺度特征融合网络和注意力特征融合
网络;
[0019]其中,所述尺度特征融合网络用于对所述词向量与所述第一特征矩阵进行融合处理,得到第一融合特征矩阵;
[0020]所述注意力特征融合网络用于对所述第一融合特征矩阵与所述第二特征矩阵进行融合处理,得到所述输入函数的函数特征。
[0021]可选地,所述尺度特征融合网络包括特征拼接层、全连接层和池化层;所述词向量和所述第一特征矩阵均为s
×
d维的矩阵,s表示句子长度,d表示词向量维度;
[0022]所述特征拼接层用于对所述词向量与所述第一特征矩阵进行拼接,得到s
×
2d维的第三特征矩阵;
[0023]所述全连接层和所述池化层用于对所述第三特征矩阵进行全连接和池化处理,得到d
×
1维的所述第一融合特征矩阵。
[0024]可选地,所述第一融合特征矩阵和所述第二特征矩阵均为d
×
1维的矩阵;
[0025]所述注意力特征融合网络用于:对所述第一融合特征矩阵和所述第二特征矩阵的转秩进行矩阵相乘运算,得到d
×
d维的交互矩阵;对所述交互矩阵进行归一化操作,得到d
×
1维的权重矩阵;将所述权重矩阵分别与所述第一融合特征矩阵和所述第二特征矩阵进行融合拼接处理,得到2d
×
1维的所述输入函数的函数特征。
[0026]可选地,所述对所述交互矩阵进行归一化操作,得到d
×
1维的权重矩阵,包括:
[0027]对所述交互矩阵中的每行元素取最大值,得到由所述交互矩阵中每行元素的最大值组成的d
×
1维的权重矩阵。
[0028]可选地,所述函数相似性检测模型是采用孪生网络训练得到的,并且是通过计算所述每个函数的函数特征的余弦距离,确定的所述相似性检测结果。
[0029]第二方面,本申请实施例还提供一种函数相似性检测装置,包括:
[0030]获取模块,用于获取待检测的至少两个函数;
[0031]相似性检测模块,用于将所述至少两个函数输入预先训练好的函数相似性检测模型进行相似性检测,获取所述函数相似性检测模型输出的对所述至少两个函数的相似性检测结果;
[0032]其中,所述相似性检测包括:
[0033]分别提取每个函数的函数特征,并通过对比所述每个函数的函数特征,确定所述相似性检测结果,每个函数的函数特征是通过所述函数相似性检测模型包括的多层感知机神经网络模型执行融合处理得到。
[0034]可选地,所述分别提取每个函数的函数特征,包括:
[0035]从输入函数中提取得到词向量;
[0036]从所述词向量中提取得到第一特征矩阵;
[0037]对所述第一特征矩阵进行降维处理,得到第二特征矩阵;
[0038]通过所述多层感知机神经网络模型对所述词向量、所述第一特征矩阵和所述第二特征矩阵进行融合处理,得到所述输入函数的函数特征。
[0039]可选地,所述函数相似性检测模型还包括词嵌入模型、特征提取网络和特征转换网络;
[0040]其中,所述词嵌入模型用于对输入函数进行词向量提取,输出所述词向量;
[0041]所述特征提取网络用于从对所述词向量进行特征提取,输出所述第一特征矩阵;
[0042]所述特征转换网络用于对所述第一特征矩阵进行降维处理,输出所述第二特征矩阵。
[0043]可选地,所述多层感知机神经网络模型包括尺度特征融合网络和注意力特征融合网络;
[0044]其中,所述尺度特征融合网络用于对所述词向量与所述第一特征矩阵进行融合处理,得到第一融合特征矩阵;
[0045]所述注意力特征融合网络用于对所述第一融合特征矩阵与所述第二特征矩阵进行融合处理,得到所述输入函数的函数特征。
[0046]可选地,所述尺度特征融合网络包括特征拼接层、全连接层和池化层;所述词向量和所述第一特征矩阵均为s
×
d维的矩阵,s表示句子长度,d表示词向量维度;
[0047]所述特征拼接层用于对所述词向量与所述第一特征矩阵进行拼接,得到s
×
2d维的第三特征矩阵;
[0048]所述全连接层和所述池化层用于对所述第三特征矩阵进行全连接和池化处理,得到d
×
1维的所述第一融合特征矩阵。
[0049]可选地,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种函数相似性检测方法,其特征在于,包括:获取待检测的至少两个函数;将所述至少两个函数输入预先训练好的函数相似性检测模型进行相似性检测,获取所述函数相似性检测模型输出的对所述至少两个函数的相似性检测结果;其中,所述相似性检测包括:分别提取每个函数的函数特征,并通过对比所述每个函数的函数特征,确定所述相似性检测结果,每个函数的函数特征是通过所述函数相似性检测模型包括的多层感知机神经网络模型执行融合处理得到。2.根据权利要求1所述的方法,其特征在于,所述分别提取每个函数的函数特征,包括:从输入函数中提取得到词向量;从所述词向量中提取得到第一特征矩阵;对所述第一特征矩阵进行降维处理,得到第二特征矩阵;通过所述多层感知机神经网络模型对所述词向量、所述第一特征矩阵和所述第二特征矩阵进行融合处理,得到所述输入函数的函数特征。3.根据权利要求2所述的方法,其特征在于,所述函数相似性检测模型还包括词嵌入模型、特征提取网络和特征转换网络;其中,所述词嵌入模型用于对输入函数进行词向量提取,输出所述词向量;所述特征提取网络用于从对所述词向量进行特征提取,输出所述第一特征矩阵;所述特征转换网络用于对所述第一特征矩阵进行降维处理,输出所述第二特征矩阵。4.根据权利要求2所述的方法,其特征在于,所述多层感知机神经网络模型包括尺度特征融合网络和注意力特征融合网络;其中,所述尺度特征融合网络用于对所述词向量与所述第一特征矩阵进行融合处理,得到第一融合特征矩阵;所述注意力特征融合网络用于对所述第一融合特征矩阵与所述第二特征矩阵进行融合处理,得到所述输入函数的函数特征。5.根据权利要求4所述的方法,其特征在于,所述尺度特征融合网络包括特征拼接层、全连接层和池化层;所述词向量和所述第一特征矩阵均为s
×
d维的矩阵,s表示句子长度,d表示词向量维度;所述特征拼接层用于对所述词向量与所述第一特征矩阵进行拼接,得到s
×
2d维的第三特征矩阵;所述全连接层和所述池化层用于对所述第三特征矩阵进行全连接和池化处理,得到d
×
1...

【专利技术属性】
技术研发人员:樊期光彭华熹石松泉
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1