一种ROP数据样本扩展方法、装置、设备及存储介质制造方法及图纸

技术编号:39008189 阅读:10 留言:0更新日期:2023-10-07 10:39
本申请公开了一种ROP数据样本扩展方法、装置、设备及存储介质,涉及网络安全技术领域,包括:利用词嵌入模型对ROP数据样本进行训练,得到ROP Gadget的向量表示结果,并根据向量表示结果确定出ROP Gadget字典;在ROP Gadget字典中确定向量之间的相似度,并将相似度大于预设近邻阈值的向量对应的ROP Gadget判定为近邻ROP Gadget对;在待扩展ROP数据样本中基于预设替换性度量计算方式,对ROP Gadget字典中的ROP Gadget进行计算,并根据计算的替换性度量确定待替换ROP Gadget;基于预设替换ROP Gadget抽取概率,在近邻ROP Gadget中抽取ROP Gadget进行ROP Gadget替换,以完成待扩展ROP数据样本的扩展操作。由此,通过对ROP Gadget进行近邻替换实现ROP数据样本扩展,能使扩展后样本更接近真实数据。后样本更接近真实数据。后样本更接近真实数据。

【技术实现步骤摘要】
一种ROP数据样本扩展方法、装置、设备及存储介质


[0001]本专利技术涉及网络安全
,特别涉及一种ROP数据样本扩展方法、装置、设备及存储介质。

技术介绍

[0002]在机器学习中,数据可以影响学习模型的上限,数据规模越大、数据质量越高,根据数据训练得到的深度学习模型的性能越好。然而,在ROP攻击检测领域中,ROP数据样本较少而且质量不高,需要对ROP数据样本进行扩展,生成数量多且质量高的ROP样本,以提升检测模型的性能。当前在ROP数据样本扩展方面的研究还比较初步,主要是应用工具ROPGadget生成ROP数据样本,ROPGadget主要从目标软件中搜索一些ROP Gadget,随机生成一系列ROP Gadget构成ROP数据样本,并应用机器学习模型训练,但这样的样本与真实样本相差很大,导致模型的性能不佳。ROP数据样本扩展的要求是:由真实样本扩展形成新的样本的同时,使得新样本的功能接近于原来的真实样本;由此可见,如何得到满足前述要求的扩展样本是在训练机器学习模型时要解决的问题。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种ROP数据样本扩展方法、装置、设备及存储介质,能够得到更接近真实数据的ROP数据样本。其具体方案如下:
[0004]第一方面,本申请提供了一种ROP数据样本扩展方法,包括:
[0005]利用预设词嵌入模型对ROP数据样本训练集进行训练以得到与所述ROP数据样本训练集中ROP Gadget对应的向量表示结果,并根据所述ROP Gadget以及所述向量表示结果构成的键值确定出ROP Gadget字典;
[0006]在所述ROP Gadget字典中确定出每两个向量之间的相似度,并将相似度大于预设近邻阈值的相应向量对应的ROP Gadget判定为近邻ROP Gadget对;
[0007]在待扩展ROP数据样本中基于预设替换性度量计算方式对存在于所述ROP Gadget字典中的ROP Gadget进行计算以根据计算得到的若干个替换性度量确定出待替换ROP Gadget;
[0008]基于预设替换ROP Gadget抽取概率在与所述待替换ROP Gadget对应的所述近邻ROP Gadget对中抽取ROP Gadget作为替换ROP Gadget;
[0009]在所述待扩展ROP Gadget数据样本中利用所述替换ROP Gadget替换相应的所述待替换ROP Gadget,以完成所述待扩展ROP数据样本的扩展操作。
[0010]可选的,所述利用预设词嵌入模型对ROP数据样本训练集进行训练,得到与所述ROP数据样本训练集中ROP Gadget对应的向量表示结果之前,还包括:
[0011]利用预设标识符对所述ROP数据样本训练集中的所有常数值进行替换处理,得到处理后数据样本,以便对所述处理后数据样本进行训练。
[0012]可选的,所述对所述处理后数据样本进行训练,包括:
[0013]利用所述预设词嵌入模型对所述处理后数据样本进行训练,得到与所述ROP数据样本训练集中ROP Gadget对应的向量表示结果。
[0014]可选的,所述在所述ROP Gadget字典中确定出每两个向量之间的相似度,并将相似度大于预设近邻阈值的相应向量对应的ROP Gadget判定为近邻ROP Gadget对,包括:
[0015]在所述ROP Gadget字典中计算任两个向量之间的余弦值,以得到任两个向量之间的所述相似度;
[0016]若任两个向量之间的相似度大于所述预设近邻阈值,则将相应的两个向量对应的ROP Gadget判定为近邻ROP Gadget对。
[0017]可选的,所述在待扩展ROP数据样本中基于预设替换性度量计算方式对存在于所述ROP Gadget字典中的ROP Gadget进行计算,以根据计算得到的若干个替换性度量确定出待替换ROP Gadget,包括:
[0018]统计同时存在于所述待扩展ROP数据样本和所述ROP Gadget字典的若干个目标ROP Gadget,并在所述ROP Gadget字典中统计与所述目标ROP Gadget互为近邻ROP Gadget对的ROP Gadget数量;
[0019]根据所述ROP Gadget数量以及预设替换性度量计算方式计算出所述目标ROP Gadget对应的替换性度量;
[0020]根据所述替换性度量从所述目标ROP Gadget中筛选出所述待替换ROP Gadget。
[0021]可选的,所述基于预设替换ROP Gadget抽取概率在与所述待替换ROP Gadget对应的所述近邻ROP Gadget对中抽取ROP Gadget作为替换ROP Gadget之前,还包括:
[0022]利用预设ROP Gadget抽取概率公式对所述ROP Gadget字典中任一ROP Gadget对应的抽取概率进行计算以得到与ROP Gadget对应的所述预设替换ROP Gadget抽取概率。
[0023]可选的,所述在所述待扩展ROP Gadget数据样本中利用所述替换ROP Gadget替换相应的所述待替换ROP Gadget,以完成所述待扩展ROP数据样本的扩展操作,包括:
[0024]利用当前的所述替换ROP Gadget替换当前的所述待替换ROP Gadget,并重新跳转至所述根据计算得到的若干个替换性度量确定出待替换ROP Gadget的步骤,以完成所述待处理数据样本的扩展操作。
[0025]第二方面,本申请提供了一种ROP数据样本扩展装置,包括:
[0026]字典确定模块,用于利用预设词嵌入模型对ROP数据样本训练集进行训练以得到与所述ROP数据样本训练集中ROP Gadget对应的向量表示结果,并根据所述ROP Gadget以及所述向量表示结果构成的键值确定出ROP Gadget字典;
[0027]相似度判定模块,用于在所述ROP Gadget字典中确定出每两个向量之间的相似度,并将相似度大于预设近邻阈值的相应向量对应的ROP Gadget判定为近邻ROP Gadget对;
[0028]待替换ROP Gadget确定模块,用于在待扩展ROP数据样本中基于预设替换性度量计算方式对存在于所述ROP Gadget字典中的ROP Gadget进行计算以根据计算得到的若干个替换性度量确定出待替换ROP Gadget;
[0029]替换ROP Gadget确定模块,用于基于预设替换ROP Gadget抽取概率在与所述待替换ROP Gadget对应的所述近邻ROP Gadget对中抽取ROP Gadget作为替换ROP Gadget;
[0030]ROP Gadget替换模块,用于在所述待扩展ROP Gadget数据样本中利用所述替换
ROP Gadget替换相应的所述待替换ROP Gadget,以完成所述待扩展ROP数据样本的扩展操作。
[0031]第三方面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
Gadget抽取概率在与所述待替换ROP Gadget对应的所述近邻ROP Gadget对中抽取ROP Gadget作为替换ROP Gadget之前,还包括:利用预设ROP Gadget抽取概率公式对所述ROP Gadget字典中任一ROP Gadget对应的抽取概率进行计算以得到与ROP Gadget对应的所述预设替换ROP Gadget抽取概率。7.根据权利要求1至6任一项所述的ROP数据样本扩展方法,其特征在于,所述在所述待扩展ROP Gadget数据样本中利用所述替换ROP Gadget替换相应的所述待替换ROP Gadget,以完成所述待扩展ROP数据样本的扩展操作,包括:利用当前的所述替换ROP Gadget替换当前的所述待替换ROP Gadget,并重新跳转至所述根据计算得到的若干个替换性度量确定出待替换ROP Gadget的步骤,以完成所述待处理数据样本的扩展操作。8.一种ROP数据样本扩展装置,其特征在于,包括:字典确定模块,用于利用预设词嵌入模型对ROP数据样本训练集进行训练以得到与所述ROP数据样本训练集中ROP Gadget对应的向量表示结果,并根据所述ROP Gadget以及所述向量表示结果构成的键值确定出ROP Gadget字典;相似度判定模块,用...

【专利技术属性】
技术研发人员:王剑黄恺杰智绪龙陈炯峄杨安语刘星彤李瑞林冯超
申请(专利权)人:中移杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1