当前位置: 首页 > 专利查询>南通大学专利>正文

基于对偶学习的shellcode代码和注释生成方法技术

技术编号:33630786 阅读:60 留言:0更新日期:2022-06-02 01:34
本发明专利技术提供了一种基于对偶学习的shellcode代码和注释生成方法,包括以下步骤:(1)搜集来自shellstorm和Exploit Database的shellcode语料库;(2)将shellcode注释生成和shellcode代码生成这两个任务形式化为一个对偶学习问题,并通过为输入添加前缀来区分两个任务,使用浅层的Transformer进行同步学习,实现知识共享,提高训练模型的性能和泛化能力;(3)提出了一种改进自注意力计算的归一化方法Adjust_QKNorm,以使Transformer适应低资源任务;(4)提出一个基于规则的修复组件。本发明专利技术的有益效果为:有利于软件的开发和维护,生成的高质量注释和代码可以帮助提高开发人员的工作效率,进而提高软件质量。进而提高软件质量。进而提高软件质量。

【技术实现步骤摘要】
基于对偶学习的shellcode代码和注释生成方法


[0001]本专利技术涉及计算机
,尤其涉及一种基于对偶学习的shellcode代码和注释生成方法。

技术介绍

[0002]Sellcode是由汇编语言编写的一小段代码,恶意的shellcode可以执行DDoS攻击、数据盗窃,或针对目标系统运行恶意软件。但是,具有良好意图的shellcode可以用来识别漏洞,然后通过修复这些漏洞来修复系统。因此,研究人员希望使用shellcode发现软件中的安全漏洞,而shellcode代码生成技术已经成为一个活跃的研究课题。
[0003]然而,自动生成shellcode是一项具有挑战性的任务,因为它们通常是用汇编语言编写的。此外,总结shellcode的功能描述(即为shellcode生成注释)也是一个挑战,因为识别这些shellcode的攻击意图对于不熟悉shellcode和网络信息安全的用户来说是困难的。并且,由于shellcode语料库的规模较小,可以将shellcode的自动生成和摘要视为低资源任务,这使得解决这两个任务更具挑战性。...

【技术保护点】

【技术特征摘要】
1.基于对偶学习的shellcode代码和注释生成方法,其特征在于,包括以下步骤:(1)搜集shellstorm和Exploit Database上从2000年到2020年的shellcode语料库,设定其格式为<代码,注释>,使用一个模型学习对偶任务,通过交换输入和输出转换语料库,并通过添加前缀区分两个任务;(2)将shellcode注释生成和shellcode代码生成两个任务形式化为一个对偶学习问题,使用浅层的Transformer进行同步学习,用于知识共享和训练模型的性能和泛化能力;(3)提出改进自注意力计算的归一化方法Adjust_QKNorm,使Transformer适应低资源任务;(4)提出一个基于规则的修复组件,用于提高自动生成shellcode的准确性。2.根据权利要求1所述的基于对偶学习的shellcode代码和注释生成方法,其特征在于,所述步骤(1)中通过添加前缀区分两个任务,具体包括如下步骤:(2

1)对于shellcode代码生成任务,为其输入数据添加前缀“ShellCodeGen:”;(2

2)对于shellcode注释生成任务,为其输入数据添加前缀“ShellCodeSum:”。3.根据权利要求1所...

【专利技术属性】
技术研发人员:陈翔周彦琳杨光于池刘珂顾亚锋夏鸿崚胡新宇
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1