一种针对长脚本文件的恶意代码智能检测方法技术

技术编号：43496490 阅读：29 留言：0更新日期：2024-11-29 17:03

本发明专利技术公开了一种针对长脚本文件的恶意代码智能检测方法，包括如下步骤：获取待检测文件的预处理后的代码数据包括token代码段序列和opcode操作码序列；将token代码段序列输入至代码段分类模型中，得到代码段分类结果；将opcode操作码序列输入至操作码分类模型中，得到操作码分类结果；响应于代码段分类结果和操作码分类结果均不为WebShell文件，则认定代码数据非恶意代码；反之则认定代码数据为恶意代码。本发明专利技术基于预训练语言模型的代码段分类模型和操作码分类模型分别对token代码段序列和opcode操作码序列进行检测，显著扩大了现有WebShell检测方法的适用范围，一定程度上提高了检测准确度和应对木马免杀方法的能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种针对长脚本文件的恶意代码智能检测方法，属于网络安全应用。

技术介绍

1、webshell(网页后门)作为网络攻击者最常使用的一种工具，具有隐蔽性强与危害性大的特点。准确查出隐匿于服务器的 webshell 可以及时发现并中断网络攻击。webshell的静态检测是指通过分析文件代码段以及其他一些特征从而识别webshell文件的检测方法，现有webshell 静态检测方案主要有基于关键字匹配的专家系统、基于自然语言分析的智能分析系统等。然而前者检测性能不高且只能识别已有webshell，在大多数场景下并不实用，后者也部分存在诸如难以应对部分木马免杀方法、适用范围较小、特征提取不充分等不足之处。

技术实现思路

1、本专利技术的目的在于克服现有技术中的不足，提供一种针对长脚本文件的恶意代码智能检测方法，基于预训练语言模型的代码段分类模型和操作码分类模型分别对token代码段序列和opcode操作码序列进行检测，显著扩大了现有webshell检测方法的适用范围，一定程度上提高了检...

【技术保护点】

1.一种针对长脚本文件的恶意代码智能检测方法，其特征是，包括如下步骤：

2.根据权利要求1所述的针对长脚本文件的恶意代码智能检测方法，其特征是，所述获取待检测文件的预处理后的代码数据包括如下步骤：

3.根据权利要求1所述的针对长脚本文件的恶意代码智能检测方法，其特征是，所述代码段分类模型的分类方法如下：

4.根据权利要求3所述的针对长脚本文件的恶意代码智能检测方法，其特征是，所述代码段头部基学习器、代码段中部基学习器、代码段尾部基学习器的结构相同；所述代码段头部基学习器或代码段中部基学习器或代码段尾部基学习器包括一个代码段基编码器和一个代码段基解码器；...

【技术特征摘要】

1.一种针对长脚本文件的恶意代码智能检测方法，其特征是，包括如下步骤：

2.根据权利要求1所述的针对长脚本文件的恶意代码智能检测方法，其特征是，所述获取待检测文件的预处理后的代码数据包括如下步骤：

3.根据权利要求1所述的针对长脚本文件的恶意代码智能检测方法，其特征是，所述代码段分类模型的分类方法如下：

4.根据权利要求3所述的针对长脚本文件的恶意代码智能检测方法，其特征是，所述代码段头部基学习器、代码段中部基学习器、代码段尾部基学习器的结构相同；所述代码段头部基学习器或代码段中部基学习器或代码段尾部基学习器包括一个代码段基编码器和一个代码段基解码器；

5.根据权利要求3所述的针对长脚本文件的恶意代码智能检测方法，其特征是，所述代码段元学习器包括：

6....

【专利技术属性】
技术研发人员：徐小龙，徐文轩，谢国华，许晨旭，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人