一种基于机器学习的脚本文件检测方法、装置、设备和存储介质制造方法及图纸

技术编号:31235808 阅读:16 留言:0更新日期:2021-12-08 10:18
本发明专利技术公开了一种基于机器学习的脚本文件检测方法、装置、设备和存储介质。一种基于机器学习的脚本文件检测方法,包括:对用于训练的脚本文件进行过滤;对过滤后的脚本文件进行特征提取;基于特征提取结果训练检测算法模型;基于训练得到的检测算法模型对待检测的脚本文件进行检测。在本实施例的技术方案中,过滤后的脚本文件类型更准确,基于训练得到的检测算法模型提高了检测算法模型的精度,从而对多种类型的webshell脚本文件进行高精度检测。多种类型的webshell脚本文件进行高精度检测。多种类型的webshell脚本文件进行高精度检测。

【技术实现步骤摘要】
一种基于机器学习的脚本文件检测方法、装置、设备和存储介质


[0001]本专利技术实施例涉及主机安全和沙箱检测技术,尤其涉及一种基于机器学习的脚本文件检测方法、装置、设备和存储介质。

技术介绍

[0002]当前互联网的使用日益普及,互联网安全对于信息安全也愈发重要,webshell是网站入侵的常用脚本文件,利用webshell可以在Web服务器上执行系统命令、窃取数据等恶意操作,危害极大。在现有技术中,通常基于动态特征来对变形或加密的webshell进行检测。
[0003]然而,现有技术存在如下技术缺陷:所需资源成本高、检测精度低,且受限于webshell的文件类型和语言,无法适应全部脚本文件类型。

技术实现思路

[0004]本专利技术提供一种基于机器学习的脚本文件检测方法、装置、设备和存储介质,以实现对多种类型的webshell脚本文件进行高精度检测。
[0005]第一方面,本专利技术实施例提供了一种基于机器学习的脚本文件检测方法,包括:
[0006]对用于训练的脚本文件进行过滤;r/>[0007]对本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的脚本文件检测方法,其特征在于,包括:对用于训练的脚本文件进行过滤;对过滤后的脚本文件进行特征提取;基于特征提取结果训练检测算法模型;基于训练得到的检测算法模型对待检测的脚本文件进行检测。2.根据权利要求1所述的脚本文件检测方法,其特征在于,所述对用于训练的脚本文件进行过滤,包括:将文件名为预设后缀名的用于训练的脚本文件,作为过滤后的脚本文件。3.根据权利要求1所述的脚本文件检测方法,其特征在于,所述对过滤后的脚本文件进行特征提取,包括:通过第一特征提取方法对过滤后的脚本文件进行特征提取,得到第一特征提取结果;通过第二特征提取方法对所述过滤后的脚本文件进行特征提取,得到第二特征提取结果;合并所述第一特征提取结果和第二特征提取结果,作为所述过滤后的脚本文件的特征提取结果。4.根据权利要求3所述的脚本文件检测方法,其特征在于,所述第一特征提取方法为TF

IDF特征提取方法,所述第二特征提取方法为NeoPi特征提取方法。5.根据权利要求4所述的脚本文件检测方法,其特征在于,所述通过第一特征提取方法对过滤后的脚本文件进行特征提取,包括:采用n

gram对所述过滤后的脚本文...

【专利技术属性】
技术研发人员:陈嘉豪梁彧傅强蔡琳杨满智田野阿曼太王杰金红陈晓光
申请(专利权)人:恒安嘉新北京科技股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1