【技术实现步骤摘要】
一种基于机器学习的脚本文件检测方法、装置、设备和存储介质
[0001]本专利技术实施例涉及主机安全和沙箱检测技术,尤其涉及一种基于机器学习的脚本文件检测方法、装置、设备和存储介质。
技术介绍
[0002]当前互联网的使用日益普及,互联网安全对于信息安全也愈发重要,webshell是网站入侵的常用脚本文件,利用webshell可以在Web服务器上执行系统命令、窃取数据等恶意操作,危害极大。在现有技术中,通常基于动态特征来对变形或加密的webshell进行检测。
[0003]然而,现有技术存在如下技术缺陷:所需资源成本高、检测精度低,且受限于webshell的文件类型和语言,无法适应全部脚本文件类型。
技术实现思路
[0004]本专利技术提供一种基于机器学习的脚本文件检测方法、装置、设备和存储介质,以实现对多种类型的webshell脚本文件进行高精度检测。
[0005]第一方面,本专利技术实施例提供了一种基于机器学习的脚本文件检测方法,包括:
[0006]对用于训练的脚本文件进行过滤;r/>[0007]对本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的脚本文件检测方法,其特征在于,包括:对用于训练的脚本文件进行过滤;对过滤后的脚本文件进行特征提取;基于特征提取结果训练检测算法模型;基于训练得到的检测算法模型对待检测的脚本文件进行检测。2.根据权利要求1所述的脚本文件检测方法,其特征在于,所述对用于训练的脚本文件进行过滤,包括:将文件名为预设后缀名的用于训练的脚本文件,作为过滤后的脚本文件。3.根据权利要求1所述的脚本文件检测方法,其特征在于,所述对过滤后的脚本文件进行特征提取,包括:通过第一特征提取方法对过滤后的脚本文件进行特征提取,得到第一特征提取结果;通过第二特征提取方法对所述过滤后的脚本文件进行特征提取,得到第二特征提取结果;合并所述第一特征提取结果和第二特征提取结果,作为所述过滤后的脚本文件的特征提取结果。4.根据权利要求3所述的脚本文件检测方法,其特征在于,所述第一特征提取方法为TF
‑
IDF特征提取方法,所述第二特征提取方法为NeoPi特征提取方法。5.根据权利要求4所述的脚本文件检测方法,其特征在于,所述通过第一特征提取方法对过滤后的脚本文件进行特征提取,包括:采用n
‑
gram对所述过滤后的脚本文...
【专利技术属性】
技术研发人员:陈嘉豪,梁彧,傅强,蔡琳,杨满智,田野,阿曼太,王杰,金红,陈晓光,
申请(专利权)人:恒安嘉新北京科技股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。