System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文件分类检测方法、装置、电子设备及可读存储介质制造方法及图纸_技高网

文件分类检测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:39981749 阅读:7 留言:0更新日期:2024-01-09 01:35
本发明专利技术公开了一种文件分类检测方法、装置、电子设备及可读存储介质,涉及网络安全技术领域,以解决现有技术中检测正确率较低的问题。该方法包括:获取待处理文件和预训练的检测模型,检测模型包括数据处理网络、特征提取网络和多任务分类网络;将待处理文件输入检测模型进行分类检测处理,获得检测结果,包括文件类型和/或危险等级;分类检测处理包括:基于数据处理网络对待处理文件进行数据处理,得到目标词向量和统计特征向量;基于特征提取网络对目标词向量和统计特征向量进行特征提取和融合,得到融合特征;基于多任务分类网络对融合特征进行分类处理,得到待处理文件的检测结果。本发明专利技术实施例可提高对文件进行分类检测的结果准确率。

【技术实现步骤摘要】

本专利技术涉及网络安全,尤其涉及一种文件分类检测方法、装置、电子设备及可读存储介质


技术介绍

1、随着信息化时代的发展,更多的网络需求促进了各类网络应用数量的爆炸式增长,与之对应的网络安全问题也变得越来越复杂。全球广域网(world wide web,web)应用程序作为用户获取数据的入口,其受到的侵害尤为严重。webshell文件与web系统下的正常文件相似度极高,二者使用相同的系统环境与服务端口,因此常被入侵者用作后门文件。

2、目前通常通过对脚本文件中使用的关键词、高危函数、文件修改时间、文件权限或文件所有者等单一的特征对文件进行分类,从而实现对webshell文件进行检测的目的。但是,webshell文件种类繁多且复杂多变,现有技术中使用的特征较为单一,导致检测正确率较低。


技术实现思路

1、本专利技术实施例提供一种文件分类检测方法、装置、电子设备及可读存储介质,以解决现有技术中使用的特征较为单一,导致检测正确率较低的问题。

2、第一方面,本专利技术实施例提供了一种文件分类检测方法,包括:

3、获取待处理文件和预训练的检测模型,所述检测模型包括数据处理网络、特征提取网络和多任务分类网络;

4、将所述待处理文件输入所述检测模型进行分类检测处理,获得检测结果,所述检测结果包括所述待处理文件的文件类型和/或危险等级;

5、其中,所述分类检测处理包括:

6、基于所述数据处理网络对所述待处理文件进行数据处理,得到目标词向量和统计特征向量;

7、基于所述特征提取网络对所述目标词向量和所述统计特征向量进行特征提取和融合,得到融合特征;

8、基于所述多任务分类网络对所述融合特征进行分类处理,得到所述待处理文件的检测结果。

9、第二方面,本专利技术实施例提供了一种文件分类检测装置,包括:

10、获取模块,用于获取待处理文件和预训练的检测模型,所述检测模型包括数据处理网络、特征提取网络和多任务分类网络;

11、输入模块,用于将所述待处理文件输入所述检测模型进行分类检测处理,获得检测结果,所述检测结果包括所述待处理文件的文件类型和/或危险等级;

12、其中,所述分类检测处理包括:

13、基于所述数据处理网络对所述待处理文件进行数据处理,得到目标词向量和统计特征向量;

14、基于所述特征提取网络对所述目标词向量和所述统计特征向量进行特征提取和融合,得到融合特征;

15、基于所述多任务分类网络对所述融合特征进行分类处理,得到所述待处理文件的检测结果。

16、第三方面,本专利技术实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;

17、所述处理器,用于读取存储器中的程序实现如第一方面所述的方法中的步骤。

18、第四方面,本专利技术实施例提供了一种可读存储介质,用于存储程序,所述程序被处理器执行时实现如第一方面所述的方法中的步骤。

19、在本申请实施例中,检测模型包括数据处理网络、特征提取网络和多任务分类网络;分类检测处理包括:基于数据处理网络对待处理文件进行数据处理,得到目标词向量和统计特征向量;基于特征提取网络对目标词向量和统计特征向量进行特征提取和融合,得到融合特征;基于多任务分类网络对融合特征进行分类处理,得到待处理文件的检测结果。通过上述方式,提取待处理文件的目标词向量和统计特征向量,使得特征提取更加全面,可以更好地对待处理文件的进行表征,提高检测结果的准确度。同时,多任务分类网络对融合特征进行分类处理,得到待处理文件的检测结果,检测结果包括文件类型和/或危险等级,使得模型分类粒度更细,检测结果更加准确。

本文档来自技高网...

【技术保护点】

1.一种文件分类检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述特征提取网络包括第一特征提取子网络、第二特征提取子网络和特征融合层,所述基于所述特征提取网络对所述目标词向量和所述统计特征向量进行特征提取和融合,得到融合特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述第一特征提取子网络包括长距离信息提取层和短距离信息提取层;所述基于所述第一特征提取子网络对所述目标词向量进行特征提取,得到长距离语义信息和短距离语义信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述长距离信息提取层对所述目标词向量进行长距离特征提取,得到所述长距离语义信息,包括:

5.根据权利要求3所述的方法,其特征在于,所述基于所述短距离信息提取层对所述目标词向量进行短距离特征提取,得到所述短距离语义信息,包括:

6.根据权利要求5所述的方法,其特征在于,所述对所述第一特征图进行池化处理,得到第一池化结果,包括:

7.根据权利要求1所述的方法,其特征在于,所述多任务分类网络包括第一处理层和/或第二处理层,所述基于所述多任务分类网络对所述融合特征进行分类处理,得到所述待处理文件的检测结果,包括:

8.一种文件分类检测装置,其特征在于,包括:

9.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;其特征在于,

10.一种可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的方法中的步骤。

...

【技术特征摘要】

1.一种文件分类检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述特征提取网络包括第一特征提取子网络、第二特征提取子网络和特征融合层,所述基于所述特征提取网络对所述目标词向量和所述统计特征向量进行特征提取和融合,得到融合特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述第一特征提取子网络包括长距离信息提取层和短距离信息提取层;所述基于所述第一特征提取子网络对所述目标词向量进行特征提取,得到长距离语义信息和短距离语义信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述长距离信息提取层对所述目标词向量进行长距离特征提取,得到所述长距离语义信息,包括:

5.根据权利要求3所述的方法,其特征在于,所述基于...

【专利技术属性】
技术研发人员:常惠
申请(专利权)人:中移苏州软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1