一种压缩包安全检测方法、装置、终端及存储介质制造方法及图纸

技术编号:28135079 阅读:35 留言:0更新日期:2021-04-21 19:01
本发明专利技术提供的一种压缩包安全检测方法、装置、终端及存储介质,读取压缩包,并解压压缩包解压得到各文件;基于AI的文件类型识别模型File-RNN对各文件进行识别,确定各文件所属的目标文件类型;当至少一个文件所属的目标文件类型与该文件的后缀名称不同时,输出警告。在某些实施例中,使用AI的文件类型识别技术检测文件,可以检测出压缩包中可能携带敏感信息文件的安全漏洞,既高效且准确;当文件的所属类型与文件的后缀不一致时,视该文件为非法文件,通过警告,可高效全面的过滤出压缩包中可能存在的敏感信息文件,降低企业的安全风险。降低企业的安全风险。降低企业的安全风险。

【技术实现步骤摘要】
一种压缩包安全检测方法、装置、终端及存储介质


[0001]本专利技术实施例涉及但不限于文件检测领域,具体而言,涉及但不限于一种压缩包安全检测方法、装置、终端及存储介质。

技术介绍

[0002]在Window(或Linux)环境下,将一个名为test.doc的文件改为test.java,拷贝到Java Web项目的src目录下,如果代码中没有引用到test.java文件,则Java Web应用程序可以正常编译通过,并生成可以发布版本的压缩包,如WAR包。这样存在编译漏洞的问题,使得敏感信息有可能被泄漏;即使使用文件头检测工具来检测文件类型也不一定保证安全,因为使用二进制工具可以篡改文件头已达到混淆的目的;以上描述的压缩包编译漏洞对于企业而言是致命的,因为企业的安全受到了威胁,对企业造成的损失是不可限量的。

技术实现思路

[0003]本专利技术实施例提供的一种压缩包安全检测方法、装置、终端及存储介质,主要解决的技术问题是相关在以压缩包的方式发布版本时,由于压缩包可能会携带敏感文件被发布到云端服务器上,从而出现信息泄露的重大安全问题。
[0004]为至少解决上述技术问题,本专利技术实施例提供了一种压缩包安全检测方法,包括:读取压缩包,并解压所述压缩包得到各文件;基于AI的文件类型识别模型RRN检测文件类型File-RNN对各文件进行识别,确定各文件所属的目标文件类型;当至少一个文件所属的目标文件类型与该文件的后缀名称不同时,输出警告。
[0005]本专利技术实施例还提供了一种安全检测装置,包括解压模块、File-RNN模型识别模块、检测模块;所述解压模块,用于读取压缩包,并将解压所述压缩包得到各文件;所述File-RNN模型识别模块,用于基于AI的文件类型识别模型File-RNN对所述各文件进行识别,确定各文件所属的目标文件类型;所述检测模块,用于当至少一个文件所属的目标文件类型与该文件的后缀名称不同时,输出警告。
[0006]本专利技术实施例还提供了一种终端,包括:处理器、存储器及通信总线;所述通信总线用于实现处理器和存储器之间的连接通信;所述处理器用于执行存储器中存储的一个或者多个计算机程序,以实现如上述任一项所述的压缩包安全检测方法的步骤。
[0007]本专利技术实施例还提供一种存储介质,所述存储介质存储有一个或者多个计算机程序,所述一个或者多个计算机程序可被一个或者多个处理器执行,以实现如上述任一项所述的压缩包安全检测方法的步骤。
[0008]本专利技术的有益效果至少包括:
[0009]本专利技术提供的一种压缩包安全检测方法、装置、终端及存储介质,读取压缩包,并解压所述压缩包得到各文件;基于AI的文件类型识别模型File-RNN对各文件进行识别,确定各文件所属的目标文件类型;当至少一个文件所属的目标文件类型与该文件的后缀名称不同时,输出警告。在某些实施例中,使用AI的文件类型识别技术检测文件,可以检测出压
缩包中可能携带敏感信息文件的安全漏洞,既高效且准确;当文件的所属的目标文件类型与文件的后缀不一致时,视该文件为非法文件,通过警告,可高效全面的过滤出压缩包中可能存在的敏感信息文件,降低企业的安全风险。
[0010]本专利技术其他特征和相应的有益效果在说明书的后面部分进行阐述说明,且应当理解,至少部分有益效果从本专利技术说明书中的记载变的显而易见。
附图说明
[0011]图1为本专利技术实施例一提供的一种压缩包安全检测方法的流程示意图;
[0012]图2为本专利技术实施例二提供的一种File-RNN模型训练方法的流程示意图;
[0013]图3为本专利技术实施例二提供的一种文件切片模块流程图;
[0014]图4为本专利技术实施例三提供的一种基于AI文件类型识别的压缩包安全检测机制流程图;
[0015]图5为本专利技术实施例三提供的一种文件特征提取模块流程图;
[0016]图6为本专利技术实施例四提供的安全检测装置的结构示意图;
[0017]图7为本专利技术实施例四提供的File-RNN模型识别模块的结构示意图;
[0018]图8为本专利技术实施例四提供的终端的结构示意图。
具体实施方式
[0019]为了使本专利技术的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本专利技术实施例作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0020]实施例一:
[0021]为了至少解决企业的服务器在以压缩包的方式发布版本时,由于压缩包可能会携带敏感文件被发布到云端服务器上,从而出现信息泄露的重大安全问题,本专利技术实施例提出了一种基于AI文件类型识别的压缩包机制。该机制的核心在于AI的文件类型识别模型,该模型的样本使用了“切片法”进行采集,该方法可以高效的收集样本信息且能广泛的覆盖文件的文本特征,从而使得模型的损失函数更好的收敛到局部最优解;同时本专利技术实施例提出了特有的文件特征结构,使得模型在学习文本特征时更具针对性。
[0022]以该模型为基础,会在发布压缩包之前对其进行解压,并对解压后的所有文件使用上述模型进行检测,模型会针对每个文件给出其所属的类型及其概率值。当结果与文件的命名后缀不吻合时会给出警告。
[0023]通过以上机制,可以有效的解决压缩包携带敏感信息文件的问题,从而降低企业敏感信息泄露的风险。请参见图1,本实施例提供了一种压缩包安全检测方法包括下述步骤。
[0024]步骤S101、读取压缩包,并解压压缩包得到各文件。
[0025]压缩包包括但不限于WAR包、JAR包,在本专利技术实施例中,以压缩包为WAR包为例进行说明;当Java Web应用程序编译出WAR包后,读取该WAR包,使用解压工具将其解压为各文件,该文件为未经过本专利技术实施例提供的压缩包安全检测的文件。
[0026]步骤S102、基于AI的文件类型识别模型File-RNN对各文件进行识别,确定各文件
所属的目标文件类型。
[0027]在本专利技术实施例中,使用AI的文件类型识别技术对未检测的文件进行识别,具体File-RNN模型(the file distinguish with RNN,RNN(循环神经网络)检测文件类型)可对文件的信息进行识别判断出该文件的所属类型。值得注意的是,由于文件信息量过大,为了保证文件检测的高效性,基于File-RNN模型对文件进行识别之前,还可以对文件内容进行过滤,对关键信息进行提取;具体的,将各文件转换为二进制流,并过滤各文件中的无效信息,根据预设的文本特征结构,从过滤后的二进制流中提取各文件的特征信息。其中将文件转换为二进制流,是因为其它方式如字节流等在提取文本特征和制作向量方面效率不如二进制流,而由于文件中可能会包括没有意义的无效信息,如无意义的符号、无效词语、编码后的乱码、无时间戳的信息内容等,将无效信息对应的流编码从二进制流中进行过滤,以提高文件的特征信息提取的效率。
[0028]需要说明的是,文件的特征信息的提取是依赖于文件特征结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种压缩包安全检测方法,包括:读取压缩包,并解压所述压缩包得到各文件;基于AI的文件类型识别模型RRN检测文件类型File-RNN对所述各文件进行识别,确定所述各文件所属的目标文件类型;当至少一个文件所属的目标文件类型与该文件的后缀名称不同时,输出警告。2.如权利要求1所述的压缩包安全检测方法,其特征在于,所述基于AI的文件类型识别模型File-RNN对所述各文件进行识别之前,包括:将各文件分别转化为二进制流,并过滤各文件中的无效信息;根据预设的文本特征结构,从过滤后的二进制流中提取所述各文件的特征信息。3.如权利要求2所述的压缩包安全检测方法,其特征在于,所述预设的文本特征结构包括文件编码和单位长度内容编码;所述根据预设的文本特征结构,从过滤后的二进制流中提取所述各文件的特征信息,包括:将所述单位长度内容编码划分为N段,所述N由各文件预设的文件定义类型来确定,N为正整数;将N段单位长度内容编码作为所述文件的特征信息;将所述特征信息转换为向量对象。4.如权利要求3所述的压缩包安全检测方法,其特征在于,所述基于AI的文件类型识别模型File-RNN对所述各文件进行识别,确定各文件所属的目标文件类型,包括:所述File-RNN模型对所述向量对象进行推导演算,确定所述向量类型对应文件所属的文件类型以及所属的文件类型对应的概率值;将最大概率值所对应的文件类型作为所述文件所属的目标文件类型。5.如权利要求1-4任一项所述的压缩包安全检测方法,其特征在于,所述读取压缩包,并解压所述压缩包得到各文件之前,包括:根据AI中的循环神经网络RNN对不同类型的已知文件的文件样本进行模型训练,确定所述File-RNN模型。6.如权利要求5所述的压缩包安全检测方法,其特征在于,所述根据AI中的RNN对不同类型的已知文件的文件样本进行模型训练,包括:将不同类...

【专利技术属性】
技术研发人员:刘博
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1