一种压缩包安全检测方法、装置、终端及存储介质制造方法及图纸

技术编号：28135079 阅读：55 留言：0更新日期：2021-04-21 19:01

本发明专利技术提供的一种压缩包安全检测方法、装置、终端及存储介质，读取压缩包，并解压压缩包解压得到各文件；基于AI的文件类型识别模型File-RNN对各文件进行识别，确定各文件所属的目标文件类型；当至少一个文件所属的目标文件类型与该文件的后缀名称不同时，输出警告。在某些实施例中，使用AI的文件类型识别技术检测文件，可以检测出压缩包中可能携带敏感信息文件的安全漏洞，既高效且准确；当文件的所属类型与文件的后缀不一致时，视该文件为非法文件，通过警告，可高效全面的过滤出压缩包中可能存在的敏感信息文件，降低企业的安全风险。降低企业的安全风险。降低企业的安全风险。

全部详细技术资料下载

【技术实现步骤摘要】
一种压缩包安全检测方法、装置、终端及存储介质

[0001]本专利技术实施例涉及但不限于文件检测领域，具体而言，涉及但不限于一种压缩包安全检测方法、装置、终端及存储介质。

技术介绍

[0002]在Window(或Linux)环境下，将一个名为test.doc的文件改为test.java，拷贝到Java Web项目的src目录下，如果代码中没有引用到test.java文件，则Java Web应用程序可以正常编译通过，并生成可以发布版本的压缩包，如WAR包。这样存在编译漏洞的问题，使得敏感信息有可能被泄漏；即使使用文件头检测工具来检测文件类型也不一定保证安全，因为使用二进制工具可以篡改文件头已达到混淆的目的；以上描述的压缩包编译漏洞对于企业而言是致命的，因为企业的安全受到了威胁，对企业造成的损失是不可限量的。

技术实现思路

[0003]本专利技术实施例提供的一种压缩包安全检测方法、装置、终端及存储介质，主要解决的技术问题是相关在以压缩包的方式发布版本时，由于压缩包可能会携带敏感文件被发布到云端服务器上，从而出现信息...

【技术保护点】

【技术特征摘要】
1.一种压缩包安全检测方法，包括：读取压缩包，并解压所述压缩包得到各文件；基于AI的文件类型识别模型RRN检测文件类型File-RNN对所述各文件进行识别，确定所述各文件所属的目标文件类型；当至少一个文件所属的目标文件类型与该文件的后缀名称不同时，输出警告。2.如权利要求1所述的压缩包安全检测方法，其特征在于，所述基于AI的文件类型识别模型File-RNN对所述各文件进行识别之前，包括：将各文件分别转化为二进制流，并过滤各文件中的无效信息；根据预设的文本特征结构，从过滤后的二进制流中提取所述各文件的特征信息。3.如权利要求2所述的压缩包安全检测方法，其特征在于，所述预设的文本特征结构包括文件编码和单位长度内容编码；所述根据预设的文本特征结构，从过滤后的二进制流中提取所述各文件的特征信息，包括：将所述单位长度内容编码划分为N段，所述N由各文件预设的文件定义类型来确定，N为正整数；将N段单位长度内容编码作为所述文件的特征信息；将所述特征信息转换为向量对象。4.如权利要求3所述的压缩包安全检测方法，其特征在于，所述基于AI的文件类型识别模型File-RNN对所述各文件进行识别，确定各文件所属的目标文件类型，包括：所述File-RNN模型对所述向量对象进行推导演算，确定所述向量类型对应文件所属的文件类型以及所属的文件类型对应的概率值；将最大概率值所对应的文件类型作为所述文件所属的目标文件类型。5.如权利要求1-4任一项所述的压缩包安全检测方法，其特征在于，所述读取压缩包，并解压所述压缩包得到各文件之前，包括：根据AI中的循环神经网络RNN对不同类型的已知文件的文件样本进行模型训练，确定所述File-RNN模型。6.如权利要求5所述的压缩包安全检测方法，其特征在于，所述根据AI中的RNN对不同类型的已知文件的文件样本进行模型训练，包括：将不同类...

【专利技术属性】
技术研发人员：刘博，
申请(专利权)人：中兴通讯股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人