一种应用于计算机安全系统的流文件脱敏方法及装置制造方法及图纸

技术编号:38672663 阅读:10 留言:0更新日期:2023-09-02 22:49
本发明专利技术公开了一种应用于计算机安全系统的流文件脱敏方法及装置,包括:获取一级文件的类型信息,根据一级文件的类型信息创建一级解码器;将原始文件流输入至所述一级解码器,根据一级解码器的解析数据识别是否存在内嵌的下一级文件,若不存在,则创建脱敏组件;将一级解码器对一级文件的解析数据输入至脱敏组件,并将脱敏后的结构化数据输入至一级解码器的回写接口,一级解码器对脱敏后的结构化数据进行编码处理,得到原始文件脱敏后的文件流,输出为新的脱敏文件。本发明专利技术将CPU的占用分摊开,CPU的使用率比较平稳,内存的使用不会有太多的占用,使网络数据包的转发不会造成延迟。使网络数据包的转发不会造成延迟。使网络数据包的转发不会造成延迟。

【技术实现步骤摘要】
一种应用于计算机安全系统的流文件脱敏方法及装置


[0001]本专利技术涉及数据安全
,特别涉及一种应用于计算机安全系统的流文件脱敏方法及装置。

技术介绍

[0002]随着数据安全越来越重要,对于文件的脱敏处理也越来约重要,目前比较通用的文件,docx、pptx,xlsx,vsdx等都是流文档文件,压缩文件zip,tar,gz,bz2,xz也是支持流的,所以需要一种通用的流文件脱敏框架来在线脱敏这种类型文件。
[0003]目前对文档文件进行解析,一般通过将文档缓存完整后,进行解析和脱敏的操作,这样在同一时刻占用的CPU和内存会比较高,CPU的使用率不平稳,波动较大,这将最终导致网络数据包的转发发生延迟。

技术实现思路

[0004]鉴于现有技术中的上述缺陷或不足,本专利技术提供了一种应用于计算机安全系统的流文件脱敏方法及装置,以全部或部分的解决上述技术问题。
[0005]本专利技术的一个方面,提供了一种应用于计算机安全系统的流文件脱敏方法,包括如下步骤:读取原始文件流获取一级文件的类型信息,根据所述一级文件的类型信息创建一级解码器;将所述原始文件流输入至所述一级解码器,根据所述一级解码器的解析数据识别是否存在内嵌的下一级文件,若不存在,则创建脱敏组件;将所述一级解码器对所述一级文件的解析数据输入至所述脱敏组件,并将脱敏后的结构化数据输入至所述一级解码器的回写接口,所述一级解码器对脱敏后的结构化数据进行编码处理,得到原始文件脱敏后的文件流,输出为新的脱敏文件。
[0006]进一步的,还包括:若存在内嵌的二级文件,则根据所述一级解码器的解析数据识别内嵌的二级文件的类型,根据所述内嵌的二级文件类型创建二级解码器;将所述一级解码器解析出的所述二级文件的文件流输入至所述二级解码器,根据所述二级解码器对所述二级文件的解析数据,判断是否存在内嵌的下一级文件类型,若不存在,则创建脱敏组件;将所述二级解码器对所述二级文件的解析数据输入至所述脱敏组件,并将脱敏后的结构化数据输入至所述二级解码器的回写接口;二级解码器对脱敏后的结构化数据进行第一编码处理,得到所述二级文件脱敏后的文件流;将所述二级文件脱敏后的文件流输入至所述一级解码器的回写接口;所述一级解码器对所述二级文件脱敏后的文件流进行第二编码处理,得到原始文件脱敏后的文件流,输出为新的脱敏文件。
[0007]进一步的,还包括:当所述一级解码器解析出所述二级文件的尾部数据时,所述第一级解码器将二级文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件的尾部,调用所述二级解码器的结束接口,销毁所述二级解码器和所述脱敏组件。
[0008]进一步的,还包括:当所述一级解码器解析出所述原始文件流的尾部数据时,将最后一级文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件的尾部,调用所述一级解码器的结束接口,销毁所述一级解码器。
[0009]进一步的,所述二级文件包括第一类型文件和第二类型文件;当一级解码器读取到所述解析数据中的所述第一类型文件的文件头和部分数据时,识别出所述第一类型文件的类型,根据所述第一类型文件的类型创建第一二级解码器和第一脱敏组件。
[0010]进一步的,还包括:当第一级解码器解析出所述第一类型文件的尾部数据时,所述第一级解码器将第一类型文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件中的第一文件的尾部,并销毁所述第一二级解码器和所述第一脱敏组件。
[0011]进一步的,还包括:当一级解码器读取到所述解析数据中的所述第二类型文件的文件头和部分数据时,识别出所述第二类型文件的类型,根据所述第二类型文件的类型创建第二二级解码器和第二脱敏组件。
[0012]进一步的,还包括:当所述一级解码器解析出所述原始文件流的尾部数据时,将最后一级文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件的尾部,调用所述一级解码器的结束接口,销毁所述一级解码器的步骤,包括:当第一级解码器解析出所述第二类型文件的尾部数据时,所述第一级解码器将第二类型文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件中的第二文件的尾部,并销毁所述第二二级解码器、所述第二脱敏组件和所述一级解码器。
[0013]本专利技术的另一方面,还提供了一种应用于计算机安全系统的流文件脱敏装置,包括:第一模块,被配置为读取原始文件流获取一级文件的类型信息,根据所述一级文件的类型信息创建一级解码器;第二模块,被配置为将所述原始文件流输入至所述一级解码器,根据所述一级解码器的解析数据识别是否存在内嵌的下一级文件,若不存在,则创建脱敏组件;第三模块,被配置为将所述一级解码器对所述一级文件的解析数据输入至所述脱敏组件,并将脱敏后的结构化数据输入至所述一级解码器的回写接口,所述一级解码器对脱敏后的结构化数据进行编码处理,得到原始文件脱敏后的文件流,输出为新的脱敏文件。
[0014]进一步的,所述第三模块,被进一步配置为:若存在内嵌的二级文件,则根据所述一级解码器的解析数据识别内嵌的二级文件的类型,根据所述内嵌的二级文件类型创建二级解码器;将所述一级解码器解析出的所述二级文件的文件流输入至所述二级解码器,根据所述二级解码器对所述二级文件的解析数据,判断是否存在内嵌的下一级文件类型,若不存在,则创建脱敏组件;将所述二级解码器对所述二级文件的解析数据输入至所述脱敏组件,并将脱敏后的结构化数据输入至所述二级解码器的回写接口;二级解码器对脱敏后的结构化数据进行第一编码处理,得到所述二级文件脱敏后的文件流;将所述二级文件脱敏后的文件流输入至所述一级解码器的回写接口;所述一级解码器对所述二级文件脱敏后的文件流进行第二编码处理,得到原始文件脱敏后的文件流,输出为新的脱敏文件;第四模块,被配置为当所述一级解码器解析出所述二级文件的尾部数据时,所述
第一级解码器将二级文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件的尾部,调用所述二级解码器的结束接口,销毁所述二级解码器和所述脱敏组件。
[0015]第五模块,被配置为当所述一级解码器解析出所述原始文件流的尾部数据时,将最后一级文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件的尾部,调用所述一级解码器的结束接口,销毁所述一级解码器。
[0016]本专利技术提供的一种应用于计算机安全系统的流文件脱敏方法及装置,在文档传输的过程中通过流处理的方式进行解析和脱敏操作,将CPU的占用分摊开,CPU的使用率会比较平稳,不会出现大的波动,内存的使用由于不会缓存太多的文件数据也不会有太多的占用,进而使网络数据包的转发也不会造成延迟。
附图说明
[0017]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请一个实施例提供的基于单层文件解码器的流文件脱敏逻辑示意图;图2是本申请一个实施例提供的基于单层文件解码器的流文件脱敏方法流程图;图3是本申请一个实施例提供的基于多层文件解码器的流文件脱敏逻辑示意图;图4是本申请一个实施例提供的基于多层文件解码器的流文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于计算机安全系统的流文件脱敏方法,其特征在于,包括如下步骤:读取原始文件流获取一级文件的类型信息,根据所述一级文件的类型信息创建一级解码器;将所述原始文件流输入至所述一级解码器,根据所述一级解码器的解析数据识别是否存在内嵌的下一级文件,若不存在,则创建脱敏组件;将所述一级解码器对所述一级文件的解析数据输入至所述脱敏组件,并将脱敏后的结构化数据输入至所述一级解码器的回写接口,所述一级解码器对脱敏后的结构化数据进行编码处理,得到原始文件脱敏后的文件流,输出为新的脱敏文件。2.根据权利要求1所述的应用于计算机安全系统的流文件脱敏方法,其特征在于,进一步包括:若存在内嵌的二级文件,则根据所述一级解码器的解析数据识别内嵌的二级文件的类型,根据所述内嵌的二级文件类型创建二级解码器;将所述一级解码器解析出的所述二级文件的文件流输入至所述二级解码器,根据所述二级解码器对所述二级文件的解析数据,判断是否存在内嵌的下一级文件类型,若不存在,则创建脱敏组件;将所述二级解码器对所述二级文件的解析数据输入至所述脱敏组件,并将脱敏后的结构化数据输入至所述二级解码器的回写接口;二级解码器对脱敏后的结构化数据进行第一编码处理,得到所述二级文件脱敏后的文件流;将所述二级文件脱敏后的文件流输入至所述一级解码器的回写接口;所述一级解码器对所述二级文件脱敏后的文件流进行第二编码处理,得到原始文件脱敏后的文件流,输出为新的脱敏文件。3.根据权利要求2所述的应用于计算机安全系统的流文件脱敏方法,其特征在于,还包括:当所述一级解码器解析出所述二级文件的尾部数据时,所述第一级解码器将二级文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件的尾部,调用所述二级解码器的结束接口,销毁所述二级解码器和所述脱敏组件。4.根据权利要求3所述的应用于计算机安全系统的流文件脱敏方法,其特征在于,还包括:当所述一级解码器解析出所述原始文件流的尾部数据时,将最后一级文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件的尾部,调用所述一级解码器的结束接口,销毁所述一级解码器。5.根据权利要求4所述的应用于计算机安全系统的流文件脱敏方法,其特征在于:所述二级文件包括第一类型文件和第二类型文件;当一级解码器读取到所述解析数据中的所述第一类型文件的文件头和部分数据时,识别出所述第一类型文件的类型,根据所述第一类型文件的类型创建第一二级解码器和第一脱敏组件。6.根据权利要求5所述的应用于计算机安全系统的流文件脱敏方法,其特征在于,还包括:当第一级解码器解析出所述第一类型文件的尾部数据时,所述第一级解码器将第一类型文件脱敏后的大小和CRC校验信息添加到所述新的脱敏文件中的第一文件的尾部,并销毁所述第一二级解码器和所述第一脱敏组件。
7.根据权利要求6所述的应用于计算机安全系统的流文...

【专利技术属性】
技术研发人员:杜欣朱贺军夏昆崔培升
申请(专利权)人:北京亿赛通科技发展有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1