一种跨网交换中的分级数据指纹审计溯源方法技术

技术编号:38765892 阅读:14 留言:0更新日期:2023-09-10 10:39
本发明专利技术提供了一种跨网交换中的分级数据指纹审计溯源方法,包括:指纹提取:对交换文件类型进行判断,并结合文件密级和重要程度进行分级数据指纹提取,将分级数据指纹存入指纹库;其中,分级数据指纹包括五级数据指纹;审计溯源:对待溯源文件进行分级数据指纹提取,并与指纹库中指纹进行比对,完成溯源。本发明专利技术优化了数据指纹提取和审计溯源流程,在保证交换行为审计溯源准确性的情况下,大大节省了系统的计算资源和存储资源,对跨网交换系统的实际建设运行具有重要的现实意义。该方法的设计提出,也可进一步扩展到其他类似需求场景。也可进一步扩展到其他类似需求场景。也可进一步扩展到其他类似需求场景。

【技术实现步骤摘要】
一种跨网交换中的分级数据指纹审计溯源方法


[0001]本专利技术涉及跨网交换领域,特别涉及一种跨网交换中的分级数据指纹审计溯源方法。

技术介绍

[0002]随着信息化的飞速发展,越来越多的数据需要在不同网络间进行安全可控的共享和交换,跨网交换系统应运而生。
[0003]跨网交换系统能够为各种业务系统提供跨网交换服务,但一方面,跨网交换系统对外提供服务,不应存储可恢复成原始数据的日志记录,以免造成信息泄露;另一方面,当交换数据包含恶意代码在接收网络域进行扩散或者包含敏感信息的文件被非法跨网传输后,需要基于审计记录对交换行为进行回溯,以便管理人员掌握情况或进行追责。因此,需要采取数据指纹方式,对交换数据特征进行记录但又无法通过数据指纹对原始信息进行恢复。传统的跨网交换中数据指纹提取方法,是对整个文件进行指纹计算;如果文件内容被改动,则无法实现对交换行为的发现。
[0004]专利201610236750.8用于数据泄露防护的方法和系统,该专利对所述文档进行分词处理,以便获得词序列;对于所述词序列中的每个词语,计算表征该词语在所述文档中的重要性的特征值,并基于所述特征值从所述词序列中选取第一预定数目个词语;利用所提取的数据特征判断第一文档和第二文档是否相关的判断方法、以及根据相关度判断可疑文档是否包含敏感内容。该方法用于数据防泄漏领域,且未对数据文件进行分级处理,造成大量非敏感文件被分词处理并提取指纹,如果该技术用作跨网交换领域,会浪费大量的计算资源和存储资源,且会影响行为审计还原效率。
[0005]专利202211323606.X一种用于数据交换中的数据溯源方法及系统,借助数据指纹技术,在跨多交换节点的场景下,解决对业务数据进行验证数据真伪、判定两条数据是否相同、对业务数据交换过程进行数据溯源、获取业务数据的版本信息、获取最新版本数据等功能。该专利用于判断是否是重复数据跨网交换,且能够对业务数据进行溯源,但其数据指纹是对整个文件进行计算,如果交换文件被修改,将无法根据内容对交换行为进行溯源。

技术实现思路

[0006]针对现有技术中存在的问题,提供了一种跨网交换中的分级数据指纹审计溯源方法,该方法基于数据密级和重要程度进行分级,采用不同粒度的指纹提取方法对交换数据进行数据指纹提取,从而在跨网交换系统实现高效、准确的交换行为审计还原能力。
[0007]本专利技术采用的技术方案如下:一种跨网交换中的分级数据指纹审计溯源方法,包括:
[0008]指纹提取:对交换文件类型进行判断,并结合文件密级和重要程度进行分级数据指纹提取,将分级数据指纹存入指纹库;其中,分级数据指纹包括五级数据指纹;
[0009]审计溯源:对待溯源文件进行分级数据指纹提取,并与指纹库中指纹进行比对,完
成溯源。
[0010]进一步的,所述指纹提取的具体过程包括:
[0011]步骤1.1、对交换文件提取一级数据指纹;
[0012]步骤1.2、判断交换文件是否为办公文件,是则进入步骤1.3,否则进入步骤1.6;
[0013]步骤1.3、提取交换文件的二级数据指纹,
[0014]步骤1.4、根据分级数据指纹提取原则,判断所需提取的数据指纹级别,进入步骤1.5;若不需要提取,则进入步骤1.6;
[0015]步骤1.5、对应提取三级或四级或五级数据指纹;
[0016]步骤1.6、将提取的数据指纹存入指纹库。
[0017]进一步的,所述分级数据指纹提取原则为文件密级、重要程度与数据指纹级别的对应关系;其中,
[0018]文件密级包括非密、内部、秘密、机密及以上四种等级;文件重要程度分为一般和重要两种类型;对应关系为:所有文件均需提取一级数据指纹,非密办公文件提取二级数据指纹,一般内部办公文件提取三级数据指纹,重要内部办公文件、一般秘密办公文件提取四级数据指纹,重要秘密办公文件、机密及以上办公文件提取五级数据指纹。
[0019]进一步的,所述审计溯源的具体过程包括:
[0020]步骤2.1、提取待溯源文件的一级数据指纹,并与指纹库中的一级数据指纹比对,若命中,则报警结束溯源;
[0021]步骤2.2、进行文件类型判断,若是办公文件,则提取该文件的二级数据指纹,并于指纹库中的二级数据指纹比对,若命中则报警结束溯源;若非办公文件,则直接结束溯源;
[0022]步骤2.3、对文件密级和重要程度进行判断,若为非密办公文件,则直接结束溯源,否则进入步骤2.4;
[0023]步骤2.4、根据分级数据指纹提取原则,提取该文件所需提取的所有级别的数据指纹,并与指纹库中对应级别数据指纹依次进行比对,命中任意级别数据指纹时报警结束溯源,否则直接结束溯源。
[0024]进一步的,一级数据指纹提取过程为:对整个交换文件进行数据指纹提取,计算结果为整个文件的数据指纹。
[0025]进一步的,二级数据指纹提取过程为:对文件内容进行提取,再进行数据去噪,对去噪后的数据内容进行数据指纹提取。
[0026]进一步的,三级数据指纹提取过程为:对文件内容进行提取,并按照自然段进行分段划分,再对每个自然段进行去噪,最后对去噪后的数据内容进行数据指纹提取;每个自然段对应一个三级数据指纹。
[0027]进一步的,四级数据指纹提取过程为:对文件内容进行提取,并按照语句进行划分,再对每个语句进行去噪,最后对去噪后的数据内容进行数据指纹提取;每个语句对应一个四级数据指纹。
[0028]进一步的,五级数据指纹提取过程为:对文件内容进行提取,并按照自然段进行划分,每个自然段均采用基于智能的自然语言语义分析进行分词处理;分词后去重并赋予权重,最后对剩余的分词进行数据指纹提取,并记录数据指纹的权重;每个文件提取多组带有数据权重的五级数据指纹。
[0029]进一步的,所述审计溯源过程中,数据指纹比对时,若单个数据指纹与需要比对的数据指纹/数据指纹组中指纹值相等时,则表示该数据指纹被匹配命中;若与需要比对的数据指纹/数据指纹组全部不相等,则表示该数据指纹未匹配命中;其中,对于三级数据指纹和四级指纹,需要计算匹配命中的数据指纹数量与总数据指纹数量的百分比,超过设定阈值时,表示该文件命中;对于五级指纹,按照数据指纹组分组进行比对,每组数据指纹匹配过程中,超过设定阈值则认为该组命中,所有分组再进行命中率计算,超过设定阈值则认为该文件的五级数据指纹命中。
[0030]与现有技术相比,采用上述技术方案的有益效果为:本专利技术针对跨网交换领域对交换数据内容进行交换行为审计分析溯源的需求,提出了基于多级数据指纹的审计溯源方法,优化了数据指纹提取和审计溯源流程,在保证交换行为审计溯源准确性的情况下,大大节省了系统的计算资源和存储资源,对跨网交换系统的实际建设运行具有重要的现实意义。该方法的设计提出,也可进一步扩展到其他类似需求场景。
附图说明
[0031]图1为本专利技术提出的跨网交换文件数据指纹提取流程图。
[0032]图2为本专利技术提出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种跨网交换中的分级数据指纹审计溯源方法,其特征在于,包括:指纹提取:对交换文件类型进行判断,并结合文件密级和重要程度进行分级数据指纹提取,将分级数据指纹存入指纹库;其中,分级数据指纹包括五级数据指纹;审计溯源:对待溯源文件进行分级数据指纹提取,并与指纹库中指纹进行比对,完成溯源。2.根据权利要求1所述的跨网交换中的分级数据指纹审计溯源方法,其特征在于,所述指纹提取的具体过程包括:步骤1.1、对交换文件提取一级数据指纹;步骤1.2、判断交换文件是否为办公文件,是则进入步骤1.3,否则进入步骤1.6;步骤1.3、提取交换文件的二级数据指纹,步骤1.4、根据分级数据指纹提取原则,判断所需提取的数据指纹级别,进入步骤1.5;若不需要提取,则进入步骤1.6;步骤1.5、对应提取三级或四级或五级数据指纹;步骤1.6、将提取的数据指纹存入指纹库。3.根据权利要求2所述的跨网交换中的分级数据指纹审计溯源方法,其特征在于,所述分级数据指纹提取原则为文件密级、重要程度与数据指纹级别的对应关系;其中,文件密级包括非密、内部、秘密、机密及以上四种等级;文件重要程度分为一般和重要两种类型;对应关系为:所有文件均需提取一级数据指纹,非密办公文件提取二级数据指纹,一般内部办公文件提取三级数据指纹,重要内部办公文件、一般秘密办公文件提取四级数据指纹,重要秘密办公文件、机密及以上办公文件提取五级数据指纹。4.根据权利要求3所述的跨网交换中的分级数据指纹审计溯源方法,其特征在于,所述审计溯源的具体过程包括:步骤2.1、提取待溯源文件的一级数据指纹,并与指纹库中的一级数据指纹比对,若命中,则报警结束溯源;步骤2.2、进行文件类型判断,若是办公文件,则提取该文件的二级数据指纹,并于指纹库中的二级数据指纹比对,若命中则报警结束溯源;若非办公文件,则直接结束溯源;步骤2.3、对文件密级和重要程度进行判断,若为非密办公文件,则直接结束溯源,否则进入步骤2.4;步骤2.4、根据分级数据指纹提取原则,提取该文件所需提取的所有级别的数据指纹,并与指纹库中对应级别数据指纹依次进行比...

【专利技术属性】
技术研发人员:程永新廖竣锴郭爽孙秋鸿袁健张亮
申请(专利权)人:中国电子科技集团公司第三十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1