System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种涉密文件的管理方法、设备及存储介质技术_技高网

一种涉密文件的管理方法、设备及存储介质技术

技术编号:40974522 阅读:3 留言:0更新日期:2024-04-18 21:23
本申请公开了一种涉密文件的管理方法,该方法包括,获取涉密文件并存储于涉密文件库中,为每份涉密文件标注元数据,并提取目标查询涉密文件的关键词;通过元数据对涉密文件库中的涉密文件进行检索并推荐;对检索获取的涉密文件,生成以元数据命名的源数据流,并存储至涉密检索库。本发明专利技术还公开了一种涉密文件的管理设备及存储介质。本发明专利技术通过提取目标查询涉密文件的关键词,便于更快速地找到目标涉密文件,提高了检索的准确性和效率,并减少了可能的人为错误;通过对重复涉密文件的管理,降低了因文件混乱和多次类别查取错误导致的文件泄露风险。

【技术实现步骤摘要】

本申请涉及涉密文件管理,更具体地,涉及一种涉密文件的管理方法、设备及存储介质


技术介绍

1、随着信息化时代的发展,为了方便对于文件的监管,文件监管方式不断向电子化以及智能化发展,减少了人工管理,方便了对于文件的信息和管理以及监控,同时结合相应的管理制度,使文件的管理流程更加符合流程。当一个组织同时拥有大量不同类别的涉密文件时,常存在相似或重复的涉密文件,从而导致涉密文件管理变得混乱,在需要紧急调取相关涉密文件时,易发生多次类别查取错误,从而无法准确查询到目标涉密文件的情况,同时造成涉密文件泄露的风险,为了解决上述问题,现提供一种技术方案。


技术实现思路

1、针对现有技术的至少一个缺陷或改进需求,本专利技术提供了一种涉密文件的管理方法、设备及存储介质,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,按照本专利技术的第一个方面,提供了一种涉密文件的管理方法,该方法包括如下步骤:

3、步骤s100,获取涉密文件并存储于涉密文件库中,为每份涉密文件标注元数据,并提取目标查询涉密文件的关键词;

4、步骤s200,通过元数据对涉密文件库中的涉密文件进行检索并推荐;具体步骤为:

5、步骤a1,通过元数据对涉密文件库中的涉密文件,进行重要评估,依据重要程度由高至低进行排列;

6、步骤a2,推荐重要程度最高的涉密文件的类别;

7、步骤a3,检测重要程度相同的涉密文件之间的相似度,对于超出相似度阈值的涉密文件,发出警报提醒

8、步骤a4,对超出相似度阈值的涉密文件进行再次确认,对确认后的涉密文件进行删除,并更新涉密文件库;

9、步骤s300,对检索获取的涉密文件,生成以元数据命名的源数据流,并存储至涉密检索库;

10、步骤s400,定期进行安全审计,审查涉密文件库的使用记录、访问日志以及权限变更记录。

11、进一步地,上述涉密文件的管理方法还包括:

12、步骤a1中,通过元数据对涉密文件库中的涉密文件,进行重要评估,对涉密文件中与元数据相同的词文本进行提取,并且评估词文本在涉密文件中的重要程度,对涉密文件中与元数据相同的词文本进行提取的步骤为:

13、步骤b1,对涉密文件进行文本预处理,去除涉密文件中的标点符号,将英文文本统一转换为小写形式;

14、步骤b2,将处理后的涉密文件分割为不同长度的词文本;

15、步骤b3,通过将元数据与涉密文件中的词文本进行匹配,提取涉密文件中匹配成功的词文本;

16、步骤b4,分别计算涉密文件中匹配成功的词文本的词频以及逆文档频率,评估词文本在涉密文本中的词重要程度:

17、;

18、;

19、;

20、式中:为词文本在涉密文本中的词重要程度,为涉密文件中匹配成功的词文本的词频,为词文本在涉密文档中的出现次数,为涉密文档中词文本的总数量,为涉密文件中匹配成功的词文本的逆文档频率,为涉密文件库中涉密文件的总数量,为涉密文件库中涉及词文本的涉密文档数量;

21、步骤b5,将包含词文本的涉密文档,依据词重要程度由高至低进行排序,并存储至文档调取库。

22、进一步地,上述涉密文件的管理方法还包括:

23、步骤a2中,推荐重要程度最高的涉密文件的类别,依据由高至低排序完成的词重要程度,推荐词重要程度最高的涉密文件的类别,确认推荐的涉密文件是否为目标涉密文件;当是目标涉密文件时,输出确认结果;当不是目标涉密文件时,推荐词重要程度第二的涉密文件的类别,并再次进行确认,直至文档调取库中的文档全部确认完成或达到预定的审阅次数或已确认所需涉密文件。

24、按照本专利技术的第二个方面,还提供了一种涉密文件的管理设备,包括:

25、处理器以及与处理器通讯相连的文件收集单元、关键词录入单元、检索推荐单元、存储单元以及安全审计单元,文件收集单元用于获取涉密文件并存储于涉密文件库中,为每份涉密文件标注元数据;关键词录入单元用于录入目标查询涉密文件的关键词;检索推荐单元用于通过元数据对涉密文件库中的涉密文件进行检索并推荐;存储单元用于存储涉密文件;安全审计单元用于定期审查涉密文件库的使用记录、访问日志以及权限变更记录。

26、进一步地,上述涉密文件的管理设备,还包括:

27、检索推荐单元包括重要性评估子单元、排序子单元、相似度检测子单元、警报子单元以及确认子单元,重要性评估子单元用于通过元数据对涉密文件库中的涉密文件,进行重要评估;排序子单元用于依据重要程度由高至低进行排列;自动推荐子单元用于推荐重要程度最高的涉密文件的类别;相似度检测子单元用于检测重要程度相同的涉密文件之间的相似度;警报子单元用于对超出相似度阈值的涉密文件,发出警报提醒;确认子单元用于对超出相似度阈值的涉密文件进行再次确认,对确认后的涉密文件进行删除。

28、进一步地,上述涉密文件的管理设备,还包括:

29、相似度检测子单元包括文本处理次单元、文本分割次单元、词频计算次单元、词文本排序次单元、匹配次单元以及相似度计算次单元。

30、按照本专利技术的第三个方面,还提供了一种存储介质,其存储有可由涉密文件的管理设备执行的计算机程序,当所述计算机程序在涉密文件的管理设备上运行时,使得所述涉密文件的管理设备执行上述任一项所述方法的步骤。

31、总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:

32、本专利技术的技术方案通过为每份涉密文件添加元数据标注,使文件信息更为全面,有助于后续的检索和管理;通过提取目标查询涉密文件的关键词,便于更快速地找到目标涉密文件,提高了检索的准确性和效率;将检索获取的涉密文件生成以元数据命名的源数据流,并存储至涉密检索库,有助于建立完整的检索记录,方便溯源和审计;自动化的检索和推荐功能减少了对人工管理的需求,提高了工作效率,并减少了可能的人为错误;通过对重复涉密文件的管理,降低了因文件混乱和多次类别查取错误导致的文件泄露风险。

本文档来自技高网...

【技术保护点】

1.一种涉密文件的管理方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种涉密文件的管理方法,其特征在于,所述通过元数据对涉密文件库中的涉密文件并进行重要评估,包括对涉密文件中与元数据相同的词文本进行提取,并且评估词文本在涉密文件中的重要程度,对涉密文件中与元数据相同的词文本进行提取,具体为:

3.根据权利要求1所述的一种涉密文件的管理方法,其特征在于,所述推荐重要程度最高的涉密文件的类别,包括

4.一种涉密文件的管理设备,其特征在于,包括处理器以及与处理器通讯相连的文件收集单元、关键词录入单元、检索推荐单元、存储单元以及安全审计单元;其中,

5.根据权利要求4所述的一种涉密文件的管理设备,其特征在于,相似度检测子单元包括文本处理次单元、文本分割次单元、词频计算次单元、词文本排序次单元、匹配次单元以及相似度计算次单元。

6.一种存储介质,其特征在于,其存储有可由涉密文件的管理设备执行的计算机程序,当所述计算机程序在涉密文件的管理设备上运行时,使得所述涉密文件的管理设备执行权利要求1~3任一项所述方法的步骤。p>...

【技术特征摘要】

1.一种涉密文件的管理方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种涉密文件的管理方法,其特征在于,所述通过元数据对涉密文件库中的涉密文件并进行重要评估,包括对涉密文件中与元数据相同的词文本进行提取,并且评估词文本在涉密文件中的重要程度,对涉密文件中与元数据相同的词文本进行提取,具体为:

3.根据权利要求1所述的一种涉密文件的管理方法,其特征在于,所述推荐重要程度最高的涉密文件的类别,包括

4.一种涉密文件的管理设备,其特征在于,包括处理器...

【专利技术属性】
技术研发人员:廖巍李瑶瑶韩敏
申请(专利权)人:武汉华工安鼎信息技术有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1