基于关键数据敏感度的安全销毁评估系统和方法技术方案

技术编号:39508391 阅读:9 留言:0更新日期:2023-11-25 18:43
本发明专利技术公开了基于关键数据敏感度的安全销毁评估系统和方法,属于关键数据销毁领域,解决了如何对目标文本文件进行安全销毁处理,使得销毁后的目标文本文件安全性高的问题;包括定义敏感词类型集合,根据敏感词类型集合所包含的敏感词类型获取相对应的敏感词识别网络模型;获取需要进行安全销毁处理的目标文本文件;基于敏感词识别网络模型,对目标文本文件所包含的所有敏感词类型的敏感词进行标记;根据敏感词类型集合和目标文本文件的敏感词标记,对目标文本文件连续实行

【技术实现步骤摘要】
基于关键数据敏感度的安全销毁评估系统和方法


[0001]本专利技术属于关键数据销毁领域,具体是基于关键数据敏感度的安全销毁评估系统和方法


技术介绍

[0002]关键数据销毁指的是在一定安全要求和合规性标准下,对包含敏感

机密或重要信息的数据进行清除的过程,从而防止敏感信息被未经授权的用户访问

泄漏或滥用

关键数据可以包括个人身份信息

财务数据

医疗记录

商业机密等,不同行业领域的关键数据不同或重合

[0003]申请公开号为
CN111461558A
的中国专利公开了关键数据安全销毁评估方法,该方法根据数据安全销毁与实际场景之间的利益关系及数据销毁方法自身的性能,给出了合理的指标体系以及权重确定方法,以便后续效果评估的展开

另外,考虑到评判过程中存在着非线性关系,依据指标体系

专家打分

实际销毁数据统计等给出了一种基于
AHP
和卷积神经网络的关键数据安全销毁方法,从而得到每种销毁方法的合理评估值,为数据销毁方案的制定提供依据

[0004]该现有技术是在关键数据完全销毁后,再对关键数据安全销毁的效果进行评估,使得在对关键数据进行销毁的过程中可能存在销毁不准确的问题,而无法及时避免,并使得销毁后的文本文件安全性较低

为此,本专利技术提出了基于关键数据敏感度的安全销毁评估系统和方法


技术实现思路

[0005]本专利技术旨在至少解决现有技术中存在的技术问题之一

为此,本专利技术提出基于关键数据敏感度的安全销毁评估系统和方法,解决了如何对目标文本文件进行安全销毁处理,使得销毁后的目标文本文件安全性高的问题

[0006]为实现上述目的,根据本专利技术的第一方面的实施例提出基于关键数据敏感度的安全销毁评估方法,包括:
[0007]定义敏感词类型集合,根据敏感词类型集合所包含的敏感词类型获取相对应的敏感词识别网络模型;
[0008]获取需要进行安全销毁处理的目标文本文件;基于敏感词识别网络模型,对目标文本文件所包含的所有敏感词类型的敏感词进行标记;
[0009]根据敏感词类型集合和目标文本文件的敏感词标记,对目标文本文件连续实行
n
轮敏感词安全销毁处理,每轮处理一种敏感词类型;
n
为目标文本文件敏感词类型的总数量

[0010]进一步地,所述敏感词类型集合包括企业或单位所在行业领域内所涉及的各种敏感词类型和对应敏感词类型的权重系数值;所述权重系数值指的是相应敏感词类型的重要程度

[0011]进一步地,基于敏感词识别网络模型,对目标文本文件所包含的所有敏感词类型的敏感词进行标记的方式如下:
[0012]根据分词技术将目标文本文件中的文本数据按照标点符号进行句子分割,针对每一个句子进行词语划分,从而将目标文本文件划分为多个词语,获取目标文本文件的词语列表;
[0013]将目标文本文件的词语列表所包含的所有词语分别输入至由前期定义的敏感词类型集合所对应的各个敏感词识别网络模型;
[0014]针对每种敏感词类型的敏感词,对应敏感词识别网络模型输出目标文本文件的词语列表所包含的每个词语是否为对应敏感词类型的敏感词标签;所述敏感词标签为0或1中的一种,并将敏感词标签为1的词语作为对应敏感词类型的敏感词,将敏感词标签为0的词语作为不属于对应敏感词类型的词语;将敏感词标签为1的词语组成对应敏感词类型的敏感词列表;
[0015]将目标文本文件的词语列表与敏感词列表一一对应,建立目标文本文件中所包含的词语与相应敏感词类型之间的映射关系;
[0016]在目标文本文件中,根据敏感词类型,对需要标记为相应敏感词类型的词语进行标记

[0017]进一步地,根据敏感词类型集合和目标文本文件的敏感词标记,对目标文本文件连续实行
n
轮敏感词安全销毁处理的方式为
:
[0018]统计目标文本文件的所有敏感词类型;
[0019]获取前期定义的敏感词类型集合,将目标文本文件的所有敏感词类型与敏感词类型集合进行匹配,获取目标文本文件中所有敏感词类型的权重系数值;
[0020]将目标文本文件中的所有敏感词类型按照对应的权重系数值从大到小的顺序进行排列,并按照此顺序对目标文本文件中的敏感词类型进行编号,将敏感词类型的编号标记为
i
,其中
i=1,2,

,n

[0021]进而按照敏感词类型的编号顺序连续实行
n
轮敏感词的安全销毁处理

[0022]进一步地,第
i
轮敏感词安全销毁处理过程包括:
[0023]获取经过第
i
‑1轮安全销毁处理后的目标文本文件,将获取的目标文本文件标记为第
j
文本文件;对第
j
文本文件进行备份,获取第
j+1
文本文件,
j
为大于等于1的正整数;
[0024]根据第
j
文本文件中第
i
敏感词类型的词语的标记,统计第
i
敏感词类型的词语数量
NSij
,以及统计不属于第
i
敏感词类型的词语数量
NFij

[0025]若
NSij
等于0,则删除第
j+1
文本文件,结束本轮安全销毁处理,并进入下一轮安全销毁处理;若
NSij
大于0,则启动对第
j
文本文件中第
i
敏感词类型的敏感词的销毁处理;
[0026]将经过本轮销毁后的第
j
文本文件利用分词技术进行分词处理,获取经过本轮销毁后的第
j
文本文件的所有词语输入至第
i
敏感词类型的敏感词识别网络模型,获取经过本轮销毁后的第
j
文本文件中每个词语的敏感词标签;统计敏感词标签为1的词语数量
NSXij
和敏感词标签为0的词语数量
NFXij

[0027]计算第
j
文本文件进行销毁处理后的销毁评估值
Pij
,计算公式如下:
[0028];
[0029]式中,
ɑ
表示漏删值的比例因子,
β
表示误删值的比例因子;且
ɑ
>0,
β
>0,
ɑ
+
β
=1

N
表示目标文本文件的词语列表所包含的词语总数;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于关键数据敏感度的安全销毁评估方法,其特征在于,包括:定义敏感词类型集合,根据敏感词类型集合所包含的敏感词类型获取相对应的敏感词识别网络模型;获取需要进行安全销毁处理的目标文本文件;基于敏感词识别网络模型,对目标文本文件所包含的所有敏感词类型的敏感词进行标记;根据敏感词类型集合和目标文本文件的敏感词标记,对目标文本文件连续实行
n
轮敏感词安全销毁处理,每轮处理一种敏感词类型;
n
为目标文本文件敏感词类型的总数量
。2.
根据权利要求1所述的基于关键数据敏感度的安全销毁评估方法,其特征在于,所述敏感词类型集合包括企业或单位所在行业领域内所涉及的各种敏感词类型和对应敏感词类型的权重系数值;所述权重系数值指的是相应敏感词类型的重要程度
。3.
根据权利要求1所述的基于关键数据敏感度的安全销毁评估方法,其特征在于,基于敏感词识别网络模型,对目标文本文件所包含的所有敏感词类型的敏感词进行标记的方式如下:根据分词技术将目标文本文件中的文本数据按照标点符号进行句子分割,针对每一个句子进行词语划分,从而将目标文本文件划分为多个词语,获取目标文本文件的词语列表;将目标文本文件的词语列表所包含的所有词语分别输入至由前期定义的敏感词类型集合所对应的各个敏感词识别网络模型;针对每种敏感词类型的敏感词,对应敏感词识别网络模型输出目标文本文件的词语列表所包含的每个词语是否为对应敏感词类型的敏感词标签;所述敏感词标签为0或1中的一种,并将敏感词标签为1的词语作为对应敏感词类型的敏感词,将敏感词标签为0的词语作为不属于对应敏感词类型的词语;将敏感词标签为1的词语组成对应敏感词类型的敏感词列表;将目标文本文件的词语列表与敏感词列表一一对应,建立目标文本文件中所包含的词语与相应敏感词类型之间的映射关系;在目标文本文件中,根据敏感词类型,对需要标记为相应敏感词类型的词语进行标记
。4.
根据权利要求2所述的基于关键数据敏感度的安全销毁评估方法,其特征在于,根据敏感词类型集合和目标文本文件的敏感词标记,对目标文本文件连续实行
n
轮敏感词安全销毁处理的方式为
:
统计目标文本文件的所有敏感词类型;获取前期定义的敏感词类型集合,将目标文本文件的所有敏感词类型与敏感词类型集合进行匹配,获取目标文本文件中所有敏感词类型的权重系数值;将目标文本文件中的所有敏感词类型按照对应的权重系数值从大到小的顺序进行排列,并按照此顺序对目标文本文件中的敏感词类型进行编号,将敏感词类型的编号标记为
i
,其中
i=1,2,

,n
;进而按照敏感词类型的编号顺序连续实行
n
轮敏感词的安全销毁处理
。5.
根据权利要求4所述的基于关键数据敏感度的安全销毁评估方法,其特征在于,第
i
轮敏感词安全销毁处理过程包括:获取经过第
i
‑1轮安全销毁处理后的目标文本文件,将获取的目标文本文件标记为第
j
文本文件;对第
j
文本文件进行备份,获取第
j+1
文本文件,
j
为大于等于1的正整数;
根据第
j
文本文件中第
i
敏感词类型的词语的标记,统计第
i
敏感词类型的词语数量
NSij
,以及统计不属于第
i
敏感词类型的词语数量
NFij
;若
NSij
等于0,则删除第
j+1
文本文件,结束本轮安全销毁处理,并进入下一轮安全销毁处理;若
NSij
大于0,则启动对第
j
文本文件中第
i
敏感词类型的敏感词的销毁处理;将经过本轮销毁后的第
j
文本文件利...

【专利技术属性】
技术研发人员:李峰顾亮
申请(专利权)人:南京怡晟安全技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1