System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据安全防护一体化系统及其方法技术方案_技高网

数据安全防护一体化系统及其方法技术方案

技术编号:40212422 阅读:7 留言:0更新日期:2024-02-02 22:21
本申请涉及智能防护技术领域,其具体地公开了一种数据安全防护一体化系统及其方法,其采用基于深度学习的人工智能检测算法,提取出待检测数据和敏感词汇的特征信息,再进一步计算所述待检测数据特征和所述敏感词汇特征之间的转移矩阵来表示两者的特征相似度,以此来判断该数据是否为敏感数据。这样,能够自动化地对大量数据进行处理,提高了敏感数据识别准确性和效率。

【技术实现步骤摘要】

本申请涉及智能防护,且更为具体地,涉及一种数据安全防护一体化系统及其方法


技术介绍

1、随着互联网的飞速发展,数据安全防护越来越引起重视,而敏感数据识别在数据安全防护中具有重要的意义,其主要目的是识别和标记存储在系统中的敏感数据,以便采取相应的安全措施来保护这些数据。敏感数据,是指泄漏后可能会给社会或个人带来严重危害的数据。同时,敏感数据又称隐私数据,包括所有不公开或未分类的信息,包括个人隐私数据,如姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等;以及企业私密信息,如企业的经营情况,客户信息、商业机密等。

2、通过敏感数据识别,可以及时发现和标记这些数据,从而采取合适的安全措施,防止其被未经授权的人员访问、泄露或滥用。由于当下的数据大都有容量大,较为复杂的特点,而传统的利用人工进行梳理的速度较慢,并且不同人对相同的数据会有不同的判断,使得敏感数据在识别时产生的结果具有差异性。

3、因此,期待一种数据安全防护一体化系统及其方法。


技术实现思路

1、为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种数据安全防护一体化系统及其方法,其采用基于深度学习的人工智能检测算法,提取出待检测数据和敏感词汇的特征信息,再进一步计算所述待检测数据特征和所述敏感词汇特征之间的转移矩阵来表示两者的特征相似度,以此来判断该数据是否为敏感数据。这样,能够自动化地对大量数据进行处理,提高了敏感数据识别准确性和效率。

2、相应地,根据本申请的一个方面,提供了一种数据安全防护一体化系统,其包括:

3、数据采集模块,用于获取待检测数据和敏感词汇集合;

4、待检测数据语义理解模块,用于将所述待检测数据通过包含嵌入层的上下文编码器以得到多个上下文语义特征向量;

5、第一尺度感知模块,用于将所述多个上下文语义特征向量进行级联以得到第一尺度语义关联特征向量;

6、第二尺度感知模块,用于将所述多个上下文语义特征向量进行二维排列为上下文语义特征矩阵后通过包含多个混合卷积层的卷积神经网络模型以得到第二尺度语义关联特征向量;

7、多尺度融合模块,用于对所述第一尺度语义关联特征向量和所述第二尺度语义关联特征向量进行插值秩序化融合以得到待检测数据特征向量;

8、敏感词汇语义理解模块,用于将所述敏感词汇集合通过包含嵌入层的上下文编码器以得到敏感数据特征向量;

9、转移计算模块,用于计算所述待检测数据特征向量与所述敏感数据特征向量之间的转移矩阵作为分类特征矩阵;

10、检测结果生成模块,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示该检测数据是否为敏感数据。

11、在上述数据安全防护一体化系统中,所述待检测数据语义理解模块,包括:嵌入化单元,用于使用所述上下文编码器的嵌入层将所述待检测数据中的各个数据项的文本数据分别映射为词嵌入向量;数据添加单元,用于将所述各个数据项中的数值数据分别添加到所述各个数据项的词嵌入向量的尾部以得到多个数据项嵌入向量;上下文编码单元,用于使用所述上下文编码器的基于转换器的bert模型对所述多个数据项嵌入向量进行上下文语义编码以得到所述多个上下文语义特征向量。

12、在上述数据安全防护一体化系统中,所述上下文编码单元,包括:一维排列子单元,用于将所述多个数据项嵌入向量进行一维排列以得到数据项全局嵌入向量;自注意力生成子单元,用于计算所述数据项全局嵌入向量与所述多个数据项嵌入向量中各个数据项嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;标准化自注意力子单元,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;权重生成子单元,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过分类函数以得到多个概率值;加权子单元,用于分别以所述多个概率值中各个概率值作为权重对所述多个数据项嵌入向量中各个数据项嵌入向量进行加权以得到所述多个上下文语义特征向量。

13、在上述数据安全防护一体化系统中,所述第二尺度感知模块,用于:使用所述卷积神经网络模型的各个混合卷积层在层的正向传递中分别对输入数据进行:使用具有第一尺寸的第一卷积核对所述上下文语义特征矩阵进行卷积编码以得到第一尺度特征图;使用具有第一空洞率的第二卷积核对所述上下文语义特征矩阵进行卷积编码以得到第二尺度特征图;使用具有第二空洞率的第三卷积核对所述上下文语义特征矩阵进行卷积编码以得到第三尺度特征图;使用具有第三空洞率的第四卷积核对所述上下文语义特征矩阵进行卷积编码以得到第四尺度特征图,其中,所述第一卷积核、所述第二卷积核、所述第三卷积核和所述第四卷积核具有相同的尺寸,且所述第二卷积核、所述第三卷积核和所述第四卷积核具有不同的空洞率;将所述第一尺度特征图、所述第二尺度特征图、所述第三尺度特征图和所述第四尺度特征图进行沿通道维度的聚合以得到聚合特征图;对所述聚合特征图进行沿通道维度的各个特征矩阵的全局池化处理以生成池化特征图;对所述池化特征图进行激活处理以生成激活特征图;其中,所述包含多个混合卷积层的卷积神经网络模型的最后一层的输出为所述第二尺度语义关联特征向量。

14、在上述数据安全防护一体化系统中,所述多尺度融合模块,包括:差分计算单元,用于计算所述第一尺度语义关联特征向量和所述第二尺度语义关联特征向量之间的按位置差分以得到差分特征向量;按位置加权单元,用于计算所述第一尺度语义关联特征向量和所述第二尺度语义关联特征向量之间的按位置加权以得到点加特征向量;余弦相似度计算单元,用于计算所述差分特征向量和所述点加特征向量之间的余弦相似度;加权融合单元,用于以所述差分特征向量和所述点加特征向量之间的余弦相似度作为权重参数,并以如下融合公式来融合所述第一尺度语义关联特征向量和所述第二尺度语义关联特征向量以得到所述待检测数据特征向量;其中,所述融合公式为:vi=αv1+(1-α)v2,v1表示所述第一尺度语义关联特征向量、v2表示所述第二尺度语义关联特征向量,α表示权重参数,vi表示所述待检测数据特征向量。

15、在上述数据安全防护一体化系统中,所述敏感词汇语义理解模块,包括:嵌入向量化单元,用于使用所述上下文编码器的嵌入层分别将所述敏感词汇集合中各个敏感词汇映射为词嵌入向量以得到词嵌入向量的序列;语义编码单元,用于使用所述上下文编码器的基于转换器的bert模型对所述词嵌入向量的序列进行基于全局的上下文语义编码以得到多个词特征向量;级联单元,用于将所述多个词特征向量进行级联以得到所述敏感数据特征向量。

16、在上述数据安全防护一体化系统中,所述转移计算模块,用于:以如下转移公式计算所述待检测数据特征向量与所述敏感数据特征向量之间的转移矩阵;

17、其中,所述转移公式为:

18、

19、其中va表示所述待检测数据特征向量,vb表示所述敏感数据本文档来自技高网...

【技术保护点】

1.一种数据安全防护一体化系统,其特征在于,包括:

2.根据权利要求1所述的数据安全防护一体化系统,其特征在于,所述待检测数据语义理解模块,包括:

3.根据权利要求2所述的数据安全防护一体化系统,其特征在于,所述上下文编码单元,包括:

4.根据权利要求3所述的数据安全防护一体化系统,其特征在于,所述第二尺度感知模块,用于:使用所述卷积神经网络模型的各个混合卷积层在层的正向传递中分别对输入数据进行:

5.根据权利要求4所述的数据安全防护一体化系统,其特征在于,所述多尺度融合模块,包括:

6.根据权利要求5所述的数据安全防护一体化系统,其特征在于,所述敏感词汇语义理解模块,包括:

7.根据权利要求6所述的数据安全防护一体化系统,其特征在于,所述转移计算模块,用于:以如下转移公式计算所述待检测数据特征向量与所述敏感数据特征向量之间的转移矩阵;

8.一种数据安全防护一体化方法,其特征在于,包括:

9.根据权利要求8所述的数据安全防护一体化方法,其特征在于,将所述待检测数据通过包含嵌入层的上下文编码器以得到多个上下文语义特征向量,包括:

10.根据权利要求9所述的数据安全防护一体化方法,其特征在于,使用所述上下文编码器的基于转换器的Bert模型对所述多个数据项嵌入向量进行上下文语义编码以得到所述多个上下文语义特征向量,包括:

...

【技术特征摘要】

1.一种数据安全防护一体化系统,其特征在于,包括:

2.根据权利要求1所述的数据安全防护一体化系统,其特征在于,所述待检测数据语义理解模块,包括:

3.根据权利要求2所述的数据安全防护一体化系统,其特征在于,所述上下文编码单元,包括:

4.根据权利要求3所述的数据安全防护一体化系统,其特征在于,所述第二尺度感知模块,用于:使用所述卷积神经网络模型的各个混合卷积层在层的正向传递中分别对输入数据进行:

5.根据权利要求4所述的数据安全防护一体化系统,其特征在于,所述多尺度融合模块,包括:

6.根据权利要求5所述的数据安全防护一体化系统,其特征在于,所述敏感词...

【专利技术属性】
技术研发人员:翁武焰何颖吴慧明
申请(专利权)人:福建中信网安信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1