System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于卷积神经网络的电子文档识别加密及防伪检测方法技术_技高网

基于卷积神经网络的电子文档识别加密及防伪检测方法技术

技术编号:40592694 阅读:5 留言:0更新日期:2024-03-12 21:54
本发明专利技术公开了一种基于卷积神经网络的电子文档识别加密及防伪检测方法,通过对电子印章进行加密;获取待加密电子文档的特征信息;根据特征信息对待加密电子文档进行分类;根据待加密电子文档的分类,对待加密电子文档进行加密设计;在待加密电子文档中加入时间戳;获取电子文档建立和修改的时间并将其进行编码,作为时间戳信息指纹;提取待加密电子文档的文本信息指纹;结合文本信息指纹、时间戳信息指纹、以及加密电子文档的特征向量,生成第一防伪密文水印;将第一防伪密文水印嵌入到透明的图片后再将其嵌入到加密电子文档的页眉中,并将页眉锁定。本发明专利技术提高了数据和文档的安全性、可信度和可追溯性。

【技术实现步骤摘要】

本专利技术涉及电子文档加密和防伪检测,尤其公开了一种基于卷积神经网络的电子文档识别加密及防伪检测方法


技术介绍

1、电子文档加密是在电子文档上添加真实防伪技术,用于打假。纸质文件防伪,采取一些特殊的防伪打印技术和方法。采用各种防伪技术,让各类纸质输出的文件具有防止伪造、防复制、防篡改效果的特质,加密的防伪技术,添加到文件上,从而进行防伪。

2、申请公开号为cn111177666a的专利文献中公开了一种基于脆弱水印的司法文书防伪防篡改方法及系统,在生成pdf文档时,计算得到pdf文档中的需保护的内容的散列值,将其与从pdf文档中的特征要素文字合并,生成pdf文档的防伪防篡改特征指纹信息,经加密后作为水印添加到一个图片中,将添加了水印的图片添加到pdf文档中;验证pdf文档真实性时,计算得到待验证pdf文档中的需保护的内容的散列值,将其与从待验证pdf文档中的特征要素文字合并,生成待验证pdf文档的防伪防篡改特征指纹信息,然后将其与从待验证pdf文档中的图片中的水印中解密得到的防伪防篡改特征指纹信息进行对比,若一致,则待验证pdf文档真实未篡改,否则,待验证pdf文档伪造或被篡改。然而,该专利文献主要是pdf文档中的特征要素文字合并,生成pdf文档的防伪防篡改特征指纹信息,文档内容的安全性、可信度和可追溯性差。

3、因此,现有电子文档加密技术中存在的文档内容的安全性、可信度和可追溯性差,是目前亟待解决的技术问题。


技术实现思路

1、本专利技术提供了一种基于卷积神经网络的电子文档识别加密及防伪检测方法,旨在解决现有电子文档加密技术中存在的文档内容的安全性、可信度和可追溯性差的技术问题。

2、本专利技术涉及一种基于卷积神经网络的电子文档识别加密及防伪检测方法,包括以下步骤:

3、对电子印章进行加密;

4、获取待加密电子文档的特征信息;根据特征信息对待加密电子文档进行分类;

5、根据待加密电子文档的分类,对待加密电子文档进行加密设计;

6、提取待加密电子文档的时间戳信息,在加密电子文档中加入时间戳;将获取的电子文档建立和修改的时间进行编码作为时间戳信息指纹;

7、提取待加密电子文档的文本信息指纹;

8、结合文本信息指纹、时间戳信息指纹、以及加密电子文档的特征向量,生成第一防伪密文水印;

9、将第一防伪密文水印嵌入到透明的图片后再将其嵌入到加密电子文档的页眉中,并将页眉锁定;

10、将锁定页眉的加密电子文档与加密的电子印章进行融合;

11、将在所述页眉中提取的第二防伪密文水印和重新生成的第三防伪密文水印进行比对,检测加密电子文档是否被篡改。

12、进一步地,对电子印章进行加密的步骤中,生成电子印章的量子随机数,并将生成的量子随机数作为密匙,采用非对称加密算法对密匙进行加密;同时设定电子印章密钥对的更新时间。

13、进一步地,获取待加密电子文档的特征信息;根据特征信息对待加密电子文档进行分类的步骤包括:

14、对输入的待加密电子文档进行预处理,将机密文档和非机密文档标记为不同的类型;

15、采用bert模型对待加密电子文档进行编码,得到待加密电子文档的语义信息表示,并将其表示为向量形式;

16、采用cnn模型对bert模型输出的文档向量进行卷积操作,cnn模型使用卷积核来提取文本的局部特征,采用池化操作将局部特征组合成全局特征;

17、将bert模型输出的文档向量和cnn模型输出的全局特征向量拼接在一起,形成一个统一的特征表示;

18、对特征表示应用注意力机制,并对特征表示进行加权;

19、采用全连接层对特征表示进行分类,以对加密电子文档进行机密和非机密类型的分类。

20、进一步地,对输入的待加密电子文档进行预处理,将机密文档和非机密文档标记为不同的类型的步骤包括:

21、分词:采用最大匹配法将待加密电子文档按照设定的规则进行切分,得到词语的序列;

22、标记化:基于空格或标点符号划分,将分词后的词语转换为向量表示;

23、截断:采用定长截断方法对待加密电子文档进行处理,保证输入数据的维度一致;

24、填充:采用pad_sequences方法将所有句子的长度填充到相同的长度,以便输入到模型中进行处理;

25、去停用词:采用基于人工构建的停用词表,将常见的无实际含义的词汇通过加载停用词表进行去除;

26、对机密文档和非机密文档进行标记:将机密文档标记为1,非机密文档标记为0。

27、进一步地,采用bert模型对待加密电子文档进行编码,得到待加密电子文档的语义信息表示,并将其表示为向量形式的步骤中,

28、将预处理后的文本序列作为bert模型的输入,得到每个单词的向量表示,将所有单词的向量表示进行加权平均,得到整个文本序列的向量表示;将所有文本序列的向量进行加权平均,得到整个文档的向量表示;

29、采用bert模型对每个文本序列进行处理,得到单词级别的向量表示:

30、sbert=(s1,s2,...,smn)

31、其中,sbert表示单词级别的向量表示,si表示第i个单词的向量表示,m表示为第m个文本序列,s1,s2,...,smn表示每个文本序列的长度为n;

32、将每个单词的向量表示进行加权平均,得到文本序列的向量表示:

33、

34、其中,vs表示整个文本序列s的向量表示,si表示第i个单词的向量表示,wi表示第i个单词的权重;采用tf-idff算法计算单词的权重;

35、将每个文本序列的向量进行加权平均,得到整个文档的向量表示:

36、

37、其中,vdoc表示整个文档的向量表示,表示第i个文本序列的向量表示,ti表示第i个文本序列的权重。

38、进一步地,采用cnn模型对bert模型输出的文档向量进行卷积操作,cnn模型使用卷积核来提取文本的局部特征,采用池化操作将局部特征组合成全局特征的步骤中,

39、cnn模型将bert模型输出的文档向量作为输入,采用多个不同大小的卷积核对输入进行卷积操作,得到一系列的卷积特征图,每个卷积核提取不同大小的局部特征,从而捕捉不同层次的语义信息;卷积操作将输入的向量序列转化为一系列的特征图,提取文本中的局部特征,cnn模型采用池化操作将局部特征组合成全局特征,采用最大池化提取局部特征中的最大值,将卷积特征图中的局部特征进行组合,得到全局特征,表示整个文本的语义信息。

40、进一步地,将bert模型输出的文档向量和cnn模型输出的全局特征向量拼接在一起,形成一个统一的特征表示的步骤中,

41、对bert模型输出的文本序列和cnn模型输出的局部及全局特征向量进行拼接,首先对bert模型输出的文本序列本文档来自技高网...

【技术保护点】

1.一种基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述对电子印章进行加密的步骤中,生成电子印章的量子随机数,并将生成的所述量子随机数作为密匙,采用非对称加密算法对所述密匙进行加密;同时设定电子印章密钥对的更新时间。

3.如权利要求1所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述获取待加密电子文档的特征信息;根据所述特征信息对待加密电子文档进行分类的步骤包括:

4.如权利要求3所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述对输入的待加密电子文档进行预处理,将机密文档和非机密文档标记为不同的类型的步骤包括:

5.如权利要求3所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述采用BERT模型对待加密电子文档进行编码,得到待加密电子文档的语义信息表示,并将其表示为向量形式的步骤中,

6.如权利要求5所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述采用CNN模型对BERT模型输出的文档向量进行卷积操作,CNN模型使用卷积核来提取文本的局部特征,采用池化操作将局部特征组合成全局特征的步骤中,

7.如权利要求6所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述将BERT模型输出的文档向量和CNN模型输出的全局特征向量拼接在一起,形成一个统一的特征表示的步骤中,

8.如权利要求7所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述对所述特征表示应用注意力机制,并对所述特征表示进行加权的步骤包括:

9.如权利要求1所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述根据待加密电子文档的分类,对待加密电子文档进行加密设计的步骤中,

10.如权利要求1所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述将所述第一防伪密文水印嵌入到透明的图片后再将其嵌入到加密电子文档的页眉中,并将所述页眉锁定的步骤包括:

...

【技术特征摘要】

1.一种基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述对电子印章进行加密的步骤中,生成电子印章的量子随机数,并将生成的所述量子随机数作为密匙,采用非对称加密算法对所述密匙进行加密;同时设定电子印章密钥对的更新时间。

3.如权利要求1所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述获取待加密电子文档的特征信息;根据所述特征信息对待加密电子文档进行分类的步骤包括:

4.如权利要求3所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述对输入的待加密电子文档进行预处理,将机密文档和非机密文档标记为不同的类型的步骤包括:

5.如权利要求3所述的基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,所述采用bert模型对待加密电子文档进行编码,得到待加密电子文档的语义信息表示,并将其表示为向量形式的步骤中,

6.如权利要求5所述...

【专利技术属性】
技术研发人员:陈荣元王金钟炎容周鲜成周开军申立智
申请(专利权)人:湖南工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1