System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种电子合同文本敏感数据信息优化处理方法技术_技高网

一种电子合同文本敏感数据信息优化处理方法技术

技术编号:40502472 阅读:4 留言:0更新日期:2024-02-26 19:30
本发明专利技术涉及数据加密技术领域,具体涉及一种电子合同文本敏感数据信息优化处理方法,该方法包括:获取待加密的电子合同文本并进行预处理操作;结合电子合同文本进行分词后的结果构建电子合同结构文本;获取电子合同结构文本中的敏感词;根据各敏感词及其位置信息生成基准密钥参量;基于基准密钥参量以及电子合同结构数据的数据摘要获取敏感密钥;基于敏感密钥对电子合同文本数据中的敏感词进行脱敏;将脱敏后的电子合同文本与脱敏密钥存储到数据库中,实现电子合同文本数据的查看。本发明专利技术增强了电子文本可读性和可辨识性,保证了加密密钥的唯一性和不可分析性。

【技术实现步骤摘要】

本申请涉及数据加密,具体涉及一种电子合同文本敏感数据信息优化处理方法


技术介绍

1、公司在实际业务中会有大量的合同签署,传统的纸质合同会占用大量的资料,即不经济环保,且需要用户填写大量信息,还需要在线下进行盖章。而为了节省时间和成本以及方便用户考虑,现有技术中考虑使用电子合同的形式,在现有的电子合同中,当用户点击签署电子合同时系统会自动把用户信息全部填写进去,用户只需要输入手机号确定签署即可。全过程只需要几秒时间,其中不包括用户确认合同内容时间以及手写签名时间,极大地降低了纸质合同签署的时间。

2、而当企业在第三方电子合同签署平台上进行电子合同签署时,会存在将企业的电子合同的内容暴露给第三方电子合同签署平台的风险;为了增加平台可信度,提高用户体验,第三方电子合同签署平台需增设电子合同加密模块,电子合同加密模块根据企业的私钥对电子合同进行加密,且企业的私钥只在参与合同签署的企业中共享,以此实现企业的电子合同对于第三方平台保密的目的。

3、现有对于电子合同文本敏感数据信息的处理,仅仅是采用数据加密算法对电子合同文本进行全局加密,在这种方式下虽然是对数据进行了保护,但由于电子合同文本中存在着大量的板式数据,尤其是模板内容,这些数据是公开透明的,并不值得消耗资源去对其进行加密保护。


技术实现思路

1、为了解决上述技术问题,本专利技术提供一种电子合同文本敏感数据信息优化处理方法,以解决现有的问题。

2、本专利技术的一种电子合同文本敏感数据信息优化处理方法采用如下技术方案:

3、本专利技术一个实施例提供了一种电子合同文本敏感数据信息优化处理方法,该方法包括以下步骤:

4、获取待加密的电子合同文本并进行预处理操作;

5、结合电子合同文本进行分词后的结果构建电子合同结构文本;排除电子合同结构文本中的结构化词语;获取电子合同结构文本剩余词语中的敏感词;

6、根据各敏感词及其位置信息生成基准密钥参量;采用数据摘要算法获取电子合同结构数据的数据摘要;根据数据摘要以及基准密钥参量获取敏感密钥各位字符数据;根据各位字符数据组成敏感密钥;基于敏感密钥对电子合同文本数据中的敏感词进行脱敏;

7、将脱敏后的电子合同文本与脱敏密钥存储到数据库中,实现电子合同文本数据的查看。

8、优选的,所述预处理操作包括但不限于:标准化、分词、去停用词以及处理缺失值。

9、优选的,所述结合电子合同文本进行分词后的结果构建电子合同结构文本,包括:

10、对电子合同文本进行分词得到分词集合;将电子合同文本的分词集合中的各个词语的顺序在电子合同文本中找到对应词语的位置进行标记,得到电子合同结构文本。

11、优选的,所述排除电子合同结构文本中的结构化词语,包括:

12、统计电子合同结构文本中各个词语的词频,将大于预设经验值的词频的词语作为电子合同结构文本中的结构化词语,将结构化词语从电子合同结构文本中排除。

13、优选的,所述获取电子合同结构文本剩余词语中的敏感词,包括:

14、采用语义分析算法对电子合同结构文本中剩余的词语进行语义分析;采用文字匹配识别模型对语义分析结果中的敏感词进行标记。

15、优选的,所述根据各敏感词及其位置信息生成基准密钥参量,包括:

16、对于各敏感词,获取敏感词在电子合同文本中的位置;获取敏感词的ascll编码;计算所述位置与所述ascll编码的取模结果,将所有敏感词的所述取模结果的和值作为基准密钥参量。

17、优选的,所述根据数据摘要以及基准密钥参量获取敏感密钥各位字符数据,包括:

18、对于敏感密钥的第i位字符数据,获取数据摘要的二进制数据中的第i位二进制数据;获取基准密钥参量与数值i取模后的二进制数据;

19、将所述第i位二进制数据与所述取模后的二进制数据进行异或,将异或结果转为ascll码作为敏感密钥的第i位字符数据。

20、优选的,所述根据各位字符数据,将所有位字符数据按照获取顺序组成敏感密钥。

21、优选的,所述基于敏感密钥对电子合同文本数据中的敏感词进行脱敏,包括:

22、利用敏感密钥对电子合同文本数据中的各敏感词采用保留格式加密算法进行加密操作,将各敏感词对应加密后的结果替换掉各对应敏感词,完成电子合同文本数据中敏感词的数据脱敏。

23、优选的,所述将脱敏后的电子合同文本与脱敏密钥存储到数据库中,实现电子合同文本数据的查看,包括:

24、将脱敏后的电子合同文本与脱敏密钥存储到数据库中;

25、当身份校验通过时,将脱敏密钥分发给用户,用户利用脱敏密钥对脱敏后的电子合同文本数据进行解密;否则,不发送脱敏密钥给用户。

26、本专利技术至少具有如下有益效果:

27、本专利技术提出了一种针对于电子合同文本中的敏感数据进行自适应脱敏的方法,其通过结合上下文内容对数据进行分辨,从而完成了对电子合同文本的敏感信息加密处理,同时保留了电子文本的基准可读性,增强了在解密前的电子文本可读性和可辨识性,在节省了计算资源和加密的效率同时保证了加密密钥的唯一性和不可分析性。

本文档来自技高网...

【技术保护点】

1.一种电子合同文本敏感数据信息优化处理方法,其特征在于,该方法包括以下步骤:

2.如权利要求1所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述预处理操作包括但不限于:标准化、分词、去停用词以及处理缺失值。

3.如权利要求2所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述结合电子合同文本进行分词后的结果构建电子合同结构文本,包括:

4.如权利要求3所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述排除电子合同结构文本中的结构化词语,包括:

5.如权利要求4所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述获取电子合同结构文本剩余词语中的敏感词,包括:

6.如权利要求5所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述根据各敏感词及其位置信息生成基准密钥参量,包括:

7.如权利要求6所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述根据数据摘要以及基准密钥参量获取敏感密钥各位字符数据,包括:

8.如权利要求7所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述根据各位字符数据,将所有位字符数据按照获取顺序组成敏感密钥。

9.如权利要求8所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述基于敏感密钥对电子合同文本数据中的敏感词进行脱敏,包括:

10.如权利要求9所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述将脱敏后的电子合同文本与脱敏密钥存储到数据库中,实现电子合同文本数据的查看,包括:

...

【技术特征摘要】

1.一种电子合同文本敏感数据信息优化处理方法,其特征在于,该方法包括以下步骤:

2.如权利要求1所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述预处理操作包括但不限于:标准化、分词、去停用词以及处理缺失值。

3.如权利要求2所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述结合电子合同文本进行分词后的结果构建电子合同结构文本,包括:

4.如权利要求3所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述排除电子合同结构文本中的结构化词语,包括:

5.如权利要求4所述的一种电子合同文本敏感数据信息优化处理方法,其特征在于,所述获取电子合同结构文本剩余词语中的敏感词,包括:

6.如权利要求5所述的一种电子合同文本敏感数...

【专利技术属性】
技术研发人员:刘洪涛李金浩
申请(专利权)人:青岛闪收付信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1