当前位置: 首页 > 专利查询>周婷专利>正文

档案存储方法、装置、存储介质及电子设备制造方法及图纸

技术编号:25271193 阅读:28 留言:0更新日期:2020-08-14 23:04
本申请提供一种档案存储方法、装置、存储介质及电子设备,方法包括:确定出待存储档案的词节点,其中,词节点包含待存储档案中本文内容的词语特征;根据待存储档案的词节点和已存储档案的词节点,确定出待存储档案的词节点对应的节点特征;根据节点特征,确定出待存储档案的档案特征,并将待存储档案与档案特征关联后存储,其中,档案特征用于检验待存储档案是否被篡改。在存储的档案面临篡改时,由于档案特征中不仅包括被篡改档案的特征,还包括其他已存储档案的特征,因此,可以在篡改发生后,迅速发现档案被篡改,从而提高了对已存储档案的篡改难度,增加了档案存储的安全性。

【技术实现步骤摘要】
档案存储方法、装置、存储介质及电子设备
本申请涉及数据处理领域,具体而言,涉及一种档案存储方法、装置、存储介质及电子设备。
技术介绍
科技的发展使得人们的工作和生活逐渐智能化,而资料(例如个人档案、工作资料)等与我们的生活息息相关。过去的资料保存方式,通常是采用的纸质资料保存方式,但这样的方式一是不方便(例如需要占用空间,查找起来更是费时费力),而是容易遗失和损坏。电子资料的保存,有其独特的优势(例如存储方便、使用方便,且不易遗失、不易损坏等),但电子资料的保存,却面临着严重的安全性问题,容易被他人篡改或被删除,从而带来麻烦和损失。
技术实现思路
本申请实施例的目的在于提供一种档案存储方法、装置、存储介质及电子设备,以提高档案存储的安全性。为了实现上述目的,本申请的实施例通过如下方式实现:第一方面,本申请实施例提供一种档案存储方法,包括:确定出待存储档案的词节点,其中,所述词节点包含所述待存储档案中本文内容的词语特征;根据所述待存储档案的词节点和已存储档案的词节点,确定出所述待存储档案的词节点对应的节点特征;根据所述节点特征,确定出所述待存储档案的档案特征,并将所述待存储档案与所述档案特征关联后存储,其中,所述档案特征用于检验所述待存储档案是否被篡改。在本申请实施例中,通过根据待存储档案的词节点与已存储档案的词节点确定出待存储档案的词节点对应的词节点特征,进一步确定出这个待存储档案的档案特征。在对待存储档案的存储中,将档案特征与对应的待存储档案关联后进行存储。在存储的档案被篡改时,由于档案特征中不仅包括被篡改档案的特征,还包括其他已存储档案的特征,因此,可以在篡改发生后,迅速发现档案被篡改,从而提高了对已存储档案的篡改难度,增加了档案存储的安全性。结合第一方面,在第一方面的第一种可能的实现方式中,所述确定出待存储档案的词节点,包括:对所述待存储档案进行分词以得到多个词;计算每个词的信息量大小;根据每个词的信息量大小,从所述多个词中确定出目标词,并基于所述目标词确定出所述待存储档案的词节点。在该实现方式中,通过对档案进行分词,从多个词中确定出目标词,以确定出待存储档案的词节点,可以使得档案特征可以反映档案的文本内容中的词语,从而可以检测出对档案的细微改动,进一步增加篡改难度,提升档案存储的安全性。结合第一方面,在第一方面的第二种可能的实现方式中,所述根据所述待存储档案的词节点和已存储档案的词节点,确定出所述待存储档案的词节点对应的节点特征,包括:根据所述待存储档案的词节点和所述已存储档案的词节点,构建词节点网络;从所述词节点网络中确定出与所述待存储档案的词节点具有关联关系的邻近节点;根据所述待存储档案的词节点和该节点的所述邻近节点,确定出所述待存储档案的词节点对应的节点特征。在该实现方式中,通过不同档案的词节点构建词节点网络,从而建立起不同档案之间的关系网,可以使得存储的档案之间具有更高的联系性,对某一个档案篡改后,可以基于与之具有联系的档案,发现被篡改的档案,从而提升对存储的档案的篡改难度。而基于档案的词节点和该节点的邻近节点确定词节点对应的节点特征,可以通过一小部分的节点实现对篡改行为的监督,可以尽可能在保证档案存储的安全性的同时,尽可能节约资源,以提高方法的运行效率。结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述待存储档案的词节点和所述已存储档案的词节点,构建词节点网络,包括:根据所述待存储档案的词节点和所述已存储档案的词节点,确定出每个词节点各自对应的段落;提取每个词节点各自对应的段落的特征,以确定出每个词节点各自对应的段落向量;根据不同档案的词节点对应的段落向量之间建立的连接关系,构建所述词节点网络,其中,建立连接关系的两个段落向量所对应的两个词节点之间具有关联关系。在该实现方式中,通过词节点确定出对应的段落向量,建立不同档案的词节点对应的段落向量之间的连接关系,以构建词节点网络(词节点网络中具有关联关系的两个词节点来自于不同档案),从而可以建立起稳定而有效的词节点网络。结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述根据所述待存储档案的词节点和该节点的所述邻近节点,确定出所述待存储档案的词节点对应的节点特征,包括:以所述待存储档案的词节点对应的段落向量为初始特征,确定出该词节点的邻近节点对应的段落向量;将所述邻近节点对应的段落向量与所述初始特征进行聚合,确定出所述待存储档案的词节点对应的节点特征。在该实现方式中,通过将词节点对应的段落向量作为初始特征,将该词节点的邻近节点对应的段落向量结合初始特征确定该词节点的对应的节点特征,从而,节点特征可以反映待存储档案的段落特征,也可以反映与之建立关联关系的已存储文档的段落特征,从而可以提升建立关联关系的文档之间的可靠性。结合第一方面的第二种可能的实现方式,在第一方面的第五种可能的实现方式中,所述根据所述待存储档案的词节点对应的节点特征,确定出所述待存储档案的档案特征,包括:根据所述待存储档案的词节点对应的节点特征,对所述词节点的词节点向量进行更新;根据更新后的词节点向量,确定出所述待存储档案的档案特征。在该实现方式中,通过节点特征对词节点的词节点向量进行更新,并进一步根据更新的词节点向量,确定出待存储档案的档案特征,使得档案特征可以准确地反映不同词节点(一个词节点和它的一个或多个邻近节点)对应的段落向量的特征,从而使得档案特征可以反映其他档案的特征,从而增加篡改难度。结合第一方面,或者结合第一方面的第一种至第五种中任一可能的实现方式,在第一方面的第六种可能的实现方式中,所述方法应用于区块链中的任一区块链节点,在未接收到所述区块链上其他区块链节点基于所述待存储档案广播的消息,且确定出所述待存储档案的档案特征后,所述方法还包括:对确定出的所述档案特征进行验证;将验证后的所述档案特征以及本区块链节点的数字签名广播给所述其他区块链节点;将经过所述其他区块链节点验证,且本区块链节点确认验证结果准确的档案特征确定为所述待存储档案的档案特征;对应的,将所述待存储档案与所述档案特征关联后存储,包括:将所述档案特征和对应的所述待存储档案关联后打包保存在所述区块链上,以实现对所述待存储档案的存储。在该实现方式中,通过区块链的方式对档案进行存储,由于区块链技术的特点,可以提高已存储档案的防篡改能力,且能够尽可能防止他人对已存储档案的恶意删除,从而进一步提升档案存储的安全性。第二方面,本申请实施例提供一种档案存储装置,包括:词节点确定模块,用于确定出待存储档案的词节点,其中,所述词节点包含所述待存储档案中本文内容的词语特征;节点特征确定模块,用于根据所述待存储档案的词节点和已存储档案的词节点,确定出所述待存储档案的词节点对应的节点特征;档案特征确定模块,用于根据所述节点特征,确定出所述待存储档案的档案特征,并将所述待存储档案与所述档案特征关联后存储,其中,所述档案特征用于检验所述待存储档案是否被篡改。第本文档来自技高网...

【技术保护点】
1.一种档案存储方法,其特征在于,包括:/n确定出待存储档案的词节点,其中,所述词节点包含所述待存储档案中文本内容的词语特征;/n根据所述待存储档案的词节点和已存储档案的词节点,确定出所述待存储档案的词节点对应的节点特征;/n根据所述节点特征,确定出所述待存储档案的档案特征,并将所述待存储档案与所述档案特征关联后存储,其中,所述档案特征用于检验所述待存储档案是否被篡改。/n

【技术特征摘要】
1.一种档案存储方法,其特征在于,包括:
确定出待存储档案的词节点,其中,所述词节点包含所述待存储档案中文本内容的词语特征;
根据所述待存储档案的词节点和已存储档案的词节点,确定出所述待存储档案的词节点对应的节点特征;
根据所述节点特征,确定出所述待存储档案的档案特征,并将所述待存储档案与所述档案特征关联后存储,其中,所述档案特征用于检验所述待存储档案是否被篡改。


2.根据权利要求1所述的档案存储方法,其特征在于,所述确定出待存储档案的词节点,包括:
对所述待存储档案进行分词以得到多个词;
计算每个词的信息量大小;
根据每个词的信息量大小,从所述多个词中确定出目标词,并基于所述目标词确定出所述待存储档案的词节点。


3.根据权利要求1所述的档案存储方法,其特征在于,所述根据所述待存储档案的词节点和已存储档案的词节点,确定出所述待存储档案的词节点对应的节点特征,包括:
根据所述待存储档案的词节点和所述已存储档案的词节点,构建词节点网络;
从所述词节点网络中确定出与所述待存储档案的词节点具有关联关系的邻近节点;
根据所述待存储档案的词节点和该节点的所述邻近节点,确定出所述待存储档案的词节点对应的节点特征。


4.根据权利要求3所述的档案存储方法,其特征在于,所述根据所述待存储档案的词节点和所述已存储档案的词节点,构建词节点网络,包括:
根据所述待存储档案的词节点和所述已存储档案的词节点,确定出每个词节点各自对应的段落;
提取每个词节点各自对应的段落的特征,以确定出每个词节点各自对应的段落向量;
根据不同档案的词节点对应的段落向量之间建立的连接关系,构建所述词节点网络,其中,建立连接关系的两个段落向量所对应的两个词节点之间具有关联关系。


5.根据权利要求4所述的档案存储方法,其特征在于,所述根据所述待存储档案的词节点和该节点的所述邻近节点,确定出所述待存储档案的词节点对应的节点特征,包括:
以所述待存储档案的词节点对应的段落向量为初始特征,确定出该词节点的邻近节点对应的段落向量;
将所述邻近节点对应的段落向...

【专利技术属性】
技术研发人员:钱仲文李雪维杨新益郑思佳周婷袁奕文林亚男
申请(专利权)人:周婷
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1