一种基于区块链的档案数据管理方法及系统技术方案

技术编号:33089191 阅读:15 留言:0更新日期:2022-04-15 10:59
本申请公开了一种基于区块链的档案数据管理方法,其特征在于,包括由区块链化数字档案馆、系统服务、数字档案馆联盟区块链等构建的系统架构,来完成档案分布式存储与效验;所述区块链化数字档案馆由超级账本中多个节点组成,属同一档案馆中的节点在同一通道;在档案存储模块,建立主从库复制机制,并采用粒度感知的方法,将大文件存储在IPFS上并获取哈希地址,将小文件直接存储上链;出一种实用、安全的跨档案库数据共享方案,以此来串联各档案馆数据传输;通过定义锚节点选举和普通节点的生成来完成档案馆的线下注册,通过生成Token并存储上链的形式来完成普通用户的线上注册。本申请还同时公开了一种基于区块链的档案数据管理系统,具有上述有益效果。具有上述有益效果。具有上述有益效果。

【技术实现步骤摘要】
一种基于区块链的档案数据管理方法及系统


[0001]本申请属于计算机应用
,尤其涉及一种基于区块链的档案数据管理方法及系统。

技术介绍

[0002]在大数据时代,传统档案存储与管理方式很难有效处理档案管理过程中所面临的效率与安全问题。互联网、云技术和移动终端的迅速发展推动了政府部门大力发展数字化手段来提升档案的存储与管理效率,并迎合用户对档案数据深度利用的需求,为政府部门的无纸化办公和电子政务的信息接轨创造有利条件。但现有基于互联网通讯技术的数字档案管理方法为档案的管理带来便利的同时,也存在以下弊端:(1)现有数字档案系统大多通过数字签名和数字水印来解决数据安全保护问题,数据遭受破坏后很难恢复;(2)各地区档案馆都是独立存储档案的信息“孤岛”,缺乏安全有效的信息共享渠道;(3)档案系统的真实性和原始性过分依赖系统中心或第三方实体,中心化的档案数据库异遭受数据篡改、黑客攻击、信息纠纷等安全隐患;(4)相较于传统纸质档案,数字档案作为存储在物理介质上的比特字节,档案在处理、传输和存储过程中具有高度易变性。
[0003]比较中心化数字档案技术和区块链技术,二者针对的都是存储在磁性介质上的电子信息。数字档案技术存储的信息包括数字化档案数据、用户数据和用户操作记录。其中数字档案数据是数字档案的核心要素,数据一旦受损,对个人、社会、企业乃至国家将造成不可弥补的后果;用户操作记录是受理人对档案信息进行编辑、入档、修改、出档等操作所形成的操作痕迹,此类记录具有较高的可追溯性,是档案信息的重要凭证;传统分布式文件存储技术带来高效存储的同时仍未摆脱中心化结构和管理方式,为档案数据和文件寻求一个可靠、安全的存储技术具有现实意义。区块链的去中心化、多方维护、防篡改和可信存储等优点同数字档案管理相结合,解决数字档案管理中普遍存在的安全性低、共享性差和不可追溯历史等问题。

技术实现思路

[0004]本申请的目的在于解决上述现有档案数据管理的问题,提供一种基于区块链的档案数据管理方法及系统,即将区块链技术的去中心化、透明、可追溯等特性应用于数字档案管理中,并结合分布式数据管理工具,来完成对档案信息和操作信息的存储、备份和安全性验证工作,搭建一个兼顾高性能、经济性和灵活性的新型档案数据管理系统。
[0005]第一方面,本申请提供了一种基于区块链的档案数据管理方法,包括:该方法定义了由区块链化数字档案馆、系统服务、数字档案馆联盟区块链、公有区块链、IPFS集群和外部用户共同构建的网络拓扑。各组件承担的功能和角色的特征如下:1)一个区块链化数字档案馆(以下简称数字档案馆)是由联盟链技术超级账本中的多个Peer节点参与到区块链网络中组成,属同一数字档案馆中的节点在同一通道,节点享有档案验证、查询、保护、共享等服务;
2)系统服务包含数据抽取模块和RESTful服务两个部分,其中RESTful服务为数字档案管理系统提供对区块链智能合约和IPFS的接口调用,数据抽取模块则用于实现异构档案数据的安全存储;3)数字档案馆联盟区块链(以下简称联盟链)采用联盟链平台超级账本(Hyperledger Fabric,以下简称Fabric)技术,并采用基于Kafka和Zookeeper集群的消息队列排序共识插件;4)公有区块链采用基于PoW共识机制的以太坊区块链平台,该公有区块链会定期存储联盟链区块快照信息,强化联盟链Fabric的数据保护;5)IPFS集群存储加密档案的原始信息,并通过哈希表、块交换等技术保障信息安全。
[0006]进一步地,在数据存储方面,提出一种高效的异构档案数据存储方法,该方法可拆分为数据和文件抽取阶段、数据加密存储阶段、电子文件分布式存储阶段。
[0007]1)在数据和文件抽取阶段,通过实时监听节点抽取新增事务日志,记录、解析事务日志并抽取档案电子文件,并完成主从复制,具体指:a)主库完成事务操作更新并将更新数据详情记录在日志文件或日志表中;b)通过与主库开启一个监听线程来建立一个中间客户端连接,实现对主库事务日志的抽取;c)中间客户端抽取到操作日志并通过加密信道存储至私有网络,并通过解析日志中文件存储路径来获取电子文件并存储在IPFS网络中;d)从库可根据同步需求复现存储在区块链上的事务日志来重建数据。
[0008] 2)在数据加密存储阶段,数据加密存储的过程描述为:将日志对象转化为json格式后再转化为字符串;对日志字符加密并生成密文;封装档案数据;封装元数据;将存储的所有信息封装成区块链交易;向区块链发布交易并得到交易ID。
[0009]3)在电子文件分布式存储阶段,摒弃传统文件存储系统,具体描述为:a)采用私有IPFS分布式文件存储系统,当文件内存大于256KB时,将文件拆分为多个IPFS存储子对象,每个子对象包含当前对象的data和链接下级对象的links,而区块默克尔根链接下级对象的links则设置为空;b)提出粒度感知的文件存储方法,根据文件存储路径抽取档案电子文件,若文件大于65536字节(64KB),则将文件存储在IPFS上并获取其哈希地址,当小于65536字节则直接存储。
[0010]进一步地,结合本申请所述档案数据管理方法中整体架构,提出一种实用、安全的数字档案数据共享方法。该方法使得数字档案馆之间或数字档案馆与外部用户之间通过智能合约、IPFS和混合加密机制实现安全、实用的档案数据共享,安全高效地将传统档案系统同区块链技术结合,从而保护档案数据安全。
[0011]进一步地,在所述档案数据管理方法中,提出一种高效、可靠的数字档案馆预注册与快速认证方法。其中预注册分为线下注册和线上注册两部分。
[0012]1)线下注册包括锚节点(Leader Peer)的选举和普通节点的生成,锚节点选举步骤包括:a)联盟链内各节点提议自己为leader并广播该消息;
b)在P2P网络内各节点在规定的等待时间内收集提议;c)等待收集后,将自己的节点ID的哈希值同其他节点ID的哈希值进行比较;d)若自己的ID的哈希值比其他任何节点ID的哈希值小,则声明自己为锚节点,否则放弃选举过程。
[0013]普通节点生成步骤包括:a)Peer线下认定时,CA核对其申请材料的真实性;b)档案馆确认管理员后,CA用RSA密码算法生成Peer的公钥P_Peer私钥S_Peer;c)CA为Peer颁发证书Cert_Peer;d)Leader Peer则存储Peer的公共参数、证书信息和其公、私钥;e)CA记录各数字档案馆和其Leader Peer身份的映射关系。
[0014]2)线上注册指普通用户的身份注册,其步骤包括:a)临近Peer会自动为注册用户生成公私钥对{P_User,S_User},并将P_User、Peer证书中的区域号附上时间戳,并构成Token,向Leader Peer发送对该Token的注册请求;b)Leader Peer对其进行初步的PKI身份认证,确保公钥不在撤销列表并确认Token中的区域号与Peer证书中的一致;c)各节点收到注册信息后分别进行验本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于区块链的档案数据管理方法,其特征在于,包括:定义区块链化数字档案馆、系统服务、数字档案馆联盟区块链、公有区块链、IPFS集群和外部用户在内的所有角色,其中数字档案馆联盟区块链、公有区块链和IPFS集群共同完成对档案信息和操作信息的存储、备份和安全性验证工作;所述区块链化数字档案馆由超级账本中的多个Peer节点组成,属于同一数字档案馆中的节点在同一通道,属于不同数字档案馆的节点在不同通道,节点享有档案验证、查询、保护、共享服务;所述系统服务通过RESTful接口格式为档案数据存储、应用管理提供区块链智能合约和IPFS接口的调用,数据抽取模块通过抽取档案数据库事务日志和电子文件,并针对不同档案数据尺寸设计数据安全存储模型,来完成数字档案馆联盟区块链和IPFS集群对接,从而实现异构档案数据的安全存储;所述数字档案馆联盟区块链采用超级账本技术,通过RESTful接口调用智能合约存储系统的数字身份信息和档案摘要信息,实现数据的访问控制并完成业务逻辑;所述数字档案馆联盟区块链的区块定期向公有区块链存储快照信息,强化档案数据保护;所述IPFS集群存储加密档案的原始信息,并通过哈希表、块交换技术保障信息安全;结合所述方法中提出的整体架构,首先设计一种高效的异构档案数据存储方法;其次,提出一种实用、安全的数字档案数据共享方法;最后,提出一种区块链化数字档案馆预注册与快速认证方法。2.根据权利要求1所述的方法,其特征在于,结合权利要求1中所述所有角色组成的整体架构,其档案数据传输流描述为:区块链化数字档案馆向数字档案馆联盟区块链存储档案哈希和各种操作合约记录;区块链化数字档案馆向IPFS私有集群存储加密档案原始信息并通过调用数字档案馆联盟区块链档案哈希实现对数据真实性的验证;IPFS私有集群通过存储档案内容计算档案数据指纹并传输给数字档案馆联盟区块链;数字档案馆联盟区块链将生成的区块哈希传输给公有区块链以太坊完成快照存储,实现档案数据的锚定。3.根据权利要求1所述的方法,其特征在于,所述异构档案数据安全存储方案旨在将档案管数据流分为事务日志和电子文件,通过抽取档案的事务日志和电子文件,对不同尺寸数据设计粒度感知的安全存储模型,实现异构档案数据安全存储,实时划分为数据和文件抽取阶段、数据加密存储阶段、电子文件分布式存储阶段。4.根据权利要求3所述的方法,其特征在于,所述数据和文件抽取阶段包括实时监听节点抽取新增事务日志,记录、解析事务日志并抽取档案电子文件,并完成主从复制;具体指:主库完成事务操作更新并将更新数据详情记录在日志文件或日志表中;通过与主库开启一个监听线程来建立一个中间客户端连接,实现对主库事务日志的抽取;中间客户端抽取到操作日志并通过加密信道存储至私有网络,而涉及到对新增档案电子文件的操作,通过解析日志中文件存储路径来获取电子文件并存储在IPFS网络中;从库根据同步需求复现存储在区块链上的事务日志来重建数据。5.根据权利要求3所述的方法,其特征在于,所述数据加密存储阶段基于BigchainDB的交易格式,将日志对象转化为json格式后再转化为字符串,对日志字符加密并生成密文,随后封装成...

【专利技术属性】
技术研发人员:刘清松王明生邓智洪戈思进姚栋王亚飞刘冬冬亓彬罗明
申请(专利权)人:中元众诚北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1