本发明专利技术公开了一种基于区块链的数据新鲜度度量方法,包括以下步骤:以区块链系统为支撑,将共享域内所有系统的数据生产、数据维护、数据传播操作的结果全部按时间戳进入区块,每个区块记载一次操作,并有区分数据生产、数据维护、数据传播操作的标记;再通过对区块链的检索,解析区块,将同一“数据版权”对应的存储于各区块的“数据”进行比较,可以轻松、方便、快捷地找出指定“数据”是否最新鲜。本发明专利技术借助区块链的支撑,使得解决数据新鲜度度量的时间复杂度由传统技术方法O(n
Data freshness measurement method based on blockchain
【技术实现步骤摘要】
基于区块链的数据新鲜度度量方法
本专利技术涉及区块链
,特别是涉及一种基于区块链的数据新鲜度度量方法。
技术介绍
随着互联互通、信息共享的逐步推进,跨系统获取其它系统所生产的数据已经成为一种常态。然而,由于我们并没有对被共享数据的“源”和“副本”建立有效的关联和约束,使得在应用中“源”与“副本”之间存在以下情况:1.生产数据的系统可能在“源数据”被传播后对其进行更新(update)或删除(delete);2.通过共享获取到数据的系统,可能对该数据的“副本”进行随意处置,包括可能的清洗、修改(update)。因此,在整个共享域内,被共享的“数据”可能存在:“源”与“副本”不一致、多个“副本”之间不一致。由此,我们需要对共享数据的游走轨迹进行跟踪、及时发现数据冲突、对数据的新鲜度进行度量。解决数据验证问题基本原理是在共享域范围内,将“副本”与“源”进行实时比对。那么,在寻找“副本”对应的“源”时,传统方法需要:找到共享域内对应节点的库、该库的数据表、该表的某条记录,进行比对,比对结束的下一秒继续重复该步骤。因而利用传统技术来解决数据的新鲜度度量问题的时间复杂度为O(n4)。采用传统技术解决这些问题,理论上可行,实际上非常“棘手”。因此亟需提供一种新型的数据新鲜度度量方法来解决上述问题。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于区块链的数据新鲜度度量方法,能够将其时间复杂度降低为O(n),即通过对区块链的一遍检索即可完成对应的计算,极大地提升了解决问题的效率。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种基于区块链的数据新鲜度度量方法,包括以下步骤:S1:以区块链系统为支撑,将共享域内所有系统的数据生产、数据维护、数据传播操作的结果全部按时间戳进入区块,每个区块记载一次操作,并有区分数据生产、数据维护、数据传播操作的标记;S2:从区块链当前的链尾向链首或最近一次已检索位置进行顺序检索,对检索到的每一个区块文件进行解析,解析的结果写入区块解析数据表;所述区块解析数据表包含七个数据字段,分别为序号、数据版权、{值}、节点1、节点2、时间戳、操作标识;S3:针对指定的数据版权,从所述区块解析数据表中查询出数据版权等于指定值的所有记录,再在此查询结果对应的活动数据集中,按时间戳升序排列,取第一条记录的节点1作为生产节点,取节点1等于生产节点且时间戳最大的记录的{值}作为{新鲜的值},删除节点1等于生产节点且操作标识不为传播的所有记录,剩余记录分别取其{值}与{新鲜的值}比较,如有差异,则记载其节点1或节点2并提示。在本专利技术一个较佳实施例中,所述数据为社会活动或事务处理所需的一个或多个相关的数据集,采用如下元组表示:数据=<键,{值}>(1)其中,键用以区分不同的数据;{值}表示相关数据的具体数值的集合。在本专利技术一个较佳实施例中,所述数据版权是生产数据的环境、参与者,以及时间标记的计算结果,其逻辑涵义为:参与者们在一个特定时刻,通过特定信息化系统完成了某个事务处理,数据版权模型如下式所示:数据版权=计算(<{服务对象},{服务提供者},{数据维护者},{服务工具},服务时间戳>)(2)在(2)式中,计算采用SHA256或国密算法SM3;服务对象:指事务处理过程中被服务的人群;服务提供者:指操作“服务工具”向“服务对象”提供服务的人群;数据维护者:指维护事务处理结果数据的人群,一般为DBA;服务工具:指提供服务的信息系统或业务系统;服务时间戳:指该事务处理结束的时间戳。进一步的,一个事务处理的结果形式化表示为以下元组:事务处理=<数据版权,{值}>(3)其中,数据版权是数据的键,而{值}是该数据版权对应事务处理的数据变量的值的集合。在本专利技术一个较佳实施例中,步骤S3的具体步骤包括:S301:接收用户指定的数据版权,其值赋给变量A;S302:在所述区块解析数据表中查询出“数据版权”=A的所有记录;S303:如果查询结果的记录数=0,则提示:未找到对应数据,进入S314;S304:如果查询结果的记录数=1,则提示:该数据是新鲜的,进入S314;S305:按时间戳的升序对查询结果记录进行排序;S306:取第一条记录的“节点1”值赋给“生产节点”,“{值}”赋给“{新鲜的值}”;S307:选择“节点1”值等于“生产节点”值的所有记录,取其中“时间戳”最大的记录,并将该记录的“{值}”赋给“{新鲜的值}”;S308:删除“节点1”值等于“生产节点”值且“操作标识”值不为“传播”的所有记录;S309:如果剩余记录数为0,则提示:该数据是新鲜的,进入S314;S310:设定p为记录指针,p=1;S311:读取p记录的“{值}”,并与“{新鲜的值}”比较;S312:如果比较结果有差异,则判断“操作标识”是否为“传播”,若是,则记载“节点2”并提示差异,否则记载“节点1”并提示差异;S313:判断p是否为最后一条记录,如果不是,则p=p+1,进入S311;S314:结束。本专利技术的有益效果是:(1)本专利技术利用区块链技术进行数据新鲜度度量,在共享域内,将所有系统的数据生产(insert)、数据维护(update或delete)、数据传播(数据的“副本”传输)行为和结果格式化成“交易”,并按发生的时间顺序写入对应的区块,存储于区块链上;再通过对区块链的检索,解析区块,将同一“数据版权”对应的存储于各区块的“数据”进行比较,可以轻松、方便、快捷地找出指定“数据”是否最新鲜;(2)本专利技术借助区块链的支撑,使得解决数据新鲜度度量的时间复杂度由传统技术方法O(n4)降低为O(n),通过对区块链的一遍检索即可实现数据新鲜度度量,其方法本身具有无须增加计算能力、无须增加网络带宽、成本低、效益高的特点;另外,解决数据新鲜度度量问题是互联互通、信息共享工作推进中存在的刚性需求,为数据中心升级为数据版权中心、数据验证中心提供了一种可靠的技术方法,具有很高的应用价值。附图说明图1是数据生产、数据维护、数据传播操作入链的示意图;图2是检索区块链的流程图;图3是本专利技术基于区块链的数据新鲜度度量方法的流程图。具体实施方式下面结合附图对本专利技术的较佳实施例进行详细阐述,以使本专利技术的优点和特征能更易于被本领域技术人员理解,从而对本专利技术的保护范围做出更为清楚明确的界定。首先对本专利技术中出现的术语进行解释,以使本专利技术所述方法能更易于被本领域技术人员理解。1.1.数据权威文献指出,数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。一般而言,通过数字化手段将某个事实或观察结果(如:社会活本文档来自技高网...
【技术保护点】
1.一种基于区块链的数据新鲜度度量方法,包括以下步骤:/nS1:以区块链系统为支撑,将共享域内所有系统的数据生产、数据维护、数据传播操作的结果全部按时间戳进入区块,每个区块记载一次操作,并有区分数据生产、数据维护、数据传播操作的标记;/nS2:从区块链当前的链尾向链首或最近一次已检索位置进行顺序检索,对检索到的每一个区块文件进行解析,解析的结果写入区块解析数据表;所述区块解析数据表包含七个数据字段,分别为序号、数据版权、{值}、节点1、节点2、时间戳、操作标识;/nS3:针对指定的数据版权,从所述区块解析数据表中查询出数据版权等于指定值的所有记录,再在此查询结果对应的活动数据集中,按时间戳升序排列,取第一条记录的节点1作为生产节点,取节点1等于生产节点且时间戳最大的记录的{值}作为{新鲜的值},删除节点1等于生产节点且操作标识不为传播的所有记录,剩余记录分别取其{值}与{新鲜的值}比较,如有差异,则记载其节点1或节点2并提示。/n
【技术特征摘要】
1.一种基于区块链的数据新鲜度度量方法,包括以下步骤:
S1:以区块链系统为支撑,将共享域内所有系统的数据生产、数据维护、数据传播操作的结果全部按时间戳进入区块,每个区块记载一次操作,并有区分数据生产、数据维护、数据传播操作的标记;
S2:从区块链当前的链尾向链首或最近一次已检索位置进行顺序检索,对检索到的每一个区块文件进行解析,解析的结果写入区块解析数据表;所述区块解析数据表包含七个数据字段,分别为序号、数据版权、{值}、节点1、节点2、时间戳、操作标识;
S3:针对指定的数据版权,从所述区块解析数据表中查询出数据版权等于指定值的所有记录,再在此查询结果对应的活动数据集中,按时间戳升序排列,取第一条记录的节点1作为生产节点,取节点1等于生产节点且时间戳最大的记录的{值}作为{新鲜的值},删除节点1等于生产节点且操作标识不为传播的所有记录,剩余记录分别取其{值}与{新鲜的值}比较,如有差异,则记载其节点1或节点2并提示。
2.根据权利要求1所述的基于区块链的数据新鲜度度量方法,其特征在于,所述数据为社会活动或事务处理所需的一个或多个相关的数据集,采用如下元组表示:
数据=<键,{值}>(1)
其中,键用以区分不同的数据;{值}表示相关数据的具体数值的集合。
3.根据权利要求1所述的基于区块链的数据新鲜度度量方法,其特征在于,所述数据版权是生产数据的环境、参与者,以及时间标记的计算结果,其逻辑涵义为:参与者们在一个特定时刻,通过特定信息化系统完成了某个事务处理,数据版权模型如下式所示:
数据版权=计算(<{服务对象},{服务提供者},{数据维护者},{服务工具},服务时间戳>)(2)
在(2)式中,计算采用SHA256或国密算法SM3;
服务对象:指事务处理过程中被服务的人群;
服务提供者:指操作“服务工具”向“服务对...
【专利技术属性】
技术研发人员:张家锐,
申请(专利权)人:合肥学院,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。