一种基于区块链中双链技术的数据共享系统及方法技术方案

技术编号:30552029 阅读:15 留言:0更新日期:2021-10-30 13:32
本发明专利技术公开了一种基于区块链中双链技术的数据共享系统及方法,该系统包括资源链模块与任务链模块,资源链模块包括:数据上传模块,数据特征提取模块和数据判断验证模块;任务链模块包括:任务发布模块,模型训练模块,模型共识模块,模型存储模块;本方法中的资源链模块与任务链模块使用不同的共识算法,资源链模块使用拜占庭算法进行数据存储,实现数据共享、激励机制和版权保护;任务链模块将区块链中的POW算力用来进行基于大数据的深度学习模型训练,降低了成本,节约了社会资源,将算力用到有意义的工作上;任务链读取资源链上的数据,资源链加载任务链信息,双链即独立又统一。数据存好、用好、循环好,有效解决数据共享与算力浪费问题。费问题。

【技术实现步骤摘要】
一种基于区块链中双链技术的数据共享系统及方法


[0001]本专利技术涉及区块链
,尤其涉及一种基于区块链中双链技术的数据共享系统及方法。

技术介绍

[0002]区块链是最近比较时兴的一项技术,它采用分布式的存储,利用块链式数据结构来验证与存储数据,利用分布式节点共识算法来生成和更新数据,利用密码学的方式保证数据传输和访问的安全,利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新分布式基础架构与计算范式。
[0003]在智慧农业中,涉及到许多病虫害数据的分类任务,要想获得较高的分类精确度,病虫害图片的数量是一个很关键因素,因此病虫害图片数据具有较高的研究与利用价值,但是目前由于缺少有效激励机制以及版权问题,一般的个人或者机构不愿意数据共享,数据共享度低;另一方面,现有的区块链技术所采用计算哈希的工作量证明(Proof Of Work, POW)共识算法,造成了极大的算力浪费。

技术实现思路

[0004]有鉴于此,本专利技术提出一种基于区块链中的双链技术的数据共享系统及方法,以解决数据共享程度低以及存在的数据版权问题,同时也解决算力浪费问题,节省社会资源。
[0005]第一方面,提供了一种基于区块链中双链技术的数据共享系统,包括资源链模块与任务链模块, 其中,资源链模块:用于数据上传与存储,包含数据上传模块,数据特征提取模块,数据判断验证模块;任务链模块:用于发布训练任务,进行任务训练以及模型提交验证,包含任务发布模块,模型训练模块,模型共识模块,模型存储模块。
[0006]进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的资源链模块中的数据上传模块,用户使用电脑或者手机将图片数据上传至客户端服务器中,并进行暂时存储,等待后续数据验证,其中的客户端服务器是Linux服务器。
[0007]进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的资源链模块中的数据特征提取模块,用于对上传的图片运用深度卷积神经网络进行特征提取。
[0008]进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的资源链模块中的数据判断验证模块,运用拜占庭算法,验证提交的图片是否是新图片(数据)。
[0009]进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的任务链模块中的任务发布模块,用于管理员发布模型训练任务,等待节点进行模型训练。
[0010]进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的任务链模块中的模型训练模块,各节点读取任务中的数据的地址,根据地址从资源链模块中获取训练图像,利用自己的算力进行线下模型训练。
[0011]进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的任务链模块中的模型共识模块,基于POW共识机制原理,当节点训练过程中准确率超过阈值a时,将模型存储到缓冲数据库中并广播模型存储地址,等待其他子节点的读取和验证,验证通过则将模型信息写入区块中,并给与奖励,否则验证不成功则继续训练。
[0012]进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的任务链模块中的模型存储模块,将验证成功的模型信息存储在区块链的区块中,并将验证成功的模型文件存储在Hadoop中。
[0013]第二方面,提供了一种基于区块链中双链技术的数据共享方法,包括资源链上链过程以及任务链上链过程,其中资源链上链过程包括如下步骤:S101)数据上传:用户使用手机或者电脑提交图片数据到资源服务器,在上传图片同时用户需要选择图片所属类别,所述的类别包括作物种类和疾病种类两类,然后将图片暂时存储在客户端上,其中客户端是一台服务器, 下称客户端。
[0014]S102)数据验证,数据上传模块内置了二分类模型,可以对用户上传的图片进行初步判断,如果图片属于用户上传图片时选择的类别则验证通过,进行S103)操作,否则验证失败返回失败信息。
[0015]S103) 特征提取:将验证通过的图片使用卷积神经网络进行特征提取,形成唯一图片ID,其中图片ID为提取后的图像特征。
[0016]S104)提交上链请求:系统使用拜占庭算法进行广播和验证,具体包含如下步骤:S104.1)客户端向资源链主节点发送验证请求:客户端将图像ID广播至资源链主节点,其中资源链主节点就是资源链服务器。
[0017]S104.2)资源链主节点将验证请求和图像ID广播至所有资源链子节点,其中资源链子节点是资源链中除主节点服务器外的其他服务器。
[0018]S104.3)所有资源链子节点都执行验证请求,并将结果发回客户端,具体步骤如下:SA1)资源链子节点将区块链上的区块数据下载到本地,将新图ID与区块中的图片ID进行余弦相似度比较;SA2)若ID相似度超过阈值b则说明该图片已经存储在区块链上,返回“验证不通过”信息,若余弦相似度小于阈值b时,返回“验证通过”信息。
[0019]S104.4)客户端需要等待不低于(n

1)/3 个资源链子节点发回“验证通过”的结果,作为上链依据,其中n为系统中所有节点的个数。
[0020]S104.5) 由资源链中心节点将该图片ID,写入区块中并给予图片上传用户积分奖励A1,所述的上传用户即为同过手机或者电脑上传图片至客户端的用户。
[0021]进一步,所述的一种基于区块链中双链技术的数据共享方法中,所述的任务链上链过程包括如下步骤:S201)提交训练任务:区块链中的任务链中心节点随机选择数量为c的图片,形成任务文件,然后将任务广播到区块链中的任务链子节点。
[0022]S202) 模型训练:子节点接受到训练任务后,加载任务文件中的图片地址从Hadoop中下载图片,形成训练集,然后使用AutoML对其进行训练,不断调整模型类别和参数,直至模型在测试集上准确率超过阈值d,如果训练集或者测试集中包含用户上传的图
片,则给予用户积分奖励A2。
[0023]S203)模型共识:当某一任务链节点训练的模型在测试集上的准确率超过阈值d时,如任务链子节点e,会对整个网络进行广播,并将训练好的模型存储在Hadoop中,等待任务链其他子节点验证:子节点将模型在测试集上进行验证,如果准确率超过阈值d,则返回成功信息,如果没有则返回失败信息。
[0024]S204)模型存储:如果返回成功信息的数量多于f,则任务链子节点e将模型信息写入区块链中并获得一定的奖励A3,用户的总积分是上述A1、A2、A3积分的总和,总积分可以换取商品或者获取更多数据的下载权限或者是其他订阅服务。
[0025]进一步,所述步骤S202)模型训练中所述的AutoML模型训练方式,使用基于谷歌TensorFlow的AutoKeras进行模型训练工作。
[0026]本专利技术的有益效果是:(1)通过积分机制,激励用户上传数据,实现数据共享,解决了深度学习过程中数据集少而导致的模型训练准确率不高的问题;(2)对上传的数据进行验证,解决数据共享中的版权问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于区块链中双链技术的数据共享系统,其特征在于,包括资源链模块与任务链模块;资源链模块:用于数据上传与存储,包含数据上传模块,数据特征提取模块,数据判断验证模块;任务链模块:用于发布训练任务,进行任务训练以及模型提交验证,包含任务发布模块,模型训练模块,模型共识模块,模型存储模块。2.根据权利要求1所述的一种基于区块链中双链技术的数据共享系统,其特征在于,所述的资源链模块中的数据上传模块,用户使用电脑或者手机将图片数据上传至客户端服务器中,并进行暂时存储,等待后续数据验证,上述客户端服务器是Linux服务器;所述的资源链模块中的数据特征提取模块,用于对上传的图片运用深度卷积神经网络进行特征提取;所述的资源链模块中的数据判断验证模块,运用拜占庭算法,验证提交的图片是否是新图片(数据)。3.根据权利要求1所述的一种基于区块链中双链技术的数据共享系统,其特征在于,所述的任务链模块中的任务发布模块,用于管理员发布模型训练任务,等待节点进行模型训练;所述的任务链模块中的模型训练模块,各节点读取模型训练任务中的数据的地址,根据地址从资源链模块中获取训练图像,利用自己的算力进行线下模型训练;所述的任务链模块中的模型共识模块,基于工作量证明(Proof Of Work, POW)共识机制原理,当某一节点训练过程中准确率超过阈值a时,将模型存储到缓冲数据库中并广播模型存储地址,等待其他子节点的读取和验证,验证通过则将模型信息写入区块中,并给与奖励,否则验证不成功则继续训练;所述的任务链模块中的模型存储模块,将验证成功的模型信息存储在区块链的区块中,并将验证成功的模型文件存储在Hadoop中。4.一种基于区块链中双链技术的数据共享方法,其特征在于包含资源链上链过程与任务链上链过程,其中资源链上链过程包括如下步骤:401)数据上传:用户使用手机或者电脑提交图片数据到资源服务器,在上传图片同时用户需要选择图片所属类别,所述的类别包括作物种类和疾病种类两类,然后将图片暂时存储在客户端上,其中客户端是一台服务器,下称客户端;402)数据验证:数据上传模块内置了二分类模型,可以对用户上传的图片进行初步判断,如果图片属于用户上传图片时选择的类别则验证通过,进行403)操作,否则验证失败返回失败信息;403)特征提取:将验证通过的图片使用卷积神经网络进行特征提取,形成唯一图片ID,其中图片ID为提取后的图像特征;404)提交上链请求:系统使用拜占庭算法进行广播...

【专利技术属性】
技术研发人员:宋彩霞亓志国徐鹏民
申请(专利权)人:青岛农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1