一种递归深度强化学习制导的工业区块链优化方法技术

技术编号:32276802 阅读:67 留言:0更新日期:2022-02-12 19:42
本发明专利技术公开一种递归深度强化学习制导的工业区块链优化方法,包括步骤构建状态空间和动作空间;构建强化学习森林,再进入马尔可夫决策过程;在当前决策时期内,执行动作空间,进行迭代调整块大小与块间隔,选择最佳共识算法,获得区块链的块大小、块区间和共识算法;更新RL森林中的信息,更新后的RL森林作为下一决策时期使用;不断进行新数据的输入,并反复执行步骤S20,调整块大小和块区间,输出最佳的共识算法。本发明专利技术通过建立递归可扩展的强化学习框架,调整区块链的块大小和块区间,并选择最佳的共识算法,从而优化区块链的性能,能够在当前基础上有效提升区块链系统的事务吞吐量。当前基础上有效提升区块链系统的事务吞吐量。当前基础上有效提升区块链系统的事务吞吐量。

【技术实现步骤摘要】
一种递归深度强化学习制导的工业区块链优化方法


[0001]本专利技术属于区块链
,特别是涉及一种递归深度强化学习制导的工业区块链优化方法。

技术介绍

[0002]随着数字化进程大大加快,我们可以预见未来传统行业的进步和发展一定会依赖于数字技术提升,各行各业将全面数字化,人类将全面进入物联网的时代。面对未来的发展趋势,为存储、处理、共享数据构建一个安全、高效的环境至关重要。在这方面,区块链被广泛认为是一种很有前途的技术方案。区块链最初被用作比特币经济交易的点对点分类账,它通过启用匿名和信任的交易,去除各种中介机构来保证数据的安全性和效率。虽然区块链技术带来了显著的好处,但如何提供满足工业物联网的高事务吞吐量需求所需的可伸缩性为传统的区块链系统带来了巨大的挑战。就目前已经提出的大多数方案而言,存在着以下三点问题:区块链系统性能还没有得到很好的研究,可扩展性、去中心化、延迟、安全性四个性能不能兼得;区块链系统还不能满足工业物联网高事物吞吐量需求的可扩展性;现有区块链系统性能评估方法缺乏全面性和通用性。
[0003]为了处理物联网系统的动本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种递归深度强化学习制导的工业区块链优化方法,其特征在于,包括步骤:S10,构建状态空间和动作空间;S20,根据状态空间和动作空间,构建强化学习森林,再进入马尔可夫决策过程;在当前决策时期内,执行动作空间,进行迭代调整块大小与块间隔,选择最佳共识算法,获得区块链的块大小、块区间和共识算法;更新RL森林中的信息,更新后的RL森林作为下一决策时期使用;S30,不断进行新数据的输入,并反复执行步骤S20,调整块大小和块区间,输出最佳的共识算法。2.根据权利要求1所述的一种递归深度强化学习制导的工业区块链优化方法,其特征在于,输入当前块生产者数量K、节点数量N、所有事务大小χ、股份分布γ、工业物联网节点的地理位置x、工业物联网节点的计算能力c和每对工业物联网节点之间链路的日期传输速率R,来构建状态空间S;决策时期t处的状态空间包括事务大小χ、股份分布γ、工业物联网节点的地理位置x、工业物联网节点的计算能力c和每对工业物联网节点之间链路的日期传输速率R的并集,记为S
(t)
=[χ,γ,x,c,R]
(t)
,t=1,2,...n。3.根据权利要求1所述的一种递归深度强化学习制导的工业区块链优化方法,其特征在于,不断输入新的块产生者a、共识算法δ、块大小S
B
和块间隔T
I
,来构建动作空间A;决策时期t处的动作空间包括块产生者a、共识算法δ、块大小S
B
和块间隔T
I
的并集,记为A
(t)
=[a,δ,S
B
,T
I
]
(t)
,t=1,2,...n。4.根据权利要求2所述的一种递归深度强化学习制导的工业区块链优化方法,其特征在于,构建具有多层的强化学习森林,第l层森林为:RLF
(l)
表示在第l层获得最佳关系滤波阈值组合的过程,每个关系都独立地构建了一个具有自适应深度D
r(l)
=[log
α
k
r
]和自适应宽度的RL树RLF
(l)
,α是深度优先与宽度优先之间的权重参数,k
r
是关系r中的节点包含的最大邻居数;RLT
r(l)
执行强化学习RL
r(l)(d)
过程,在每个深度以精度W
r(l)(d)
过滤阈值;在第l层,RLT
r(l)
通过多次进行RL递归,获得与先前深度的关系...

【专利技术属性】
技术研发人员:彭浩刘琳刘明生高泽李建华纪树梅
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1