一种电力物联网的数据安全通信方法、系统、装置及存储介质制造方法及图纸

技术编号:35638157 阅读:14 留言:0更新日期:2022-11-19 16:28
本发明专利技术公开了一种电力物联网的数据安全通信方法、系统、装置及存储介质,包括:实时获取电力物联网的状态;所述电力物联网包括移动传输装置、物联网节点以及窃听器;基于预构建的通信决策模型根据状态生成通信策略;根据通信策略进行移动传输装置和物联网节点的调度从而实现数据安全通信;其中,所述通信决策模型的构建包括:将调度问题转化为马尔科夫决策问题,构建马尔科夫决策问题模型;基于DQN算法对马尔科夫决策问题模型进行训练,获取通信决策模型;本发明专利技术能够通过深度强化学习寻找物联网节点和移动数据传输装置的功率分配最优策略。略。略。

【技术实现步骤摘要】
一种电力物联网的数据安全通信方法、系统、装置及存储介质


[0001]本专利技术涉及一种电力物联网的数据安全通信方法、系统、装置及存储介质,属于通信


技术介绍

[0002]近年来,电力物联网在接入方式、接入终端种类和敏感信息网络应用等方面都有快速发展,与此同时,电力物联网给安全技术提出了新的挑战:相较于有线传输形式,以开放空间为传输介质的电力物联网面临安全风险更大;接入业务终端的种类繁多且趋于智能化,比如导线电流传感器、杆塔倾斜传感器、绝缘子漏电流传感器、导线金具温度传感器和微气象传感器等,虽然给电力业务带来便利,但同样面临着安全挑战。电力物联网处理的业务都与电力系统安全有着密切的联系,需要得到充分的安全保证。
[0003]对物联网无线通信加密的研究成为当前重要的研究方向。无线传感网络 (Wireless Sensor Network,WSN)是物联网感知层的主要组成元素之一。感知层是物联网实现对物理世界感知和连接的基石,是物联网技术的核心。无线传感网络面临的最主要的安全问题是终端设备安装部署在安全性较低的物理环境中,非常容易被攻击者劫持、破坏、篡改等,所以需要与其它的网络安全技术相结合从而提高无线传感网络的安全保密性能。由于物联网感知层节点资源有限、结构简单、安全性低,所以感知节点非常容易受到攻击者监听、窃取、篡改等攻击。同时,由于感知节点通常部署在安全性较低的环境中,非常容易受到假冒、破坏等攻击。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中的不足,提供一种电力物联网的数据安全通信方法、系统、装置及存储介质,通过对信息传输质量和功率分配进行联合优化,在满足保密超时概率要求的前提下,使能量效率达到最大化。
[0005]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0006]第一方面,本专利技术提供了一种电力物联网的数据安全通信方法,包括:
[0007]实时获取电力物联网的状态;所述电力物联网包括移动传输装置、物联网节点以及窃听器;
[0008]基于预构建的通信决策模型根据状态生成通信策略;
[0009]根据通信策略进行移动传输装置和物联网节点的调度从而实现数据安全通信;
[0010]其中,所述通信决策模型的构建包括:
[0011]将调度问题转化为马尔科夫决策问题,构建马尔科夫决策问题模型;
[0012]基于DQN算法对马尔科夫决策问题模型进行训练,获取通信决策模型。
[0013]可选的,所述马尔科夫决策问题模型的参数包括:
[0014]状态空间S[n]为:
[0015]S[n]={s[n]|n=1,2,

,N}
[0016]s[n]={d
D2B
[n],d
D2m
[n],d
B2m
[n]}
[0017]式中,s[n]为在传输时隙n的状态,d
D2B
[n]为移动传输装置D和物联网节点 B在传输时隙n的距离信息,d
D2m
[n]为移动传输装置D和窃听者m在传输时隙n 的距离信息,d
B2m
[n]为物联网节点B和窃听者m在传输时隙n的距离信息;N为传输时隙总数;
[0018]动作空间A[n]为:
[0019]A[n]={a[n]|n=1,2,

,N}
[0020]a[n]={P
D
[n],P
B
[n],u[n]}
[0021]式中,a[n]为在传输时隙n的动作,P
D
[n]为移动传输装置D在传输时隙n的功率选择,P
B
[n]为物联网节点B在传输时隙n的功率选择,u[n]为在传输时隙n 的数据段选择;
[0022]状态转移概率P(s[n]|s[n+1]),表示状态s[n]向状态s[n+1]的转移概率;奖励函数R[n]为:
[0023]R[n]=EE[n][0024]式中,EE[n]为在传输时隙n能量效率;
[0025]约束成本C[n]以及期望的保密超时概率上限c0。
[0026]可选的,所述基于DQN算法对马尔科夫决策问题模型进行训练包括:
[0027]在仿真环境中基于马尔科夫决策问题模型进行模拟通信获取训练样本集;
[0028]将训练样本集中每个样本数据依次输入DQN网络进行迭代,更新DQN网络的网络参数;
[0029]根据更新后的DQN网络的网络参数更新马尔科夫决策问题模型的模型参数;
[0030]基于模型参数更新马尔科夫决策问题模型并带入上述步骤进行迭代,直至达到预设最大训练次数。
[0031]可选的,所述在仿真环境中基于马尔科夫决策问题模型进行模拟通信获取训练样本集包括:
[0032]从仿真环境中获取当前时隙n的状态s[n];
[0033]将状态s[n]输入马尔科夫决策问题模型,生成动作a[n];
[0034]从仿真环境中获取动作a[n]的奖励值r[n]、保密超时概率c[n]以及下一个时隙n+1的状态s[n+1];
[0035]将状态s[n]、动作a[n]、奖励值r[n]、保密超时概率c[n]以及状态s[n+1]保存为样本数组,记为{s[n]、a[n]、r[n]、c[n]、s[n+1]};
[0036]将样本数组存入预构建的缓存池中;
[0037]重复上述步骤直至缓存池中样本数组的数量达到预设数量x1。
[0038]从缓存池中随机选取预设数量x2的样本数组生成训练样本集。
[0039]可选的,所述更新DQN网络的网络参数包括:
[0040]根据梯度下降算法优化网络参数使输出的估计值接近目标值:
[0041]更新回报网络参数θ
T

[0042][0043]更新成本网络参数θ
C

[0044][0045]式中,Q
T
(s[n],a[n];θ
T
)、Q
C
(s[n],a[n];θ
C
)分别为回报网络和成本网络的估计值,y
T
、y
C
分别为回报网络和成本网络的目标值,α为网络学习率。
[0046]可选的,所述更新马尔科夫决策问题模型的模型参数包括:
[0047]根据网络参数计算辅助约束成本
[0048][0049]式中,π
B
为满足保密超时概率上限c0的基准策略,c0为保密超时概率上限, s0为初始状态,a0为初始动作,为基准策略π
B
下的数据传输过程中的累积约束成本;θ
C
、θ
T
分别为回报网络参数和成本网络参数;
[0050]基于Lyapunov函数,构建安全策略空间F
L
(s[n]):
[0051][0052][0053本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力物联网的数据安全通信方法,其特征在于,包括:实时获取电力物联网的状态;所述电力物联网包括移动传输装置、物联网节点以及窃听器;基于预构建的通信决策模型根据状态生成通信策略;根据通信策略进行移动传输装置和物联网节点的调度从而实现数据安全通信;其中,所述通信决策模型的构建包括:将调度问题转化为马尔科夫决策问题,构建马尔科夫决策问题模型;基于DQN算法对马尔科夫决策问题模型进行训练,获取通信决策模型。2.根据权利要求1所述的一种电力物联网的数据安全通信方法,其特征在于,所述马尔科夫决策问题模型的参数包括:状态空间S[n]为:S[n]={s[n]|n=1,2,

,N}s[n]={d
D2B
[n],d
D2m
[n],d
B2m
[n]}式中,s[n]为在传输时隙n的状态,d
D2B
[n]为移动传输装置D和物联网节点B在传输时隙n的距离信息,d
D2m
[n]为移动传输装置D和窃听者m在传输时隙n的距离信息,d
B2m
[n]为物联网节点B和窃听者m在传输时隙n的距离信息;N为传输时隙总数;动作空间A[n]为:A[n]={a[n]|n=1,2,

,N}a[n]={P
D
[n],P
B
[n],u[n]}式中,a[n]为在传输时隙n的动作,P
D
[n]为移动传输装置D在传输时隙n的功率选择,P
B
[n]为物联网节点B在传输时隙n的功率选择,u[n]为在传输时隙n的数据段选择;状态转移概率P(s[n]|s[n+1]),表示状态s[n]向状态s[n+1]的转移概率;奖励函数R[n]为:R[n]=EE[n]式中,EE[n]为在传输时隙n能量效率;约束成本C[n]以及期望的保密超时概率上限c0。3.根据权利要求2所述的一种电力物联网的数据安全通信方法,其特征在于,所述基于DQN算法对马尔科夫决策问题模型进行训练包括:在仿真环境中基于马尔科夫决策问题模型进行模拟通信获取训练样本集;将训练样本集中每个样本数据依次输入DQN网络进行迭代,更新DQN网络的网络参数;根据更新后的DQN网络的网络参数更新马尔科夫决策问题模型的模型参数;基于模型参数更新马尔科夫决策问题模型并带入上述步骤进行迭代,直至达到预设最大训练次数。4.根据权利要求3所述的一种电力物联网的数据安全通信方法,其特征在于,所述在仿真环境中基于马尔科夫决策问题模型进行模拟通信获取训练样本集包括:从仿真环境中获取当前时隙n的状态s[n];将状态s[n]输入马尔科夫决策问题模型,生成动作a[n];从仿真环境中获取动作a[n]的奖励值r[n]、保密超时概率c[n]以及下一个时隙n+1的状态s[n+1];
将状态s[n]、动作a[n]、奖励值r[n]、保密超时概率c[n]以及状态s[n+1...

【专利技术属性】
技术研发人员:韦磊徐江涛郭雅娟黄伟朱道华蒋承伶赵新冬毕晓甜孙云晓
申请(专利权)人:国网江苏省电力有限公司江苏省电力试验研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1