一种车载自组网络数据包传送方法及装置制造方法及图纸

技术编号:29532073 阅读:40 留言:0更新日期:2021-08-03 15:19
本发明专利技术提供一种车载自组网络数据包传送方法及装置,包括:根据车载自组网络的当前状态信息,结合马尔科夫决策过程模型,构建当前网格的状态空间和当前网格的动作空间;其中,所述当前网格中包括数据包发送节点;根据所述状态空间和所述动作空间,结合联合估计Q学习算法模型,获取所述当前网格中数据包发送节点的最大动作价值收益值,以根据所述最大动作价值收益值确定目标安全网格;基于最小角度选择策略,在所述目标安全网格中选取中继节点,通过所述中继节点进行数据包传送。本发明专利技术通过联合估计Q学习算法模型,得到一种安全有效的车载自组网络数据包传送策略,可以抵御多种形式的丢包攻击,提升网络的安全性。

【技术实现步骤摘要】
一种车载自组网络数据包传送方法及装置
本专利技术涉及网络数据传输
,尤其涉及一种车载自组网络数据包传送方法及装置。
技术介绍
车载自组网络(VehicularAd-hocNetworks;VANET)是由车辆、路边单元(RoadSideUnit;RSU)和基站(BaseStation;BS)等异构节点所组成的分布式系统,这些异构节点之间可以交换数据,且支持关键信息、多媒体数据等内容的分发。面对日益增长的网络威胁,VANET中的安全和隐私等问题显得至关重要。然而,受制于固有的分布式机制以及节点的高度移动性和异构性,VANET容易遭受网络中恶意节点的丢包攻击,其安全问题一直得不到有效解决。现有的安全机制主要采用多路径路由和基于信任的路由,前者具有较高的能耗,后者需要对网络节点进行信任评估,这在实践中较难实现。因此,如何解决现有技术中由于VANET容易遭受恶意路由的攻击,导致网络安全性不高的缺陷已成为业界日益关注的研究重点。
技术实现思路
本专利技术提供一种车载自组网络数据包传送方法及装置,用以解决现有技术中由于VA本文档来自技高网...

【技术保护点】
1.一种车载自组网络数据包传送方法,其特征在于,包括:/n根据车载自组网络的当前状态信息,结合马尔科夫决策过程模型,构建当前网格的状态空间和当前网格的动作空间;其中,所述当前网格中包括数据包发送节点;/n根据所述状态空间和所述动作空间,结合联合估计Q学习算法模型,获取所述当前网格中数据包发送节点的最大动作价值收益值,以根据所述最大动作价值收益值确定目标安全网格;/n基于最小角度选择策略,在所述目标安全网格中选取中继节点,通过所述中继节点进行数据包传送。/n

【技术特征摘要】
1.一种车载自组网络数据包传送方法,其特征在于,包括:
根据车载自组网络的当前状态信息,结合马尔科夫决策过程模型,构建当前网格的状态空间和当前网格的动作空间;其中,所述当前网格中包括数据包发送节点;
根据所述状态空间和所述动作空间,结合联合估计Q学习算法模型,获取所述当前网格中数据包发送节点的最大动作价值收益值,以根据所述最大动作价值收益值确定目标安全网格;
基于最小角度选择策略,在所述目标安全网格中选取中继节点,通过所述中继节点进行数据包传送。


2.根据权利要求1所述的车载自组网络数据包传送方法,其特征在于,所述根据所述状态空间和所述动作空间,结合联合估计Q学习算法模型,获取所述当前网格中数据包发送节点的最大动作价值收益值的步骤,具体包括:
在所述数据包发送节点为车辆节点的情况下,根据所述状态空间和所述动作空间,通过车辆节点联合估计Q学习算法模型,确定所述车辆节点的最优动作价值收益值;
在所述数据包发送节点为路边单元节点的情况下,根据所述状态空间和所述动作空间,通过路边单元节点联合估计Q学习算法模型,确定所述路边单元节点的最优动作价值收益值;
将所述车辆节点的最优动作价值收益值和所述路边单元节点的最优动作价值收益值中的最大值,作为所述数据包发送节点的最大动作价值收益值。


3.根据权利要求2所述的车载自组网络数据包传送方法,其特征在于,所述确定所述车辆节点的最优动作价值收益值的步骤,具体包括:
所述车辆节点基于所述状态空间和所述动作空间,选择执行的动作,观察所述动作执行后的结果奖励值;
其中,所述动作指的是所述车辆节点随机选择的动作或所述车辆节点从相邻车辆节点学习的最优动作;
观察统计所述车辆节点的相邻车辆节点的所述动作选择概率,并得到所述动作选择概率的第一归一化结果;
根据所述第一归一化结果,获取所述动作的第一联合估计动作价值收益值;
根据所述第一联合估计动作价值收益值,更新所述车辆节点的动作价值收益值;
根据所述结果奖励值和所述车辆节点的动作价值收益值,基于贝尔曼方程,获取当前网格的车辆节点的最优动作价值收益值。


4.根据权利要求2所述车载自组网络数据包传送方法,其特征在于,所述确定所述路边单元节点的最优动作价值收益值的步骤,具体包括:
所述路边单元节点基于所述状态空间和所述动作空间,选择执行的动作;
其中,所述动作指的是所述路边单元节点从相邻车辆节点学习的最优动作;
统计观察所述路边单元节点的相邻车辆节点的所述动作选择概率,并得到所述动作选择概率的第二归一化结果;
根据所述第二归一化结果,获取所述动作的第二联合估计动作价值收益值;
根据所述第二联合估计动作价值收益值,更新所述路边单元节点的动作价值收益值,作为当前网...

【专利技术属性】
技术研发人员:杨树杰许长桥沈嘉浩张焘张丙驰纪伟潇
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利