当前位置: 首页 > 专利查询>广州大学专利>正文

一种D2D资源分配方法、装置、设备及存储介质制造方法及图纸

技术编号:32356014 阅读:18 留言:0更新日期:2022-02-20 03:16
本发明专利技术公开了一种D2D资源分配方法、装置、设备及存储介质,本发明专利技术通过获取D2D环境状态,根据D2D环境状态进行转换处理,确定突触前输入,增强对D2D环境状态的表示能力;根据突触前输入以及脉冲神经网络模型,确定脉冲信号,对脉冲信号进行解码处理,得到D2D用户的选择动作,脉冲神经网络模型的训练过程中,根据D2D用户的D2D设备当前时刻所处环境状态确定第一动作,根据第一动作与临近场的D2D设备确定的第二动作进行动作策略参数的更新;使用脉冲神经网络模型能够节省计算资源且提升通讯性能,确定的D2D用户的选择动作包括频段和发送功率以实现资源的合理分配,本发明专利技术可广泛应用于互联网领域。网领域。网领域。

【技术实现步骤摘要】
一种D2D资源分配方法、装置、设备及存储介质


[0001]本专利技术涉及互联网领域,尤其是一种D2D资源分配方法、装置、设备及存储介质。

技术介绍

[0002]当前,随着智能终端的普及和移动互联网业务的井喷式发展,对无线通信网络的数据传输能力提出了更高的要求。在当前的大趋势下,现有的蜂窝网络存在频谱资源不足、基站过载等问题,难以满足未来无线网络的传输需求。其中设备到设备(Device

to

Device,D2D)通信允许相邻用户建立直接的通信链路,在现有蜂窝网络中引入D2D通信,可以节约能耗,提高边缘用户的性能,同时共享蜂窝用户频谱的D2D通信可以大大提高频谱利用率。
[0003]然而,通过D2D通信对蜂窝网络的频谱进行复用将对蜂窝通信链路造成跨层干扰,并且影响蜂窝用户的通信质量。同时,在密集部署D2D通信的情况下,多个D2D通信链路对同一频谱的复用将导致彼此之间的同一层干扰,而如何通过对无线网络的资源进行合理的分配来缓解干扰是解决上述干扰问题的有效途径之一。

技术实现思路

[0004]有鉴于此,为了解决上述技术问题,本专利技术的目的是提供降低干扰的一种D2D资源分配方法、装置、设备及存储介质。
[0005]本专利技术实施例采用的技术方案是:
[0006]一种D2D资源分配方法,包括:
[0007]获取D2D环境状态;
[0008]根据所述D2D环境状态进行转换处理,确定突触前输入;
[0009]根据所述突触前输入以及脉冲神经网络模型,确定脉冲信号;
[0010]对所述脉冲信号进行解码处理,得到D2D用户的选择动作;所述选择动作包括频段和发送功率;所述脉冲神经网络模型的训练过程中,根据D2D用户的D2D设备当前时刻所处环境状态确定第一动作,根据所述第一动作与临近场的D2D设备确定的第二动作进行动作策略参数的更新。
[0011]进一步,所述根据所述D2D环境状态进行转换处理,确定突触前输入,包括:
[0012]确定编码神经元群的高斯感受野;所述高斯感受野包括均值以及方差;
[0013]计算所述D2D环境状态与所述均值的差值;
[0014]根据所述差值以及所述方差确定突触前输入。
[0015]进一步,所述根据所述突触前输入以及脉冲神经网络模型,确定脉冲信号,包括:
[0016]根据所述突触前输入以及所述脉冲神经网络模型的权重,确定膜内电流;
[0017]根据所述膜内电流与预设阈值,确定脉冲信号。
[0018]进一步,所述根据所述膜内电流与预设阈值,确定脉冲信号,包括:
[0019]将所述膜内电流积分为膜内电压;
[0020]当所述膜内电压大于预设阈值,根据时间差分函数确定所述膜内电压的第一函数值,否则确定所述膜内电压的第二函数值;所述脉冲信号包括第一函数值和/或第二函数值。
[0021]进一步,所述对所述脉冲信号进行解码处理,得到D2D用户的选择动作,包括:
[0022]当经过预设时间步数将所述突触前输入进行相加;时间步数表征D2D设备的运行时间的划分;
[0023]根据相加结果与所述预设时间步数的比值确定神经元触发频率;
[0024]计算所述脉冲神经网络模型的权重与所述神经元触发频率的乘积,并计算所述乘积与偏置的和,得到D2D用户的选择动作。
[0025]进一步,所述根据所述第一动作与临近场的D2D设备确定的第二动作进行动作策略参数的更新,包括:
[0026]获取D2D用户的D2D设备邻近区域的索引集;所述索引集包括至少一所述临近场的D2D设备;
[0027]根据所述临近场的D2D设备确定的第二动作与所述临近场的D2D设备的数量,计算动作价值均值;所述第二动作为根据所述第一动作与所述数量计算得到的平均动作与小波动的和;
[0028]根据所述动作价值均值确定平均场动作价值函数;所述平均场动作价值函数包括D2D用户的D2D设备当前时刻的奖励、当前时刻所处环境状态以及所述平均动作;
[0029]根据平均场动作价值函数确定所述动作策略参数的损失函数;
[0030]根据所述损失函数对所述动作策略参数进行更新。
[0031]进一步,所述根据所述损失函数对所述动作策略参数进行更新,包括:
[0032]将所述动作策略参数进行更新,直至所述损失函数小于等于目标阈值。
[0033]本专利技术实施例还提供一种D2D资源分配装置,包括:
[0034]获取模块,用于获取D2D环境状态;
[0035]第一确定模块,用于根据所述D2D环境状态进行转换处理,确定突触前输入;
[0036]第二确定模块,用于根据所述突触前输入以及脉冲神经网络模型,确定脉冲信号;
[0037]处理模块,用于对所述脉冲信号进行解码处理,得到D2D用户的选择动作;所述选择动作包括频段和发送功率;所述脉冲神经网络模型的训练过程中,根据D2D用户的D2D设备当前时刻所处环境状态确定第一动作,根据所述第一动作与临近场的D2D设备确定的第二动作进行动作策略参数的更新。
[0038]本专利技术实施例还提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现所述方法。
[0039]本专利技术实施例还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现所述方法。
[0040]本专利技术的有益效果是:通过获取D2D环境状态,根据所述D2D环境状态进行转换处理,确定突触前输入,增强对D2D环境状态的表示能力;根据所述突触前输入以及脉冲神经网络模型,确定脉冲信号,对所述脉冲信号进行解码处理,得到D2D用户的选择动作,所述脉
冲神经网络模型的训练过程中,根据D2D用户的D2D设备当前时刻所处环境状态确定第一动作,根据所述第一动作与临近场的D2D设备确定的第二动作进行动作策略参数的更新;使用脉冲神经网络模型能够节省计算资源且提升通讯性能,确定的D2D用户的选择动作包括频段和发送功率以实现资源的合理分配,从而能够降低干扰,提高频谱资源的利用效率。
附图说明
[0041]图1为本专利技术具体实施例的D2D资源分配方法的步骤流程示意图;
[0042]图2为本专利技术具体实施例脉冲神经网络训练过程的示意图;
[0043]图3(a)为D2D设备奖励方面本专利技术与传统强化学习技术的效果对比示意图,图3(b)为D2D设备奖励方面本专利技术与单脉冲神经网络技术的效果对比示意图,图3(c)为D2D设备通讯速率方面本专利技术与传统强化学习技术的效果对比示意图,图3(d)为D2D设备通讯速率方面本专利技术与单脉冲神经网络技术的效果对比示意图。
具体实施方式<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种D2D资源分配方法,其特征在于,包括:获取D2D环境状态;根据所述D2D环境状态进行转换处理,确定突触前输入;根据所述突触前输入以及脉冲神经网络模型,确定脉冲信号;对所述脉冲信号进行解码处理,得到D2D用户的选择动作;所述选择动作包括频段和发送功率;所述脉冲神经网络模型的训练过程中,根据D2D用户的D2D设备当前时刻所处环境状态确定第一动作,根据所述第一动作与临近场的D2D设备确定的第二动作进行动作策略参数的更新。2.根据权利要求1所述D2D资源分配方法,其特征在于:所述根据所述D2D环境状态进行转换处理,确定突触前输入,包括:确定编码神经元群的高斯感受野;所述高斯感受野包括均值以及方差;计算所述D2D环境状态与所述均值的差值;根据所述差值以及所述方差确定突触前输入。3.根据权利要求1所述D2D资源分配方法,其特征在于:所述根据所述突触前输入以及脉冲神经网络模型,确定脉冲信号,包括:根据所述突触前输入以及所述脉冲神经网络模型的权重,确定膜内电流;根据所述膜内电流与预设阈值,确定脉冲信号。4.根据权利要求3所述D2D资源分配方法,其特征在于:所述根据所述膜内电流与预设阈值,确定脉冲信号,包括:将所述膜内电流积分为膜内电压;当所述膜内电压大于预设阈值,根据时间差分函数确定所述膜内电压的第一函数值,否则确定所述膜内电压的第二函数值;所述脉冲信号包括第一函数值和/或第二函数值。5.根据权利要求1所述D2D资源分配方法,其特征在于:所述对所述脉冲信号进行解码处理,得到D2D用户的选择动作,包括:当经过预设时间步数将所述突触前输入进行相加;时间步数表征D2D设备的运行时间的划分;根据相加结果与所述预设时间步数的比值确定神经元触发频率;计算所述脉冲神经网络模型的权重与所述神经元触发频率的乘积,并计算所述乘积与偏置的和,得到D2D用户的选择动作。6.根据权利要求1所述D2D资源分配方法,其特征在于:所述根据所述第一动作与临近场的D2D设备确定的第二动作进行动作策略参数的更新,包...

【专利技术属性】
技术研发人员:王员根叶培根
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1