时延预测模型的训练方法和装置及拥塞控制方法和装置制造方法及图纸

技术编号:32135573 阅读:17 留言:0更新日期:2022-01-29 19:43
本公开关于一种时延预测模型的训练方法和装置及拥塞控制方法和装置,训练方法包括:获取训练数据集,其中,所述训练数据集包括各采样时刻的网络传输参数和各采样时刻的网络链路对应的时延真实值;将所述各采样时刻的网络传输参数输入时延预测模型,得到各采样时刻的时延预测值;根据所述各采样时刻的时延真实值和所述各采样时刻的时延预测值的之间的差异确定所述时延预测模型的损失值,所述损失值与所述差异成正相关关系;通过根据所述损失值调整所述时延预测模型的参数,对所述时延预测模型进行训练,得到训练好的时延预测模型。得到训练好的时延预测模型。得到训练好的时延预测模型。

【技术实现步骤摘要】
时延预测模型的训练方法和装置及拥塞控制方法和装置


[0001]本公开涉及通信
,更具体地说,涉及一种时延预测模型的训练方法和装置及拥塞控制方法和装置。

技术介绍

[0002]拥塞控制是网络传输中重要的技术之一。在数据传输过程中,在保证不丢包的基础上,既需要尽量大的数据吞吐量,又需要尽量低的数据传输时延。例如在视频传输场景中,在保证不丢帧的基础上,需要尽量高清的画质,对于一些特定场景例如视频会议,还需要尽量低的端到端数据传输时延。此时需要用到拥塞控制方法。拥塞控制方法是指将数据包以最快的速度发送到接收端并且确保不发生因链路拥塞导致的丢包和时延过大的情况,其效果会影响用户的体验,特别是在视频传输领域。目前的拥塞控制方法包括基于丢包的拥塞控制方法,基于时延的拥塞控制方法和基于带宽估计即测速的拥塞控制方法。相关技术中,基于时延的拥塞控制方法不容易取得较高的带宽利用率。

技术实现思路

[0003]本公开提供一种时延预测模型的训练方法和装置及拥塞控制方法和装置,以至少解决上述相关技术中的问题,也可不解决任何上述问题。
[0004]根据本公开实施例的第一方面,提供一种时延预测模型的训练方法,包括:获取训练数据集,其中,所述训练数据集包括各采样时刻的网络传输参数和各采样时刻的网络链路对应的时延真实值;将所述各采样时刻的网络传输参数输入时延预测模型,得到各采样时刻的时延预测值;根据所述各采样时刻的时延真实值和所述各采样时刻的时延预测值的之间的差异确定所述时延预测模型的损失值,所述损失值与所述差异成正相关关系;通过根据所述损失值调整所述时延预测模型的参数,对所述时延预测模型进行训练,得到训练好的时延预测模型。
[0005]可选地,所述将所述各采样时刻的网络传输参数输入时延预测模型,得到各采样时刻的时延预测值,包括:获取目标采样时刻对应的参数矩阵,所述参数矩阵是目标采样时刻对应的网络传输参数和目标采样时刻之前的各采样时刻对应的网络传输参数,按照时序以及参数类型进行排序得到的矩阵;将所述参数矩阵输入所述时延预测模型中,得到时延预测值向量;将所述时延预测值向量中的最后一个元素作为所述目标采样时刻对应的时延预测值。
[0006]可选地,所述时延预测模型包括编码神经网络和解码神经网络;所述将所述参数矩阵输入所述时延预测模型中,得到时延预测值向量,包括:将所述参数矩阵输入所述编码神经网络,通过所述编码神经网络将各采样时刻的网络传输参数编码为编码向量;将所述编码向量输入所述解码神经网络,通过所述解码神经网络将所述编码向量解码为与各采样时刻一一对应的时延预测值;将各采样时刻一一对应的时延预测值按照时序进行排序,得到时延预测值向量。
[0007]可选地,所述时延真实值是网络数据节点处理时延、发送时延和传播时延的和值。
[0008]可选地,所述根据所述各采样时刻的时延真实值和所述各采样时刻的时延预测值的之间的差异确定所述时延预测模型的损失值,包括:根据所述各采样时刻的时延真实值和所述各采样时刻的时延预测值的之间的差异,得到各采样时刻的损失值;基于所述各采样时刻的损失值得到所述时延预测模型的损失值。
[0009]可选地,所述根据所述各采样时刻的时延真实值和所述各采样时刻的时延预测值之间的差异,得到各采样时刻的损失值,包括:确定所述各采样时刻的时延真实值和所述各采样时刻的时延预测值的差值绝对值;基于所述差值绝对值与设定阈值的大小关系确定所述各采样时刻的损失值计算方式;基于所述各采样时刻的损失值计算方式、所述各采样时刻的时延真实值和所述各采样时刻的时延预测值之间的差异得到各采样时刻的损失值。
[0010]可选地,所述损失值计算方式基于通过以下公式确定:
[0011][0012]其中,l(x
i
,y
i
)为第i个采样时刻的损失值,x
i
为第i个采样时刻的时延预测值,y
i
为第i个采样时刻的时延真实值,a以及b为预先设定的数值,所述设定阈值为1,b小于1。
[0013]可选地,所述通过根据所述损失值调整所述时延预测模型的参数,包括:
[0014]通过随机梯度下降算法对下式求解,获取使得所述损失值最小的参数:
[0015][0016]其中,θ为参数,N为所述训练数据集中训练样本的总数,M
k
为第k个训练样本中各采样时刻的网络传输参数组成的向量,f(M
k
)为第k个训练样本中各采样时刻的时延预测值组成的向量,D
k
为第k个训练样本中各采样时刻的时延真实值组成的向量,L(f(M
k
),D
k
)为损失值,所述训练数据集包括至少一个训练样本,任一训练样本中包括至少一个采样时刻的网络传输参数和至少一个采样时刻的时延真实值。
[0017]可选地,所述网络传输参数包括以下项中的至少一项:实时发送速率、实时接收速率、实时往返时延、实时平滑往返时延、实时最小往返时延、实时丢包率和实时在途数据量。
[0018]根据本公开实施例的第二方面,提供一种拥塞控制方法,包括:获取第一时刻的网络传输参数和所述第一时刻之前的至少一个历史时刻的网络传输参数;将所述第一时刻的网络传输参数和所述第一时刻之前的至少一个历史时刻的网络传输参数输入经由本公开的时延预测模型的训练方法训练好的时延预测模型中,得到所述第一时刻的第一时延预测值;基于所述第一时刻的第一时延预测值,执行拥塞控制。
[0019]可选地,所述网络传输参数包括以下项中的至少一项:实时发送速率、实时接收速率、实时往返时延、实时平滑往返时延、实时最小往返时延、实时丢包率和实时在途数据量。
[0020]可选地,所述将所述第一时刻的网络传输参数和所述第一时刻之前的至少一个历史时刻的网络传输参数输入经由本公开的时延预测模型的训练方法训练好的时延预测模型中,得到所述第一时刻的第一时延预测值,包括:将所述第一时刻和所述第一时刻之前的至少一个历史时刻的网络传输参数按照时序以及参数类型进行排列,得到第一矩阵;将所述第一矩阵输入所述时延预测模型中,得到所述第一时刻的第一时延预测值向量,其中,所述第一时刻的第一时延预测值向量为所述第一时刻和所述第一时刻之前的至少一个历史
时刻的第一时延预测值根据时序排列形成的向量;获取所述第一时刻的第一时延预测值向量的最后一个元素作为所述第一时刻的第一时延预测值。
[0021]可选地,所述基于所述第一时刻的第一时延预测值,执行拥塞控制,包括:根据所述第一时刻的稳定传输往返时延和所述第一时刻的第一时延预测值的差值,得到所述第一时刻的排队时延,所述第一时刻的稳定传输往返时延为在第一时刻的平滑往返时延的一半的时间窗口内的最小的往返时延;基于所述第一时刻的排队时延进行拥塞控制。
[0022]根据本公开实施例的第三方面,提供一种时延预测模型的训练装置,包括:数据获取单元,被配置为:获取训练数据集,其中,所述训练数据集包括各采样时刻的网络传输参数和各采样时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种时延预测模型的训练方法,其特征在于,包括:获取训练数据集,其中,所述训练数据集包括各采样时刻的网络传输参数和各采样时刻的网络链路对应的时延真实值;将所述各采样时刻的网络传输参数输入时延预测模型,得到各采样时刻的时延预测值;根据所述各采样时刻的时延真实值和所述各采样时刻的时延预测值的之间的差异确定所述时延预测模型的损失值,所述损失值与所述差异成正相关关系;通过根据所述损失值调整所述时延预测模型的参数,对所述时延预测模型进行训练,得到训练好的时延预测模型。2.如权利要求1所述的训练方法,其特征在于,所述将所述各采样时刻的网络传输参数输入时延预测模型,得到各采样时刻的时延预测值,包括:获取目标采样时刻对应的参数矩阵,所述参数矩阵是目标采样时刻对应的网络传输参数和目标采样时刻之前的各采样时刻对应的网络传输参数,按照时序以及参数类型进行排序得到的矩阵;将所述参数矩阵输入所述时延预测模型中,得到时延预测值向量;将所述时延预测值向量中的最后一个元素作为所述目标采样时刻对应的时延预测值。3.如权利要求2所述的训练方法,其特征在于,所述时延预测模型包括编码神经网络和解码神经网络;所述将所述参数矩阵输入所述时延预测模型中,得到时延预测值向量,包括:将所述参数矩阵输入所述编码神经网络,通过所述编码神经网络将各采样时刻的网络传输参数编码为编码向量;将所述编码向量输入所述解码神经网络,通过所述解码神经网络将所述编码向量解码为与各采样时刻一一对应的时延预测值;将各采样时刻一一对应的时延预测值按照时序进行排序,得到时延预测值向量。4.如权利要求1所述的训练方法,其特征在于,所述时延真实值是网络数据节点处理时延、发送时延和传播时延的和值。5.一种拥塞控制方法,其特征在于,包括:获取第一时刻的网络传输参数和所述第一时刻之前的至少一个历史时刻的网络传输参数;将所述第一时刻的网络传输参数和所述第一时刻之前的至少一个历史时刻的网络传输参数输入经由如权利要求1到4中的任一权利要求所述的时延预测模型的训练方法训练好的时延预测模型中,得到所述第一时刻的第一...

【专利技术属性】
技术研发人员:赵阳超周超
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1