一种基于混频长短时记忆网络的航迹数据预测方法技术

技术编号：37537872 阅读：10 留言：0更新日期：2023-05-12 16:06

本发明专利技术提供了一种基于混频长短时记忆网络的航迹数据预测方法，包括：步骤1，构建航迹数据训练样本集合；步骤2，对航迹数据进行分类，设定预测航迹数据同频率为低频，更新频率高于预测数据的为高频，将航迹数据训练样本分为高、低两组，分出训练集和测试集；步骤3，将训练集作为混频长短时记忆网络的输入，训练获得最优预测模型；步骤4，输出下一个时间周期的预测数据。本发明专利技术利用长短时记忆模型方法对航迹数据进行预测，运用长短时记忆模型方法对航迹数据进行拟合，输出下一个时间周期点的数据。对于航迹数据预测相关问题有非常重要的意义。对于航迹数据预测相关问题有非常重要的意义。对于航迹数据预测相关问题有非常重要的意义。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于混频长短时记忆网络的航迹数据预测方法

[0001]本专利技术涉及一种基于混频长短时记忆网络的航迹数据预测方法。

技术介绍

[0002]随着传感器的升级发展，获取航迹数据的能力和技术的提升，人们可以获得维度更丰富，实时性更好的航迹数据。在对航迹数据进行数据分析时，由于传感器部署不均、精度不一等情况，仍然存在数据频度不均衡的问题。不均衡性体现在两个方面：航迹数据的不同采集频率和低频数据的滞后性。传统航迹数据预测方法中的各类数据频率需要相同，数据频度不一致的情况下，在因变量数据频率较低的情况下，会出现数据量不足，且缺少其他频率参与预测，不能完全适用于数据的不同采集频率；运用低频数据进行预测时，无法保证数据的实时性，航迹数据预测无法适应航迹数据的变化情况。
[0003]除了传统航迹数据预测方法之外，运用深度学习处理航迹数据的模型，例如长短时记忆网络也被提出，以提高数据预测准确性。但是长短时记忆网络需要结构化的数据输入，在有无法对齐的时间点的情况下，将会损失混频数据中的高频信息，也未完全解决预测模型对现实数据变化的应对。
[0004]因此，在进行航迹数据预测研究时，需要一种可以在不损失高频数据信息的情况下，提高预测数据实时性和准确性的预测方法。

技术实现思路

[0005]专利技术目的：本专利技术的目的是提供一种基于混频长短时记忆网络的航迹数据预测方法，以解决进行航迹数据预测研究时缺少高频数据参与预测、无法实时适应数据变化、数据预测准确性不足的问题。
[0006]技术方案：
>[0007]为实现上述目的，本专利技术建立了一种基于混频长短时记忆网络的航迹数据预测方法，整编预测数据为航迹数据，并选择数据的关联航迹数据，构建航迹数据训练样本集合；对关联航迹数据进行分类，按照频率分为高、低两个频率分组，在不同分组分别进行时间对齐和数据增强，分出训练集和测试集；将混频训练样本作为混频长短时记忆网络的输入，混频训练样本经过两个隐藏层训练之后获得预测数据，调整超参数，使得依据训练集产生的预测数据的平均绝对误差满足设定阈值条件，并反复训练获得预测模型；根据预测模型和测试集数据，输出下一个时间周期的预测数据。
[0008]具体技术方案包括如下步骤：
[0009]步骤1、选定需要进行数据预测的航迹数据为因变量，选择不同频率的其他航迹数据作为自变量，构建混频的航迹数据训练样本集合；
[0010]步骤2、根据混频的航迹数据训练样本集合划分训练集和测试集；
[0011]步骤3、将训练集作为混频长短时记忆网络的输入，训练获得最优预测模型；
[0012]步骤4、根据最优预测模型和测试集，输出下一个时间周期的预测数据。
[0013]步骤1包括：所述航迹数据包括经度、维度、高度、速度、航向角和垂直速度，选定需要进行数据预测的航迹数据为因变量Y，因变量航迹数据表示为Y:其中Y0为初始时刻，Y
i
为第i个时刻，为第Y
i
时刻的因变量数值，因变量Y的更新频率为低频，设定更新频率为m，即m个时间周期更新一次，则第i个时刻表示为t
i
＝t0+i*m；选择与Y相关的n个不同频率的其他航迹数据作为自变量，自变量数据更新频率高于或等于因变量Y，即自变量数据相较因变量更新更快，设定自变量数据更新频率为k，k≤m，记自变量数据集合为X:{X
(1)
,X
(2)
,
…
,X
(n)
}，集合X包含n个自变量的航迹数据，其中自变量X
(n)
表示为X
(n)
:其中τ0为初始时刻，τ
j
为第j个时刻，为第n个自变量在第j个时刻的数值；X为关联航迹数据训练样本，Y为预测数据航迹数据样本，Y与X构成混频的航迹数据训练样本集合。
[0014]步骤2包括如下步骤：
[0015]步骤2
‑
1、对关联航迹数据进行分类，设定预测数据同频率为低频，更新频率高于预测数据的为高频，将航迹数据训练样本分为高、低两组；设定X中，频率等于预测数据频率m的为l个，其他高频更新数据为r个，对应高频频率为k，表示为k:{k1,k2,
…
,k
r
|k,k2,
…
,k
r
<m}，k
r
为第r个高频数据的更新频率；
[0016]步骤2
‑
2、将航迹数据训练样本集合的每个变量用z
‑
score进行标准化，对原始数据进行转换，变成标准分值；
[0017]步骤2
‑
3、将同一更新频率分组的数据按照时间点和航迹数据进行对齐，如果在一个时间点上没有数据，则用滑动最小二乘法，将每个变量用向后填充的方式，补齐空缺值；
[0018]步骤2
‑
4、按照训练集时间点和测试集时间点，将自变量数据分为训练集和测试集。
[0019]步骤2
‑
2包括：根据n个自变量的时间变量X
(n)
::为第n个自变量在第j个时刻的数值，用z
‑
score进行标准化：
[0020][0021]其中为z
‑
score变化后的自变量数据，为n个自变量的时间变量的均值，σ
(n)
为自变量标准差，则变化后的单个关联航迹数据训练样本为Z
(n)
::为第n个自变量在第j个时刻标准化后的数值。
[0022]步骤2
‑
3包括：设定n个自变量的航迹数据为Z
(n)
::为第n个自变量在第j个时刻标准化后的数值，设定频率为k
(n)
，第j个时刻表示成τ
j
＝τ0+j*k
(n)
，如果其中存在时间点τ
i
没有数据，则采取滑动最小二乘法进行补缺，用s阶多项式f
τ
(τ)拟合出τ0和τ
j
之间一个时间点τ
i
的样本值，设定为τ
i
的拟合值：
[0023][0024]其中为第k个数据在τ
i
时刻的采样系数，v
(n)
为第n个因变量的拟合基函数，
为s阶拟合基函数，在拟合时，引入滑动最小二乘法权重ω
i,j
：
[0025][0026][0027]其中σ为收敛系数，求解计算在τ0和τ
j
之间的得到补缺后的因变量航迹数据。
[0028]步骤2
‑
4包括：取补缺后的因变量时间按时间周期为t:{t0,
…
,t
i
}，t
i
为第i个时刻，取t
i
向前共5个时间周期为测试集时间，其他为训练集时间，即t0≤t
xl
<t
i<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于混频长短时记忆网络的航迹数据预测方法，其特征在于，包括如下步骤：步骤1、选定需要进行数据预测的航迹数据为因变量，选择不同频率的其他航迹数据作为自变量，构建混频的航迹数据训练样本集合；步骤2、根据混频的航迹数据训练样本集合划分训练集和测试集；步骤3、将训练集作为混频长短时记忆网络的输入，训练获得最优预测模型；步骤4、根据最优预测模型和测试集，输出下一个时间周期的预测数据。2.根据权利要求1所述的方法，其特征在于，步骤1包括：所述航迹数据包括经度、维度、高度、速度、航向角和垂直速度，选定需要进行数据预测的航迹数据为因变量Y，因变量航迹数据表示为Y：其中t0为初始时刻，t
i
为第i个时刻，为第t
i
时刻的因变量数值，因变量Y的更新频率为低频，设定更新频率为m，即m个时间周期更新一次，则第i个时刻表示为t
i
＝t0+i*m；选择与Y相关的n个不同频率的其他航迹数据作为自变量，自变量数据更新频率高于或等于因变量Y，设定自变量数据更新频率为k，k≤m，记自变量数据集合为X：{X
(1)
，X
(2)
，...，X
(n)
}，集合X包含n个自变量的航迹数据，其中自变量X
(n)
表示为X
(n)
：其中τ0为初始时刻，τ
j
为第j个时刻，为第n个自变量在第j个时刻的数值；X为关联航迹数据训练样本，Y为预测航迹数据样本，Y与X构成混频的航迹数据训练样本集合。3.根据权利要求2所述的方法，其特征在于，步骤2包括如下步骤：步骤2
‑
1、对关联航迹数据进行分类，设定预测数据同频率为低频，更新频率高于预测数据的为高频，将航迹数据训练样本分为高、低两组：设定X中，频率等于预测数据频率m的为l个，其他高频更新数据为r个，对应高频频率为k，表示为k：{k1，k2，...，k
r
|k，k2，...，k
r
＜m}，k
r
为第r个高频数据的更新频率；步骤2
‑
2、将航迹数据训练样本集合的每个变量用z
‑
score进行标准化，对原始数据进行转换，变成标准分值；步骤2
‑
3、将同一更新频率分组的数据按照时间点和航迹数据进行对齐，如果在一个时间点上没有数据，则用滑动最小二乘法，将每个变量用向后填充的方式，补齐空缺值；步骤2
‑
4、按照训练集时间点和测试集时间点，将自变量数据分为训练集和测试集。4.根据权利要求3所述的方法，其特征在于，步骤2
‑
2包括：根据n个自变量的时间变量X
(n)
：：为第n个自变量在第j个时刻的数值，用z
‑
score进行标准化：其中为z
‑
score变化后的自变量数据，为n个自变量的时间变量的均值，σ
(n)
为自变量标准差，则变化后的单个关联航迹数据训练样本为Z
(n)
：：为第n个自变量在第j个时刻标准化后的数值。5.根据权利要求4所述的方法，其特征在于，步骤2
‑
3包括：设定n个自变量的航迹数据为Z
(n)
：：为第n个自变量在第j个时刻标准化后的数值，设定频率为k
(n)
，第j个时刻表示成τ
j
＝τ0+j*k
(n)
，如果其中存在时间点τ
i
没有数据，则采取滑动最小二乘
法进行补缺，用s阶多项式f
τ
(τ)拟合出τ0和τ
j
之间一个时间点τ
i
的样本值，设定为τ
i
的拟合值：其中为第k个数据在τ
i
时刻的采样系数，v
(n)
为第n个因变量的拟合基函数，为s阶拟合基函数，在拟合时，引入滑动最小二乘法权重ω
i，j
：：其中σ为收敛系数，求解计算在τ0和τ
j
之间的得到补缺后的因变量航迹数据。6.根据权利要求5所述的方法，其特征在于，步骤2
‑
4包括：取补缺后的因变量时间按时间周期为t：{t0，...，t
i
}，t
i
为第i个时刻，取t
i
向前共5个时间周期为测试集时间，其他为训练集时间，即t0≤t
xl
＜t

【专利技术属性】
技术研发人员：王玉坤，王妍妍，陈鹏，高菁，陈文颖，张春晖，
申请(专利权)人：中国电子科技集团公司第二十八研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人