一种基于线段聚类的多维度高精度航迹智能预测方法技术

技术编号:26170816 阅读:28 留言:0更新日期:2020-10-31 13:40
本发明专利技术公开了一种基于线段聚类的多维度高精度航迹智能预测方法,将连续的航迹数据离散化,经过突变的经度数据处理、数据清洗和归一化处理后,使用Douglas‑Peucker算法对航迹数据进行压缩,使用DBSCAN聚类算法对航迹进行聚类,根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,通过航迹预测神经网络模型进行航迹预测,完成多维度高精度航迹预测任务。本发明专利技术将原始航迹数据压缩,在保留航迹特征的情况下极大减轻了计算压力,缩短了运算时间,提高了运算效率;采用卷积加LSTM神经网络模型,使用卷积进行特征提取,有利于提高LSTM神经网络模型对航迹预测的精度。

A multi dimension and high precision track intelligent prediction method based on line segment clustering

【技术实现步骤摘要】
一种基于线段聚类的多维度高精度航迹智能预测方法
本专利技术涉及目标跟踪
,尤其涉及一种基于线段聚类的多维度高精度航迹智能预测方法。
技术介绍
针对掌握可疑移动目标航迹的具体任务,一方面要学习可疑移动目标航迹的规律,高精确度地预测出移动目标未来的航迹,另一方面还要考虑现实条件下的多维度因素,例如突发事件、国际热点、天气状况等情况,高精度预测出移动目标的航迹信息。海洋中移动目标(例如船舶)航迹数据的采集方式,通常是间歇性地获取船舶当前位置的数据信息,根据船舶所处的不同状态以2s一次到数分钟一次不等的频率,向外播发位置信息。由于船舶航迹较长,因此,以2小时为单位进行数据采集。考虑在同一片区域内,每天可能有数百条船舶通行,由此产生的数据量会非常巨大,将它们全部记录下来会带来昂贵的存储开销,并且,还需要将如此庞大的数据加载到内存中进行分析处理,这对可视化平台系统的信息处理能力是一个巨大考验。船舶航迹数据是典型的时空大数据,其在多个领域都有着极其突出且重要的研究和应用价值。作为时序数据的特例,航迹数据具有鲜明的时序特征和突出的空间特征。因此,航迹数据的处理和挖掘方法不能完全照搬时序数据的经验,而应当考虑其特殊性。当前限制航迹数据处理和挖掘的重要因素之一是移动目标航迹数据海量的数据规模。航迹数据的海量数据规模带来的问题是多方面的,主要表现在:1)数据储存压力大,海量的数据规模和非结构化的数据组织为航迹数据的实时数据存储和快速索引带来了巨大的挑战;2)数据的分析压力大,典型的数据挖掘方法在面对航迹数据时通常无法直接使用,为航迹数据的分析和挖掘带来了挑战。传统的海上移动目标航迹预测方法不能针对以上缺点灵活地对航迹数据进行处理,在已有的预测方法中也较少考虑到国际热点、天气状况等多维度因素的影响。因此,不能满足日益复杂的航迹预测需求。
技术实现思路
有鉴于此,本专利技术提供了一种基于线段聚类的多维度高精度航迹智能预测方法,用于针对海上移动目标航迹数据及现实条件下多维度因素的处理,提供一种计算简单、约束及需求灵活、效率优良的海上移动目标航迹预测方法,解决多维度条件下的航迹预测问题。因此,本专利技术提供了一种基于线段聚类的多维度高精度航迹智能预测方法,包括如下步骤:S1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;S2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;S3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;S4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;S5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。在一种可能的实现方式中,在本专利技术提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,所述航迹预测神经网络模型的训练过程,包括如下步骤:SS1:采用等距离散方法将原始连续的历史航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;SS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;SS3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;SS4:将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。在一种可能的实现方式中,在本专利技术提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S1和步骤SS1中,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理,具体包括:对离散的航迹数据中移动目标经度为西经时的航迹点的经度进行数据转换计算:a=awest+360(1)其中,a表示数据转换后的经度,awest表示移动目标经度为西经时的经度;经数据转换后,针对离散的航迹数据中的所有航迹点,计算相邻两个航迹点之间的欧氏距离:其中,(ai,bi)和(ai+1,bi+1)表示离散的航迹数据中相邻的两个航迹点,li表示航迹点(ai,bi)和航迹点(ai+1,bi+1)之间的欧氏距离;i=2,3,...,n-1,n为离散的航迹数据中航迹点的总数量;当航迹点(ai,bi)与航迹点(ai-1,bi-1)之间的欧氏距离li-1以及航迹点(ai,bi)与航迹点(ai+1,bi+1)之间的欧氏距离li均大于野值数据判定值ld时,将航迹点(ai,bi)看作航迹数据中的野值,将航迹点(ai,bi)剔除;采用MinMaxScaler方法对移动目标的经度和纬度进行归一化:其中,表示将经度ai归一化到[0,1]后的值,amin和amax分别表示所有经度数据(a1,a2,...,an)中的最小值和最大值;表示将纬度bi归一化到[0,1]后的值,bmin和bmax分别表示所有纬度数据(b1,b2,...,bn)中的最小值和最大值。在一种可能的实现方式中,在本专利技术提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S2和步骤SS2中,利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点,具体包括如下步骤:S21:将航迹的首尾两个端点连接,构造基线;S22:计算除航迹的首尾两个端点外的其余航迹点到基线的距离,找到距离基线最远的航迹点,并判断该航迹点距离基线的距离是否大于阈值;若是,则执行步骤S23;若否,则执行步骤S24;S23:选取该航迹点为特征点,并以该航迹点为界将除该航迹点外的其余航迹点划分为两个航迹;返回步骤S21,在新划分出的航迹中提取特征点;S24:算法结束。在一种可能的实现方式中,在本专利技术提供的上述基于线段聚类的多维度高精度航迹智能预测方法中,步骤S3和步骤SS3中,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇,具体包括如下步骤:S31:遍历航迹片段集,找到所有的核心线段;S32:根据邻域范围,将所有的核心线段连通聚合成航迹簇;S33:在剩余非核心线段中找到与各类航迹簇密度相连的线段,并加入对应的航迹簇中;其中,对核心线段和密度相连解释如下:假定线段Lu、Lv、Lw为航迹片段集D中的线段,基于线段的DBSCAN聚类算法有如下定义:ε-邻域集Nε:Nε(Lu)={Lu∈D|ddist(Lu,Lv)≤ε}(5)其中,Nε(Lu)为线段Lu在航迹片段集D内所有与线段Lu距离小于邻域范围ε的线段集合,ddist(Lu,Lv)表示线段Lu与线段Lv之间的距离;...

【技术保护点】
1.一种基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,包括如下步骤:/nS1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;/nS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;/nS3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;/nS4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;/nS5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。/n

【技术特征摘要】
1.一种基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,包括如下步骤:
S1:采用等距离散方法将原始连续的待预测航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
S2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
S3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
S4:根据多维度因素下不同的突发情况,选取与突发情况对应的航迹簇,作为预先训练好的航迹预测神经网络模型的输入,进行航迹预测;
S5:采用inv_MinMaxScaler方法对航迹预测结果中的经度时间序列和纬度时间序列进行反归一化处理。


2.如权利要求1所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,所述航迹预测神经网络模型的训练过程,包括如下步骤:
SS1:采用等距离散方法将原始连续的历史航迹数据转化为离散的航迹数据,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理;
SS2:利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点;
SS3:将提取的各所述特征点依次连接,得到航迹片段集,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇;
SS4:将聚类得到的所有航迹簇输入航迹预测神经网络模型,进行训练,待训练结束,得到训练好的航迹预测神经网络模型。


3.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S1和步骤SS1中,对离散的航迹数据进行突变的经度数据处理后,剔除异常数据,并进行归一化处理,具体包括:
对离散的航迹数据中移动目标经度为西经时的航迹点的经度进行数据转换计算:
a=awest+360(1)
其中,a表示数据转换后的经度,awest表示移动目标经度为西经时的经度;
经数据转换后,针对离散的航迹数据中的所有航迹点,计算相邻两个航迹点之间的欧氏距离:



其中,(ai,bi)和(ai+1,bi+1)表示离散的航迹数据中相邻的两个航迹点,li表示航迹点(ai,bi)和航迹点(ai+1,bi+1)之间的欧氏距离;i=2,3,...,n-1,n为离散的航迹数据中航迹点的总数量;
当航迹点(ai,bi)与航迹点(ai-1,bi-1)之间的欧氏距离li-1以及航迹点(ai,bi)与航迹点(ai+1,bi+1)之间的欧氏距离li均大于野值数据判定值ld时,将航迹点(ai,bi)看作航迹数据中的野值,将航迹点(ai,bi)剔除;
采用MinMaxScaler方法对移动目标的经度和纬度进行归一化:






其中,表示将经度ai归一化到[0,1]后的值,amin和amax分别表示所有经度数据(a1,a2,...,an)中的最小值和最大值;表示将纬度bi归一化到[0,1]后的值,bmin和bmax分别表示所有纬度数据(b1,b2,...,bn)中的最小值和最大值。


4.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S2和步骤SS2中,利用Douglas-Peucker算法对归一化处理后的航迹数据进行压缩,提取特征点,具体包括如下步骤:
S21:将航迹的首尾两个端点连接,构造基线;
S22:计算除航迹的首尾两个端点外的其余航迹点到基线的距离,找到距离基线最远的航迹点,并判断该航迹点距离基线的距离是否大于阈值;若是,则执行步骤S23;若否,则执行步骤S24;
S23:选取该航迹点为特征点,并以该航迹点为界将除该航迹点外的其余航迹点划分为两个航迹;返回步骤S21,在新划分出的航迹中提取特征点;
S24:算法结束。


5.如权利要求2所述的基于线段聚类的多维度高精度航迹智能预测方法,其特征在于,步骤S3和步骤SS3中,利用DBSCAN聚类算法对所述航迹片段集进行聚类,得到多个航迹簇,具体包括如下步骤:
S31:遍历航迹片段集,找到所有的核心线段;
S32:根据邻域范围,将所有的核心线段连通聚合成航迹簇;
S33:在剩余非核心线段中找到与各类航迹簇密度相连的线段,并加入对应的航迹簇中;
其中,对核心线段和密度相连解释如下:
假定线段Lu、Lv、Lw为航迹片段集D中的线段,基于线段的DBSCAN聚类算法有如下定义:
ε-邻域集Nε:
Nε(Lu)={Lu∈D|ddist(Lu,Lv)≤ε}(5)
其中,Nε(Lu)为线段Lu在航迹片段集D内所有与线段Lu距离小于邻域范围ε的线段集合,ddist(Lu,Lv)表示线段Lu与线段Lv之间的距离;
核心线段:给定邻域范围ε和邻域密度阈值MinLns,若Nε(Lu)中的线段数量大于或等于MinLns,则认为线段Lu为核心线段;
直接密度可达:给定邻域范围ε和邻域密度阈值MinLns,若线段Lv为核心线段,线段Lu在线段Lv的ε-邻域集Nε中,则认为从线段Lu到线段Lv直接密度可达;
密度可达:给定邻域范围ε和邻域密度阈值MinLns,若从线段Lu到线段Lw直接密度可达,且从线段Lw到线段Lv直接密度可达,则认为从线段Lu到线段Lv密度可达;
密度相连:给定邻域范围ε和邻域密度阈值MinLns,若存在线段Lw,且线段Lu和线...

【专利技术属性】
技术研发人员:胡庆雷杨懿琳郑建英郭雷
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1