The invention discloses a prediction method of grid search support vector machine based on travel time, which belongs to the field of intelligent transportation, including: 1, automatic identification system based on data preprocess data in accordance with the investigation, the missing data on the downlink ship division and redundant data from three steps; 2, construction forecast time history of inland ship model based on travel time, and according to the model of the training data set; 3, based on support vector machine grid search method to find the optimal prediction model parameters; 4, based on the optimal parameters for predicting ship travel time; 5, the prediction results of evaluation. The invention can be used for system data by using data mining methods and mining analysis of ship automatic identification, forecast the inland ship travel time, its application will help to improve the traffic management department in the management level, to promote the rapid development of inland shipping.
【技术实现步骤摘要】
一种基于网格搜索的支持向量机行程时间预测方法
本专利技术涉及一种基于网格搜索的支持向量机行程时间预测方法,属于智能交通领域。该方法可以基于船舶自动识别系统(AutomaticIdentificationSystem,AIS)数据,实现对内河船舶行程时间的预测,为航务管理部门提供理论与技术支持。
技术介绍
内河航运是我国重要的运输方式之一,是综合利用水资源和复杂运输体系的重要参与成员,且连接着内陆区域与沿海区域,为我国每年带来巨大的经济利润。但是,我国内河航运依然存在有船舶航行安全、物流优化管理、港口规划调度等问题,直接影响内河航运的发展。近几年,内河沿岸AIS基站建设飞速,装有AIS的船舶数量快速增长,并且AIS可以采集丰富的数据信息,进行多种应用。因此,可以对内河AIS数据运用数据挖掘理论方法进行挖掘及分析,实现船舶行程时间的精准预测,以提高航务管理部门的管理水平,促进内河航运的迅猛发展。行程时间预测算法在国内外均有了较为深入的研究,但现今其主要针对于城市道路行程时间的预测。同时,在国内外学者基于AIS船舶交通数据进行的船舶行为研究中,已经在解决船舶碰撞以及船舶 ...
【技术保护点】
一种基于网格搜索的支持向量机行程时间预测方法,包括以下几个步骤:步骤一、船舶自动识别系统(Automatic Identification System,AIS)数据预处理首先需要对AIS数据中的缺失数据进行排查。采集到的AIS数据主要包括MMSI号、归档时间、经度、纬度、对地航速、对地航向、船舶类型等信息。在原始数据中,某一时刻的某一船舶可能存在有上述信息不完整的情况,对于此类不完整信息,应该予以排查及去除。其次,根据船舶对地航向角不同进行上下水的划分,将原始AIS数据分为上行船舶及下行船舶两大部分。根据内河船舶航行特点可知,在内河上行驶的船舶,其航行速度会受到上下水不同 ...
【技术特征摘要】
1.一种基于网格搜索的支持向量机行程时间预测方法,包括以下几个步骤:步骤一、船舶自动识别系统(AutomaticIdentificationSystem,AIS)数据预处理首先需要对AIS数据中的缺失数据进行排查。采集到的AIS数据主要包括MMSI号、归档时间、经度、纬度、对地航速、对地航向、船舶类型等信息。在原始数据中,某一时刻的某一船舶可能存在有上述信息不完整的情况,对于此类不完整信息,应该予以排查及去除。其次,根据船舶对地航向角不同进行上下水的划分,将原始AIS数据分为上行船舶及下行船舶两大部分。根据内河船舶航行特点可知,在内河上行驶的船舶,其航行速度会受到上下水不同的影响,下水船舶航行速度明显高于上水船舶,会对行程时间产生影响,进而在建立的预测模型中会产生不同的参数。根据船舶航行对地航向角的不同,将原始数据导入地图中,得到船舶上下行区分图,从而对上行船舶和下行船舶进行划分。最后再剔除冗余航段。在原始数据中,会出现例如船舶未行驶、经纬度数据错误、船舶位于长江航道以外等错误数据,除了剔除上述错误数据之外。有部分船舶位于支流航段,还有部分船舶为轮渡船,并未沿着内河的上下行方向航行,因此,上述类似船舶也应在原始数据中剔除。步骤二、构建基于历史时段的内河船舶行程时间预测模型本发明利用支持向量机(SupportVectorMachine,SVM)的自学习能力,自我学习各项因素之间的复杂函数关系。内河船舶当前时段的行程时间与该时段的前几个时段的行程时间有着一定的函数关系,即:TK=f(Tk-1,Tk-2,...,Tk-n)(1)其中,TK代表在当前时段符合预测航段的各个船舶实际行程时间的平均值;Tk-n代表预测时段k的前几个时段符合预测航段的各个内河船舶实际行程时间,n=1,2,…,n。在预测航段内选取定点A和定点B,A、B之间的航段L即为预测航段。其中,为保证每一组训练数据的起点及终点位置基本相同,需要做如下限定,即假设所选取的起点A的坐标为(x,y),那么实际起点A’的坐标需要满足一定的精度要求,即:|x-x'|≤ε,|y-y'|≤ε。同理,终点B也需要满足以上精度要求。在基于历史时段的预测模型中,因为越靠近当前时段的时段与预测时段的相关程度越大,因此训练集中的每组数据要包含适当数量时段的船舶行程时间,又因为船舶航行速度是影响内河船舶行程时间的又一个重要因素,因此要采用与内河船舶行程时间密切相关的历史时间序列及该时段各船舶航行的平均速度作为预测的特征值。首先将数据分为上行情景一和下行情景二两种情况,然后第一维输入向量为T1第二纬输入向量为T2,第三维输入向量为T3、第n维输入向量为Tn,平均速度向量为V,输出向量为Tn+1。之后,将构造的训练数据导入SVM程序中,SVM通过历史数据进行自我学习,找到输入值与输出值之间的复杂函数关系,即可实现对内河船舶行程时间的预测。步骤三、基于SVM网格搜索法寻找预测模型的最优参数对于径向基核函数的参数C、σ、ε的选择,本发明采用网格搜索中的k折交叉验证法。k折交叉验证是将训练样本平均分成k份,每次拿出k-1份作为...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。