基于内插网格序列规则的移动对象位置预测方法技术

技术编号:12565317 阅读:57 留言:0更新日期:2015-12-23 09:27
本发明专利技术公开了基于内插网格序列规则的移动对象位置预测方法,该方法首先对原始轨迹数据进行空间离散与内插处理得到对应的内插网格序列数据,然后从所有内插网格序列数据中挖掘得到频繁序列模式,并进一步得到内插网格序列规则,最后基于移动对象当前所在网格与所有内插网格序列规则进行多项式匹配,并基于匹配结果预测移动对象的后续位置。本发明专利技术与传统方法相比,具有匹配率高、预测速度快的优势。

【技术实现步骤摘要】

本专利技术属于移动对象数据挖掘与预测技术的研究领域,具体涉及了基于内插网格 序列规则的移动对象位置预测方法。
技术介绍
随着民用GPS等定位设备在车载以及移动终端上的普遍使用,以及基于位置的服 务(LBS:Location_based Service)和移动社交网络的迅速发展,大量的移动对象数据在 日常生活中正在日益积累并为不同类型的应用所服务,同时也成为众多领域的科学研究工 作者开展科学研究的新型数据源。由于移动对象数据中的每一个轨迹点反映空间上的一个 位置以及时间上的一个事件,通过对大量的移动对象数据的分析,预测移动对象群体的运 动趋势,可为基于位置的智能广告推送,市交通规划、实时交通导航等众多行业应用提供辅 助决策功能。 传统的移动对象位置预测主要采用统计建模的方法,例如:决策树、贝叶斯推理、 隐马尔科夫模型等,优点是预测的精度高,但模型计算的复杂度高,难以应用于实时处理性 能要求较高的移动计算环境。近年来,基于数据挖掘的位置预测技术成为主流研究方法:首 先采用简单的统计模型,从大量的移动对象数据中挖掘中反映移动对象群体所共同遵循的 规则,然后基于移动对象当前路径与挖掘的规则的匹配预算对移动对象的后续位置进行预 测。这种使用简单统计模型以及离线数据挖掘、在线预测相结合的方式,可以大大提高移动 对象位置预测的速度,满足应用系统对于实时处理性能的要求。 但是,现有的基于数据挖掘的位置预测方法存在一个共性的问题:挖掘出来的用 于位置预测的规则的可用性不高,也即规则与移动对象位置的匹配率较低。研究发现其主 要原因包括:(1)原始轨迹数据以位置测量为最小单位进行空间坐标的自然离散,会使得 从原始轨迹数据挖掘的规则粒度级别太小,不具有通用特性。(2)规则包含的位置不能保证 具有空间连续性,当移动对象的位置处于规则包含位置的中间区域时,就不能进行有效的 位置预测。本专利技术提出了一种,可以有效 的解决匹配率低的问题,且具有较高的运算性能。
技术实现思路
为了解决上述
技术介绍
提出的技术问题,本专利技术旨在提供基于内插网格序列规则 的移动对象位置预测方法,解决了传统技术匹配率低的问题。 为了实现上述技术目的,本专利技术的技术方案为: ,包括以下步骤: 步骤1 :采用空间等间隔的划分方法,将所有原始轨迹数据的空间分布范围划分 为一系列的二维网格; 所述原始轨迹数据表示一个移动对象连续位置测量的有序列表,其定义为Tid = (P1, P2,…,Pn),其中,下标ID表示原始轨迹的序列号,Pi= (X,y), 1彡i彡η表示一个轨 迹点,X,y表示轨迹点的横、纵坐标值; 对于一个包含所有原始轨迹数据的离散二维空间R2= {p i 11 < i < η},其对应的 二维网格为 DR2= {Cell 11 < Cell · col < col_count,I < Cell · row < row_count},其 中,Cell表不一个网格,Cell · col、Cell · row分别表不网格Cell在二维空间划分中所处 的列号、行号,col_count、row_count分别是根据设定的空间分辨率而设定划分的列数、行 数; 所述空间等间隔的划分方法满足如下条件: (1)如果网格 Cell 满足条件:(Cell · row = 1) Λ (Cell · col = 1),则 Cell 为 起始网格,且 Cell · LB · x = Min (Pi · x),Cell · LB · y = Min (Pi · y),Cell · LB · x 表不网 格Cell左下角的横坐标值,Cell · LB · y表示网格Cell左下角的纵坐标值,其中,"Λ"表 示"并且"关系; (2) Cell · RT · X = Cell · LB · X+Δ X,Cell · RT · y = Cell · LB · y+Δ y 分别表 示网格Cell右上角的横、纵坐标值;其中,分别表示网格在空间 范围上的横、纵跨度; (3)如果网格Cellk与网格Cellr^足条佴,则称Cellk 是Cellj的左方网格,两者的坐标关系满足Cell j *LB ·χ = Cellk *RT ^,Cellj *LB= Cellk · LB · y ; (4)如果网格Cellk与网格Cell」满足条件则称Cellk 是Cellj的下方网格,两者的坐标关系满足Cell」· LB · X = Cellk · LB · X,Cellj · LB · y = Cellk · RT · y ; ⑶如果网格Cellk与网格&11满足条件则称Cellk 是Cell j的左下方网格,两者的坐标关系满足Cell j · LB · X = Cellk · RT · X,Cell j · LB · y =Cellk · RT · y ; 步骤2 :根据原始轨迹数据与二维网格的匹配,对原始轨迹数据进行空间离散化, 得到对应的网格序列; 所述网格序列是,对于任一网格Cell1G DR 2, 1彡i彡n,都满足条件,即原始轨迹点P1包含于网格Cell 1; 步骤3 :对网格序列中空间不相邻的两个网格进行内插处理,得到对应的内插网 格序列; 步骤4 :根据设定的支持度阈值,从所有内插网格序列数据中挖掘得到长度为1的 频繁序列模式; 定义 SePIntpC = (CellnCelU..., Celln)为一个内插网格序列 模式,其中,Cell1G C,1彡i彡η,η表示模式的长度,任意两个连续的网格 Cell1, Cell j, 1彡i彡n,1彡j彡n,j = (i+1),必须满足空间邻近条件:(0彡I Cell1 .col-C ell j · col I < 1) Λ (0 < I Celli · row-Cell j · row I < 1); 对于一个内插网格序列SeIntpC = (Cell1, Cell2, . . .,CellJ和一个内插网格序 列模式 SePIntpC = (Cell1, Cell2,…,Celln),如果满足条件:(l)n < m ; (2) SeIntpC 中存 在连续的子序列(Cellk,Cellk+1,...,Cellk+n D与SePIntpC完全匹配,则称SeIntpC包含 SePIntpC,记为 Se/nipC' 2 &户/?沪C ; 对于一个内插网格序列模式P和一个内插网格序列数据库D = (SeIntpC1, SeInt pC2, · · ·,SeIntpCn),D对P的支持度定义为:表不D中包含P的内插网 格序列的数量,如果為,α是设定的支持度阈值,则称P为在D中频繁序列模式; 步骤5 :对长度为K的任意两个频繁序列模式,进行中重合的关系判断,并基于判 断结果生成长度为Κ+1的候选序列模式,其中,长度为K的频繁序列模式由长度为1的频繁 序列模式组合生成,K = 2, 3, 4··· 对两个内插网格序列模式如果 A的子序列与B的子序列'完全匹配,则称A与 B中重合; 步骤6 :扫描所有内插网格序列数据,计算长度为Κ+1的所有候选序列模式的支持 度,本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN105184088.html" title="基于内插网格序列规则的移动对象位置预测方法原文来自X技术">基于内插网格序列规则的移动对象位置预测方法</a>

【技术保护点】
基于内插网格序列规则的移动对象位置预测方法,其特征在于,包括以下步骤:步骤1:采用空间等间隔的划分方法,将所有原始轨迹数据的空间分布范围划分为一系列的二维网格;所述原始轨迹数据表示一个移动对象连续位置测量的有序列表,其定义为TID=(p1,p2,...,pn),其中,下标ID表示原始轨迹的序列号,pi=(x,y),1≤i≤n表示一个轨迹点,x,y表示轨迹点的横纵坐标值;对于一个包含所有原始轨迹数据的离散二维空间R2={pi|1≤i≤n},其对应的二维网格为DR2={Cell|1≤Cell·col≤col_count,1≤Cell·row≤row_count},其中,Cell表示一个网格,Cell·col、Cell·row分别表示网格Cell在二维空间划分中所处的列号、行号,col_count、row_count分别是根据设定的空间分辨率而设定划分的列数、行数;所述空间等间隔的划分方法满足如下条件:(1)如果网格Cell满足条件:(Cell·row=1)∧(Cell·col=1),则Cell为起始网格,且Cell·LB·x=Min(pi·x),Cell·LB·y=Min(pi·y),Cell·LB·x表示网格Cell左下角的横坐标值,Cell·LB·y表示网格Cell左下角的纵坐标值,其中,“∧”表示“并且”关系;(2)Cell·RT·x=Cell·LB·x+Δx,Cell·RT·y=Cell·LB·y+Δy分别表示网格Cell右上角的横、纵坐标值;其中,Δx=Max(pi·x)-Min(pi·x)col_count,Δy=Max(pi·y)-Min(pi·y)row_count]]>分别表示网格在空间范围上的横、纵跨度;(3)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的左方网格,两者的坐标关系满足Cellj·LB·x=Cellk·RT·x,Cellj·LB·y=Cellk·LB·y;(4)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的下方网格,两者的坐标关系满足Cellj·LB·x=Cellk·LB·x,Cellj·LB·y=Cellk·RT·y;(5)如果网格Cellk与网格Cellj满足条件则称Cellk是Cellj的左下方网格,两者的坐标关系满足Cellj·LB·x=Cellk·RT·x,Cellj·LB·y=Cellk·RT·y;步骤2:根据原始轨迹数据与二维网格的匹配,对原始轨迹数据进行空间离散化,得到对应的网格序列;所述网格序列是,对于任一网格Celli∈DR2,1≤i≤n,都满足条件即原始轨迹点pi包含于网格Celli;步骤3:对网格序列中空间不相邻的两个网格进行内插处理,得到对应的内插网格序列;步骤4:根据设定的支持度阈值,从所有内插网格序列数据中挖掘得到长度为1的频繁序列模式;定义SePIntpC=(Cell1,Cell2,...,Celln)为一个内插网格序列模式,其中,Celli∈C,1≤i≤n,n表示模式的长度,任意两个连续的网格Celli,Cellj,1≤i≤n,1≤j≤n,j=(i+1),必须满足空间邻近条件:(0≤|Celli·col‑Cellj·col|≤1)∧(0≤|Celli·row‑Cellj·row|≤1);对于一个内插网格序列SeIntpC=(Cell1,Cell2,...,Cellm)和一个内插网格序列模式SePIntpC=(Cell1,Cell2,...,Celln),如果满足条件:(1)n≤m;(2)SeIntpC中存在连续的子序列(Cellk,Cellk+1,...,Cellk+n‑1)与SePIntpC完全匹配,则称SeIntpC包含SePIntpC,记为对于一个内插网格序列模式P和一个内插网格序列数据库D=(SeIntpC1,SeIntpC2,...,SeIntpCn),D对P的支持度定义为:SuppDP=|{SeIntpCi|SeIntpCi⊇P,SeIntpCi∈D}|n×100%]]>其中,1≤i≤n,表示D中包含P的内插网格序列的数量,如果α是设定的支持度阈值,则称P为在D中频繁序列模式;步骤5:对长度为K的任意两个频繁序列模式,进行中重合的关系判断,并基于判断结果生成长度为K+1的候选序列模式,其中,长度为K的频繁序列模式由长度为1的频繁序列模式组合生成,K=2,3,4…对两个内插网格序列模式A=(Celli1,Celli2,...,Cellin),B=(Cellj1,Cellj2,...,Celljn),]]>如果A的子序列(Celli2,Celli3,....

【技术特征摘要】

【专利技术属性】
技术研发人员:张海涛葛国栋陈泽伟刘钊胡栋朱云虹武晨雪
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1