一种基于自动补全的位置预测方法技术

技术编号:20329709 阅读:28 留言:0更新日期:2019-02-13 06:06
本发明专利技术公开了一种基于自动补全的位置预测方法,包括:S1,获取预设时间段的时空数据集;S2,抽取具有共同时空特性的时空主题;S3,选取训练数据集,训练并得到多类分类器;S4,将待预测对象的历史时空数据转换成按时间顺序排列的时空主题序列;S5,预测待预测对象当前时空主题的未来下一个或下几个的时空主题;S6,将待预测对象的历史时空数据中的位置、及与该给定未来时空主题下其他用户的位置作为位置候选集,获取位置候选集中的每一个候选位置的概率,并将概率最大的候选位置作为待预测对象的未来位置。本发明专利技术考虑了人类的行为模式具有多样性和个性化的特点,更加贴近实际应用,而且具有更好的预测精度,预测效率高。

【技术实现步骤摘要】
一种基于自动补全的位置预测方法
本专利技术涉及位置预测技术,特别是涉及一种适用于预测社交网络或现实生活中人员、车辆、设备、事件等的下一个或未来位置的基于自动补全的位置预测方法。
技术介绍
随着传感技术的发展,出现了越来越多可以记录位置的智能设备。过去的十几年,学术界和工业界十年收集了大量的时空数据。从早期的个人通讯的信号塔,GPS轨迹到不同基于位置服务提供的签到数据。而且,很多原本设计用于收费的系统也丰富了时空数据,比如:公共交通中的智能卡。这些时空数据称为人类的移动性研究基础,包括位置预测。位置预测被认为许多主动式服务的核心功能。比如,如果预测待预测对象的下一个位置是“家”,通过智能家居的远程操控系统,在待预测对象到达家之前调节室内温度、自动打扫房间。位置预测在移动广告市场、应急响应和公共安全等众多领域有重要应用。因为潜在的商业和应用价值,在过去的十几年,位置预测吸引了许多研究者的关注,提出了多种位置预测模型。一般的位置预测可以分为两个子任务:一、发现和表示移动规律;二、设计高效的预测算法。传统的位置预测工作大多基于位置规律设计预测算法,位置的规律只是时空数据中行为规律在空间上的投影。而且,个人历史时空数据中的位置记录稀疏,没有明显的规律。这是造成现有预测算法性能不高的重要原因。另外,现有工作假设的移动规律是单一且连续的,比如考虑两个位置间的转移概率,因此,许多预测算法都可以被认为是基于马尔可夫性质设计的。但是,实际上这个假设并不成立。人类行为的复杂性导致个人历史时空数据中存在复杂的移动规律。个人历史时空数据中两个连续的位置存在简单的移动规律,多个位置也存在复杂的移动规律。近几年有学者使用网络模体(NetworkMotifs)研究人的行为模式的组成。Schneider等人利用网络模体对不同国家手机网络数据的分析,发现人类每日的移动可以分解为17个简单的模式,如图1所示。Jiang等人也有类似发现。因此,存在多种不同移动模式的历史时空数据为给位置预测带来了很大的挑战。尽管理论研究证明人的移动的可预测性上限是93%,然而当前最先进的位置预测算法的性能远低于这个上限。目前要达到位置预测的理论上限,还存在两大挑战:首先,如何有效表示内嵌在时空数据中的移动规律;其次,如何在位置预测模型中合理利用这些移动的规律。
技术实现思路
本专利技术的目的在于提供一种基于自动补全的位置预测方法来克服或至少减轻现有技术的上述缺陷中的至少一个。为实现上述目的,本专利技术提供一种基于自动补全的位置预测方法,包括:S1,获取预设时间段的时空数据集;S2,利用张量分解的方法,从S1获取的时空数据集中抽取具有共同时空特性的时空主题;S3,从S1中的“时空数据集”中选取一部分时空数据作为“训练数据集”,根据S2确定的时空主题,确定“训练数据集”中的各时空数据对应的时空主题,以训练并得到多类分类器;S4,利用S3得到的多类分类器,将待预测对象的历史时空数据转换成按时间顺序排列的时空主题序列;S5,根据S4转换得到的待预测对象的时空主题序列,利用查询自动补全技术,预测待预测对象当前时空主题的未来下一个或未来下几个的时空主题;S6,根据给定的未来时空主题,将待预测对象的历史时空数据中的位置、及与该给定未来时空主题下其他用户的位置作为位置候选集,获取位置候选集中的每一个候选位置的概率,并将概率最大的候选位置作为待预测对象的未来位置。进一步地,S5中具体包括:S51,将时空主题序列中的任意子序列作为移动模式,查询自动补全中的历史查询日志由时空主题序列的所有子序列组成,每个子序列被切分成前缀部分和对应的候选部分;S52,构建前缀树,以存储S51中的前缀部分和对应的候选部分;S53,应用任意的排序学习算法,通过时空主题序列预测自动补全的排序;S54,将S53中的排在第一位的移动模式作为查询自动补全技术给出的预测结果,并将其作为“当前移动模式”,再通过确定的“当前移动模式”确定未来下一个或未来下几个时空主题。进一步地,S53使用MPC算法训练自动补全排序功能,其方法如下:S531,设置输出的树结构MITrie为空(φ);S532,按顺序依次从S4中得到的时空主题序列xi中取出每个元素,假设当前取出的元素是S533,从开始,分别取出其后的一个元素,两个元素,......,一直到时空主题序列的末尾,形成多个子序列,假设其中一个子序列为xt;S534,如果子序列xt不在MITrie中,统计xt出现在xi中的次数π(x);S535,按元素个数将xt分割成前缀和后缀两个部分;S536,将xt的前缀、后缀和π(x)添加至MITrie中;S537,返回结果MITrie;当前缀树和排序策略训练完毕后,给定一个长度为wi的时空主题的前缀序列所有以xj开始的候选移动模式根据其在时空主题序列中出现的次数进行排序,出现次数最多的移动模式排在第一位,其余的移动模式依此类推。进一步地,S6中,利用如下候选位置概率计算公式计算位置候选集中的每一个候选位置的概率:p(lk)=(1-λ)pu(lk)+λpg(lk)其中,lk表示候选的地点,k表示候选地点的序号;概率pu(lk)表示待预测对象对出现在某个时空主题中的位置的选择偏好;概率pg(lk)表示相同时空主题和相同时空约束下其余待预测对象对出现在某个时空主题中的位置的选择偏好;λ是探新度,其用于衡量待预测对象在某个时空主题下选择新地点的可能性。进一步地,探新度λ的计算公式如下:其中:ru是历史时空数据中对应某个时空主题的记录个数;“新地点”从1开始编号,f(i)表示地点的编号;如果观测中的地点是“新地点”,则f(1)=1,示性函数I(i)=1;如果观测中的地点不是“新地点”,则示性函数I(i)=0;λ值越大,则待预测对象未来位置更倾向选择“新地点”,否则倾向选择“旧地点”。本专利技术考虑了人类的行为模式具有多样性和个性化的特点,更加贴近实际应用,而且具有更好的预测精度,预测效率高。附图说明图1是本专利技术提供的17种简单移动模式的示意图;图2是本专利技术提供的多移动模式下的时空主题预测和查询自填充的类比的示意图;图3是本专利技术提供的5种具体的移动模式;图4是本专利技术提供的由简单移动模式组成的一时空主题序列示意图;图5是本专利技术提供的基于时空主题的位置预测系统架构示意图;图6是利用不同预测模型的性能比较示意图。具体实施方式在附图中,使用相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面结合附图对本专利技术的实施例进行详细说明。现有的位置预测方法在现实场景上未达令人满意的精度,且人类的行为模式具有多样性和个性化的特点,使得现有的位置预测方法很难在实际复杂的现实环境中对位置进行预测。鉴于此,本实施例将位置预测问题表示成一个信息检索中查询自动补全问题,这样可以贴近实际应用,该方法包括如下步骤,如图5所示:S1,获取预设时间段的时空数据集。其中:“时空数据集”由具有时间和空间两个维度的时空数据组成,该时空数据记录了一个对象某时间在某位置的数据。比如:网络上的签到数据,出租车或滴滴打车等交通工具的通行数据,公交一卡通的数据,以及手机纪录的位置数据等等。时空数据的获取方式非常多样,比如通讯运营商的数据、公交公司、出租车公司、社交网站、点评网站或滴滴打车本文档来自技高网
...

【技术保护点】
1.一种基于自动补全的位置预测方法,其特征在于,包括:S1,获取预设时间段的时空数据集;S2,利用张量分解的方法,从S1获取的时空数据集中抽取具有共同时空特性的时空主题;S3,从S1中的时空数据集中选取一部分时空数据作为训练数据集,根据S2确定的时空主题,确定训练数据集中的各时空数据对应的时空主题,以训练并得到多类分类器;S4,利用S3得到的多类分类器,将待预测对象的历史时空数据转换成按时间顺序排列的时空主题序列;S5,根据S4转换得到的待预测对象的时空主题序列,利用查询自动补全技术,预测待预测对象当前时空主题的未来下一个或未来下几个的时空主题;S6,根据给定的未来时空主题,将待预测对象的历史时空数据中的位置、及与该给定未来时空主题下其他用户的位置作为位置候选集,获取位置候选集中的每一个候选位置的概率,并将概率最大的候选位置作为待预测对象的未来位置。

【技术特征摘要】
1.一种基于自动补全的位置预测方法,其特征在于,包括:S1,获取预设时间段的时空数据集;S2,利用张量分解的方法,从S1获取的时空数据集中抽取具有共同时空特性的时空主题;S3,从S1中的时空数据集中选取一部分时空数据作为训练数据集,根据S2确定的时空主题,确定训练数据集中的各时空数据对应的时空主题,以训练并得到多类分类器;S4,利用S3得到的多类分类器,将待预测对象的历史时空数据转换成按时间顺序排列的时空主题序列;S5,根据S4转换得到的待预测对象的时空主题序列,利用查询自动补全技术,预测待预测对象当前时空主题的未来下一个或未来下几个的时空主题;S6,根据给定的未来时空主题,将待预测对象的历史时空数据中的位置、及与该给定未来时空主题下其他用户的位置作为位置候选集,获取位置候选集中的每一个候选位置的概率,并将概率最大的候选位置作为待预测对象的未来位置。2.如权利要求1所述的基于自动补全的位置预测方法,其特征在于,S5中具体包括:S51,将时空主题序列中的任意子序列作为移动模式,查询自动补全中的历史查询日志由时空主题序列的所有子序列组成,每个子序列被切分成前缀部分和对应的候选部分;S52,构建前缀树,以存储S51中的前缀部分和对应的候选部分;S53,应用排序学习算法,通过时空主题序列预测自动补全的排序;S54,将S53中的排在第一位的移动模式作为查询自动补全技术给出的预测结果,并将其作为“当前移动模式”,再通过确定的“当前移动模式”确定未来下一个或未来下几个时空主题。3.如权利要求2所述的基于自动补全的位置预测方法,其特征在于,S53使用MPC算法训练自动补全排序功能,其方法如下:S531,设置输出的树结构MITrie为空(φ);S532,按时间顺序排列依次从S4中得到的时空主题序列xi中取出每个元素,假设当前取出的元素是S533,从开始,分别...

【专利技术属性】
技术研发人员:易锋
申请(专利权)人:电子科技大学中山学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1