一种基于轨迹大数据最近邻查询的个性化推荐方法技术

技术编号：15724725 阅读：95 留言：0更新日期：2017-06-29 11:00

本发明专利技术公开了一种基于轨迹大数据最近邻查询的个性化推荐方法。本发明专利技术基于轨迹大数据最近邻查询，设计高效的存储和索引结构来处理轨迹大数据。本发明专利技术首先对轨迹大数据进行抽取、降噪、转换和存储处理，而后对被存储的轨迹数据建立全局的R树索引和局部的R树索引，并对每个分区建立基于轨迹编号集合的索引和基于轨迹数目的索引。在用户提交查询时，通过访问本发明专利技术的索引结构，进行基于轨迹大数据最近邻查询以提供个性化推荐服务。本发明专利技术很好地满足了大数据环境下轨迹最近邻查询的需求，极大地提高了轨迹大数据最近邻查询的处理效率，提供了最佳的性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于轨迹大数据最近邻查询的个性化推荐方法
本专利技术涉及计算机空间数据库领域中的索引和查询技术，特别是涉及一种基于轨迹大数据最近邻查询的个性化推荐方法。
技术介绍
随着带有GPS的设备爆炸式增长和广泛普及，时空轨迹数据(譬如人、车辆和动物等)正以极快的速度增长，并用于支撑基于位置的服务、城市计算、用户个性化推荐、动物行为研究等许多领域的应用和服务。在当前的大数据时代，针对轨迹大数据的查询算法也越来越受到关注。其中，基于轨迹大数据的最近邻查询是一个重要的查询方法，并具有重要的实际应用价值。针对轨迹大数据的最近邻查询是指从轨迹数据集中找出到一个指定查询对象距离最近的轨迹。基于轨迹大数据最近邻查询能够应用于基于位置的服务(如个性化推荐)。设计一种方法以高效地管理、预处理和分析这样大规模的轨迹数据，支持最近邻查询，可以促进轨迹大数据处理技术的发展和应用，并为各相关领域和应用的轨迹数据分析提供便利，促进个性化推荐服务的发展。然而，设计这样的方法面临着两个挑战。第一，轨迹数据的现有规模非常大且增长速度非常快，但目前最有效的轨迹处理算法大多是基于集中式而不易扩展的系统架构，由于数据量过大,单个机器处理的效率太低甚至无法使用。第二，近年来针对多维数据设计和构建的分布式框架也并不完全适用于大规模轨迹数据的处理任务。若不对这些系统进行修改，则无法集成针对轨迹数据的优化来高效地支持轨迹大数据环境下的最近邻查询算法。
技术实现思路
本专利技术很好地弥补了上述两个缺陷，提出了一种基于轨迹大数据最近邻查询的个性化推荐方法。本专利技术解决其技术问题采用的技术方案的步骤如下：一种基于轨迹...

【技术保护点】
一种基于轨迹大数据最近邻查询的个性化推荐方法，其特征在于：该方法包括如下步骤：步骤(1)：从原始的大数据中抽取有效的轨迹大数据。步骤(2)：对步骤(1)中抽取出来的轨迹大数据进行降噪处理。步骤(3)：将步骤(2)中已经降噪过的轨迹大数据转换成不同的形式，并利用HDFS进行存储。步骤(4)：对步骤(3)中已经存储的轨迹大数据建立全局的R树索引和局部的R树索引。步骤(5)：利用步骤(4)建立的索引结构对每个分区建立基于轨迹编号集合的索引和基于轨迹数目的索引。步骤(6)：用户提交个性化推荐查询，通过访问步骤(4)和步骤(5)建立的索引结构，进行轨迹大数据最近邻查询，并根据轨迹大数据最近邻查询的结果向用户进行个性化推荐。

【技术特征摘要】
1.一种基于轨迹大数据最近邻查询的个性化推荐方法，其特征在于：该方法包括如下步骤：步骤(1)：从原始的大数据中抽取有效的轨迹大数据。步骤(2)：对步骤(1)中抽取出来的轨迹大数据进行降噪处理。步骤(3)：将步骤(2)中已经降噪过的轨迹大数据转换成不同的形式，并利用HDFS进行存储。步骤(4)：对步骤(3)中已经存储的轨迹大数据建立全局的R树索引和局部的R树索引。步骤(5)：利用步骤(4)建立的索引结构对每个分区建立基于轨迹编号集合的索引和基于轨迹数目的索引。步骤(6)：用户提交个性化推荐查询，通过访问步骤(4)和步骤(5)建立的索引结构，进行轨迹大数据最近邻查询，并根据轨迹大数据最近邻查询的结果向用户进行个性化推荐。2.根据权利要求1所述的基于轨迹大数据最近邻查询的个性化推荐方法，其特征在于：所述步骤(1)具体为：从原始的数大据抽取时空大数据，而后将时空大数据按照时间进行组合，进而拼接成有效的轨迹大数据。3.根据权利要求1所述的基于轨迹大数据最近邻查询的个性化推荐方法，其特征在于：所述步骤(2)具体为：对步骤(1)中抽取出来的轨迹大数据进行离群点检测和异常点检测，并对...

【专利技术属性】
技术研发人员：高云君，丁欣，陈瑞，鲍虎军，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人