一种基于位置的移动数据存储系统技术方案

技术编号：21224689 阅读：25 留言：0更新日期：2019-05-29 05:26

本申请涉及一种基于位置的移动数据存储系统及其优化方法，在预设的负载和存储预算的情况下，根据查询范围及存储系统中的原始数据，生成用于查询的多个候选副本，并使用查询成本评估模块对上述多个副本构成的副本集合进行评估，并从中选择出一个成本最低或接近最低的副本集合。用以实现对基于位置的移动数据大数据分布式存储系统的宽查询范围性能的优化，并在此基础上提出了贪婪算法及线性规划舍入算法进一步对存储系统的性能进行进一步的发掘。

A Location-based Mobile Data Storage System

This application involves a location-based mobile data storage system and its optimization method. In the case of preset load and storage budget, according to the query scope and the original data in the storage system, multiple candidate replicas for query are generated, and the replica set composed of the above multiple replicas is evaluated by the query cost evaluation module, from which one of the most costly replicas is selected. A low or near minimum set of copies. To optimize the performance of location-based large data distributed storage system with wide query range, greedy algorithm and linear programming rounding algorithm are proposed to further explore the performance of storage system.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于位置的移动数据存储系统
本专利技术涉及移动通信领域，具体涉及了一种基于位置的移动数据存储系统。
技术介绍
随着数据采集能力的发展，通过数以亿计的电子设备，例如手机、平板电脑、车载GPS导航及多种类型的传感器，采集人或物的巨量位置的移动数据变得更加简单。但是，存储这些位置的移动数据带来了两个挑战：1)怎么有效的处理大量的地理位置移动数据的查询；2)如何降低存储服务的成本。位置移动数据通常具有三个共同点:1.所有的数据都具有三个核心属性：目标ID、时间戳和位置信息；2.这些数据库的查询通常在通过特定的空间范围和时间范围信息进行查询；3.在处理空间-时间范围查询时，特别当查询到的结果特别多时即宽查询范围时，主流的大数据存储和管理系统不适合存储和处理这些位置移动数据。因为，这些系统不能根据时间和空间的临近性物理地聚类记录，这会导致主流系统触发非常多的低效率的随机读取。为了解决随机读取多的问题，TrajStore和PIST通过根据时间-空间代理来共同定位数据，并使用相对较大的分区，但TrajStore和PIST不是采用分布式构架的系统，都不能扩展为TB量级；CloST和SpatialHadoop是两个基于Hadoop的系统，旨在提供可扩展的分布式存储和并行查询处理的大型基于位置的移动数据系统；SATO是一个空间数据分区框架，可以快速分析和分区空间数据，并能够提供一个大小可变的查询处理的最有空间分区策略。BLOT系统，是一种系统级的抽象，表示那些用于存储基于位置的大型移动数据的专用存储系统。上述的TrajStore、PIST、CloSTridium、Spati...

【技术保护点】
1.一种基于位置的移动数据存储系统，其特征在于，所述存储系统包括：副本产生模块，查询成本评估模块，副本选择模块；所述副本产生模块，根据查询范围及存储系统中的原始数据，生成用于查询的多个候选副本；所述查询成本评估模块，在预设的负载、存储预算和输入查询范围情况下，对所述候选副本构成的所有副本集合的查询成本进行评估；所述副本选择模块，在预设的负载和存储预算的情况下，从所有的副本集合中选择出一个成本最低或接近最低的副本集合。

【技术特征摘要】
1.一种基于位置的移动数据存储系统，其特征在于，所述存储系统包括：副本产生模块，查询成本评估模块，副本选择模块；所述副本产生模块，根据查询范围及存储系统中的原始数据，生成用于查询的多个候选副本；所述查询成本评估模块，在预设的负载、存储预算和输入查询范围情况下，对所述候选副本构成的所有副本集合的查询成本进行评估；所述副本选择模块，在预设的负载和存储预算的情况下，从所有的副本集合中选择出一个成本最低或接近最低的副本集合。2.如权利要求1所述的存储系统，其特征在于：所述存储系统中的记录以下面的格式进行存储：(OID，TIME，LOC，A1，……，Am)；其中，OID为目标ID，TIME为时间戳，LOC是目标ID在某个时间点上所处的位置，A1……Am为根据数据库的应用场景变化的通用属性。3.如权利要求2所述的存储系统，其特征在于：所述存储系统采用分布式的大数据存储构架。4.如权利要求3所述的存储系统，其特征在于：所述副本的编码方案相同或不同。5.如权利要求3或4所述的存储系统，其特征在于：所述存储系统可以为：TrajStore、PIST、CloSTridium、SpatialHadoop或SATO中的任意一种。6.一种如权利要求1-5任一项所述的存储系统的优化方法，其特征在于：所述副本选择模块，通过以下步骤选择最优或接近最优的副本集合：1)设置一个空的副本集合R*；2)在存储预算被用完，或，向副本集合R*中添加单个副本但负载成本ρ(W,R*)不再降低之前，遍历所述副本产生模块...

【专利技术属性】
技术研发人员：廖清，丁烨，漆舒汉，蒋琳，王轩，
申请(专利权)人：哈尔滨工业大学深圳，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人