数据存储方法、查询方法及设备技术

技术编号:13084245 阅读:73 留言:0更新日期:2016-03-30 15:51
本发明专利技术提供一种数据存储方法、查询方法及设备。存储方法包括:接收待存储的数据记录;在数据记录包括时间戳、在时间戳所标识的时间点产生的数值以及可以标识数值的第一标识值组合时,根据用户的查询需求对数据记录进行预处理,获得满足查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合,将表征第二标识值组合的存储标识、目标时间和目标数值对应存储到第二信息表中,并将第一标识值组合存储到第一信息表中。本发明专利技术可以降低创建和维护次级索引的工作量,有利于提高数据存储和查询速度,提高存储系统的性能。

【技术实现步骤摘要】

本专利技术涉及网络
,尤其涉及一种数据存储方法、查询方法及设备
技术介绍
随着非关系型数据库(NOSQL)在业界的推广,传统的关系型数据库(RelationalDatabaseManagementSystem,RDBMS)受到很大挑战。虽然NOSQL支持键值对(key-value)存储方式,但在很多场景下依然会像RDBMS那样定义表(table),为表设计多个列(column),为除主键以外的其他列创建次级索引;之后SQL会像使用RDBMS那样使用该NOSQL产品。当表中数据行较多时,为表中的多个列创建并维护次级索引会严重影响存储系统的性能,导致存储和查询速度较低。
技术实现思路
本专利技术的多个方面提供一种数据存储方法、查询方法及设备,用以提高数据存储和查询速度,提高存储系统的性能。本专利技术的一方面,提供一种数据存储方法,包括:接收待存储的数据记录;在所述数据记录包括时间戳、在所述时间戳所标识的时间点产生的数值以及可以标识所述数值的第一标识值组合时,根据用户的查询需求对所述数据记录进行预处理,获得满足所述查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合,将表征所述第二标识值组合的存储标识、所述目标时间和所述目标数值对应存储到第二信息表中,并将所述第一标识值组合存储到第一信息表中;其中,与时间无关的多维标识字段的一种取值构成所述第一标识值组合。本专利技术的另一方面,提供一种数据存储设备,包括:接收模块,用于接收待存储的数据记录;第一存储模块,用于在所述数据记录包括时间戳、在所述时间戳所标识的时间点产生的数值和可以标识所述数值的第一标识值组合时,根据用户的查询需求对所述数据记录进行预处理,获得满足所述查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合,将表征所述第二标识值组合的存储标识、所述目标时间和所述目标数值存储到第二信息表中,并将所述第一标识值组合存储到第一信息表中;其中,与时间无关的多维标识字段的一种取值构成所述第一标识值组合。本专利技术的又一方面,提供一种数据查询方法,包括:接收查询请求;在所述查询请求包括作为查询条件的过滤条件但不包括目标时间时,根据所述过滤条件在第一信息表存储的多个第一标识值组合中进行查询,获取满足所述过滤条件的第一标识值组合;其中,与时间无关的多维标识字段的一种取值构成一个第一标识值组合,所述过滤条件包括部分标识字段的取值;在所述查询请求包括作为查询条件的第二标识值组合和目标时间时,根据表征所述第二标识值组合的存储标识和所述目标时间在第二信息表中进行查询,获取对应于所述目标时间和所述存储标识的目标数值。本专利技术的又一方面,提供一种数据查询设备,包括:接收模块,用于接收查询请求;第一查询模块,用于在所述查询请求包括作为查询条件的过滤条件但不包括目标时间时,根据所述过滤条件在第一信息表存储的多个第一标识值组合中进行查询,获取满足所述过滤条件的第一标识值组合;其中,与时间无关的多维标识字段的一种取值构成一个第一标识值组合,所述过滤条件包含部分标识字段的取值;第二查询模块,用于在所述查询请求包括作为查询条件的第二标识值组合和目标时间时,根据表征所述第二标识值组合的存储标识和所述目标时间在第二信息表中进行查询,获取对应于所述目标时间和所述存储标识的目标数值。在本专利技术技术方案中,通过对待存储数据记录中的内容进行分类,将与时间无关的内容,例如多维标识字段的取值存储到第一信息表中,这样第一信息表中存储的是与时间无关的内容,数据量相对较少,创建和维护次级索引的工作量大大降低了;对于与时间有关的内容,根据用户的查询需求对数据记录进行预处理直接获得满足用户的查询需求的信息,即目标数值、目标时间和表征查询条件的存储标识,通过预处理一定程度上可以减少第二信息表中的数据量,另外通过存储目标数值、目标时间和存储标识使得第二信息表不需要建立次级索引。与现有技术相比,本专利技术技术方案创建和维护次级索引的工作量极大的降低了,并且存储的数据量也有所降低,因此可以提高数据存储速度,提高存储系统的性能;相应的,在进行数据查询时,直接查询第二信息表时不再依赖次级索引,有利于提高查询速度,即使需要查询第一信息表,但由于第一信息表所维护的次级索引较少,所以与现有技术相比查询速度也有所提高。【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1a为本专利技术一实施例提供的数据存储方法的流程示意图;图1b为本专利技术另一实施例提供的数据存储方法的流程示意图;图2为本专利技术一实施例提供的数据查询方法的流程示意图;图3a为本专利技术一实施例提供的数据存储设备的结构示意图;图3b为本专利技术另一实施例提供的数据存储设备的结构示意图;图4为本专利技术一实施例提供的数据查询设备的结构示意图。【具体实施方式】为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在对本专利技术技术方案进行说明之前,结合具体的应用场景说明一下现有存储方案存在的缺陷。表1表1是在数据分析领域常见的一种应用场景,表1中的内容是对第三方支付公司交易系统的各种各样行为的记录。在表1中,接口、方法就是面向服务的体系结构(Service-OrientedArchitecture,SOA)领域中常用的服务标识,接口代表某种服务,方法代表这种服务下的一种具体行为,create和pay分别代表此服务下的订单创建业务和订单支付业务;来源表示此笔业务的调用方是来自Taobao(淘宝网站)还是Tmall(天猫网站),结果顾名思义Y/N分别代表了此笔业务的最终结果是成功还是失败;金额是一个数值,表示此笔交易的金额。根据应用需求可以基于表1进行各种信息的查询。例如,可以查询2013-11-1100:00这个时刻下,各种[接口,方法,来源,结果]组合下的金额分...

【技术保护点】
一种数据存储方法,其特征在于,包括:接收待存储的数据记录;在所述数据记录包括时间戳、在所述时间戳所标识的时间点产生的数值以及可以标识所述数值的第一标识值组合时,根据用户的查询需求对所述数据记录进行预处理,获得满足所述查询需求的目标数值和目标时间以及作为查询条件的第二标识值组合,将表征所述第二标识值组合的存储标识、所述目标时间和所述目标数值对应存储到第二信息表中,并将所述第一标识值组合存储到第一信息表中;其中,与时间无关的多维标识字段的一种取值构成所述第一标识值组合。

【技术特征摘要】
1.一种数据存储方法,其特征在于,包括:
接收待存储的数据记录;
在所述数据记录包括时间戳、在所述时间戳所标识的时间点产生的数值以
及可以标识所述数值的第一标识值组合时,根据用户的查询需求对所述数据记
录进行预处理,获得满足所述查询需求的目标数值和目标时间以及作为查询条
件的第二标识值组合,将表征所述第二标识值组合的存储标识、所述目标时间
和所述目标数值对应存储到第二信息表中,并将所述第一标识值组合存储到第
一信息表中;
其中,与时间无关的多维标识字段的一种取值构成所述第一标识值组合。
2.根据权利要求1所述的方法,其特征在于,还包括:
在所述数据记录不包括时间戳和在所述时间戳所标识的时间点产生的数
值,但包括可以标识所述数值的第一标识值组合时,将所述第一标识值组合存
储到第一信息表中。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述第一标识值
组合存储到第一信息表中,包括:
向所述第一信息表所在的第一设备发送第一写请求,以使所述第一设备在
确定所述第一信息表中不存在所述第一标识值组合时将所述第一标识值组合写
入所述第一信息表中,所述第一写请求包括所述第一标识值组合。
4.根据权利要求1或2所述的方法,其特征在于,所述将表征所述第二标
识值组合的存储标识、所述目标时间和所述目标数值对应存储到第二信息表中,
包括:
向所述第二信息表所在的第二设备发送第二写入请求,以使所述第二设备
确定表征所述第二标识值组合的存储标识并将所述存储标识、所述目标时间和
所述目标数值对应写入所述第二信息表中,所述第二写请求包括所述第二标识
值组合、所述目标时间和所述目标数值。
5.一种数据存储设备,其特征在于,包括:
接收模块,用于接收待存储的数据记录;
第一存储模块,用于在所述数据记录包括时间戳、在所述时间戳所标识的
时间点产生的数值和可以标识所述数值的第一标识值组合时,根据用户的查询
需求对所述数据记录进行预处理,获得满足所述查询需求的目标数值和目标时
间以及作为查询条件的第二标识值组合,将表征所述第二标识值组合的存储标
识、所述目标时间和所述目标数值存储到第二信息表中,并将所述第一标识值
组合存储到第一信息表中;
其中,与时间无关的多维标识字段的一种取值构成所述第一标识值组合。
6.根据权利要求5所述的设备,其特征在于,还包括:
第二存储模块,用于在所述数据记录不包括时间戳和在所述时间戳所标识
的时间点产生的数值,但包括可以标识所述数值的第一标识值组合时,将所述
第一标识值组合存储到第一信息表中。

【专利技术属性】
技术研发人员:储晓颖
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1