一种数据查询方法、装置及设备制造方法及图纸

技术编号:16755724 阅读:20 留言:0更新日期:2017-12-09 02:10
本说明书实施例公开了一种数据查询方法、装置及设备,通过采用本说明书中一个或多个实施例的方法,对于一个具体的业务内容,根据业务需求确定某种业务属性,根据业务属性将待查询数据和历史数据进行匹配。在匹配时,将历史数据进行分区匹配,每一次匹配都在待查询滤数据中除掉一部分数据。

A data query method, device and equipment

This manual embodiment discloses a data query method, device and equipment, by one or more examples in this manual, for a specific business content, certain business attributes according to business needs, according to the business attribute will be matching query data and historical data. In matching, the historical data is partitioned and each match is removed from the query filter data to remove a portion of the data.

【技术实现步骤摘要】
一种数据查询方法、装置及设备
本说明书涉及计算机
,尤其涉及一种数据查询方法、装置及设备。
技术介绍
目前,用户在对结构化数据进行数据查询时,通常使用的是遍历查询方法。现有技术中,在某些应用场景下,对于一个待查询数据表或者数据集合,可能需要分析该待查询数据表或者集合中的数据和已经存在的历史数据是否有某些相关性,采用的方法通常是:根据待查询数据的某个特征信息在历史数据对应的特征信息中进行逐条遍历查询,然后关联具有相同或相应特征信息的两个数据,以便进行某种数据分析。基于此,我们需要一种更有效率的数据查询方法。
技术实现思路
本说明书实施例提供一种数据查询方法、装置及设备,用以解决以下问题:以提供一种更有效率的数据查询方法。本说明书实施例提供的一种数据查询方法,包括:获取待查询数据,并确定所述待查询数据的特征信息;在已划分的多个分区历史数据中,择一选取分区历史数据;将所述待查询数据中,滤除与选取出的分区历史数据具有相同特征信息的数据,生成中间数据;根据所述中间数据和剩余的分区历史数据,生成查询结果。依照同样的思路,本说明书还提供一种数据查询装置,包括:获取模块,获取待查询数据,并确定所述待查询数据的特征信息;选取模块,在已划分的多个分区历史数据中,择一选取分区历史数据;滤除模块,将所述待查询数据中,滤除与选取出的分区历史数据具有相同特征信息的数据,生成中间数据;生成模块,根据所述中间数据和剩余的分区历史数据,生成查询结果。对应的,本说明书还提供一种数据查询设备,所述设备包括:存储器,存储待查询数据、已划分的多个分区历史数据和数据查询程序;处理器,调用存储器中的数据查询程序,并执行:获取待查询数据后,确定所述待查询数据的特征信息;在已划分的多个分区历史数据中,择一选取分区历史数据;将所述待查询数据中,滤除与选取出的分区历史数据具有相同特征信息的数据,生成中间数据;根据所述中间数据和剩余的分区历史数据,生成查询结果。对应的,本说明书实施例还提供了对应的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:获取待查询数据,确定所述待查询数据的特征信息;在已划分的多个分区历史数据中,择一选取分区历史数据;将所述待查询数据中,滤除与选取出的分区历史数据具有相同特征信息的数据,生成中间数据;根据所述中间数据和剩余的分区历史数据,生成查询结果。本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:对于一个具体的业务内容,根据业务需求确定某种特征业务属性,根据业务属性将待查询数据和历史数据进行匹配。在匹配时,将历史数据进行分区匹配,每一次匹配都在待查询数据中滤除掉一部分数据。本说明书中实施例根据历史数据的分区数据,首先进行分区历史数据查询,滤除掉待查询数据中的一部分数据,根据滤除后的待查询数据再进行下一步的查询工作,减少了待查询数据的数据量,从而降低了整体查询的计算量,提高了查询效率。此外,本说明书实施例还通过引入设定条件,根据设定条件进行分区历史数据选取,首先对比查询那些符合设定条件的指定分区历史数据,实现最快速的精简待查询数据,提高查询效率。附图说明图1为本说明书实施例提供的一种数据查询方法流程示意图;图2为本说明书实施例提供的部分方法示意图;图3为本说明书实施例提供的部分方法示意图;图4为本说明书实施例提供的部分方法示意图;图5为本说明书实施例提供的一种交易数据查询方法流程示意图;图6a至图6e为本说明书实施例提供的一种交易数据查询方法的直观示意图;图7为本说明书实施例提供的一种数据查询装置的结构示意图;图8为本说明书实施例提供的一种数据查询服务器的结构示意图。具体实施方式为使本说明书的目的、技术方案和优点更加清楚,下面将结合本本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。基于前述内容,这里需要说明的是,所述的历史数据,可包括:历史交易记录、历史登录记录,以及资源的引用、上传或者下载记录等等,当然,在实际的业务场景中还有不同形式的历史数据,这里不再一一列举。不同的历史数据对应着不同的业务内容。所述的待查询数据,通常来说是根据某种特征信息和历史数据有着关联关系的数据,它可以和历史数据具有相同的数据结构,也可以可历史数据具有不同的数据结构。所述的特征信息包括但不限于交易双方ID、用户ID、客户端ID、资源唯一标识等等,通过查询所确定的查询结果来确定这种关联关系。例如通过查询确定哪些特征信息出现在待查询数据中,而没有出现在历史数据中,用以统计新发生的交易记录、新用户注册情况、新客户端的登录情况、资源的最新上传记录等等。在本说明书实施例中,所述的数据查询方法可采用如图1所示的流程。下面将基于如图1所示的流程,详细说明本说明书实施例提供的数据查询过程,该过程具体包括以下步骤:步骤S101,获取待查询数据,并确定所述待查询数据的特征信息。也就是说在获取了待查询数据之后,首先根据查询的目的来确定所述的特征信息。容易理解,历史数据也同时包含该特征信息,从而能够根据该特征信息得出待查询数据和历史数据中的关联关系。当待查询数据和历史数据均为结构化数据时,所述的特征信息通常是某列或者多列的属性值。例如为了统计一个当天交易记录中,哪些卖家和买家之间是第一次发生交易,则以包含交易双方ID作为特征信息,向包含该数组的历史数据(也就是历史交易记录)中去查询。需要说明的是,待查询数据和历史数据结构相同,但是在实际应用中,也可以结构不同。例如为了查询方便,将待查询数据去掉一些冗余数据,直接把待查询数据中包含特征信息的列抽取出来,形成一组新的待查询数据,此时它们之间的数据结构就并不相同。待查询数据和历史数据还可以不是结构化数据,例如例如需要查询服务器所接收到的当天上传的图片或者影视中有哪些是以前所没有的,由于接收到的资源名称可能是上传的时候用户随意取的,此时则可以根据图片或者影视资源根据某些算法所生成的哈希值来进行对比,所述的哈希值唯一的对应一个资源。步骤S103,在已划分的多个分区历史数据中,择一选取分区历史数据。需要说明的是,对历史数据的获取和分区可以是预先完成的,多个分区历史数据的总和即为历史数据。且各分区历史数据没有交集。所述的多个分区历史数据根据历史数据划分而来。即在获得历史数据(例如历史交易记录)的之后,根据特征信息的分布属性(例如根据交易发生的时间或者地区或者交易金额等等)对其进行划分,生成多个分区历史数据,自然的,每个分区历史数据也包含所述的分布属性,具体划分方法根据业务情况而定。通常来说,各区的数据量差异不大。在获得了多个分区历史数据后,从中挑选出一个分区历史数据出来,用以和待查询数据对比。步骤S105,在所述待查询数据中,滤除与选取出的分区历史数据具有相同特征信息的数据,生成中间数据。在确定了第一个分区历史数据后,即根据特征信息进行遍历对比。获取在所述的分区历史数据和待查询数据中同时出现的特征信息,根据所述同时出现的特征信息,在待查询数据中滤除其所对应的记录,滤除后的待查询数据即为中本文档来自技高网...
一种数据查询方法、装置及设备

【技术保护点】
一种数据查询方法,包括:获取待查询数据,并确定所述待查询数据的特征信息;在已划分的多个分区历史数据中,择一选取分区历史数据;在所述待查询数据中,滤除与选取出的分区历史数据具有相同特征信息的数据,生成中间数据;根据所述中间数据和剩余的分区历史数据,生成查询结果。

【技术特征摘要】
1.一种数据查询方法,包括:获取待查询数据,并确定所述待查询数据的特征信息;在已划分的多个分区历史数据中,择一选取分区历史数据;在所述待查询数据中,滤除与选取出的分区历史数据具有相同特征信息的数据,生成中间数据;根据所述中间数据和剩余的分区历史数据,生成查询结果。2.如权利要求1所述的数据查询方法,通过以下方法,划分多个分区历史数据:获取历史数据;根据特征信息的分布属性,划分所述历史数据,生成多个分区历史数据。3.如权利要求1所述的数据查询方法,择一选取分区历史数据,具体包括:随机选取一个分区历史数据,或,择一选取符合设定条件的分区历史数据。4.如权利要求1所述的数据查询方法,根据所述中间数据和剩余的分区历史数据,生成查询结果,具体包括:遍历剩余的分区历史数据,在所述中间数据中,滤除与所述剩余的分区历史数据具有相同特征信息的数据;将遍历结束时所得的数据确定为查询结果。5.如权利要求1所述的数据查询方法,根据所述中间数据和剩余的分区历史数据,生成查询结果,具体包括:在剩余的分区历史数据中,择一选取分区历史数据;在所述中间数据中,滤除与所述选取出的分区历史数据具有相同特征信息的数据,以进行迭代处理;直到遍历所述剩余的分区历史数据,将遍历结束时所得的数据确定为查询结果。6.一种数据查询装置,包括:获取模块,获取待查询数据,并确定所述待查询数据的特征信息;选取模块,在已划分的多个分区历史数据中,择一选取分区历史数据;滤除模块,...

【专利技术属性】
技术研发人员:陈志远
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1