一种数据处理方法和数据库服务器技术

技术编号:16301339 阅读:53 留言:0更新日期:2017-09-26 19:26
本申请涉及数据处理技术领域,尤其涉及关系型数据库中的关系操作。在一种数据处理方法中,在确定第一数据集合中待处理的第一元组后,检测第一数据集合的检测记录中与该第一元组具有相同目标属性的元组,该检测记录包括从第一数据集合中检测出的与第二数据集合不满足连接条件的元组的元组信息,目标属性为第一数据集合表中属于该连接条件设定的需要进行匹配的属性;当检测记录中不存在该第一元组具有相同目标属性的元组的元组信息时,将该第一元组与该第二数据集合进行匹配。通过本申请所提供的方案,可以减少循环进行匹配的次数,减少了数据处理量,有利于提高了数据库系统性能。

Data processing method and database server

The utility model relates to the technical field of data processing, in particular to the relational operations in relational databases. In a data processing method, the first tuple to determine the first data set to be processed after the detection records of the first data set and the first tuples with the same attribute tuples, the inspection records from the first data set including the detected data set and second tuple information does not meet the connection conditions of tuples the target attribute for the first data set in the table belongs to the connection conditions of setting need to match the attributes; tuple information when there is no record of the first detection of tuples with the same attribute of the tuple, the first tuple and the second data set matching. Through the scheme provided by this application, the number of matching cycles can be reduced, the amount of data processing is reduced, and the performance of the database system is improved.

【技术实现步骤摘要】
一种数据处理方法和数据库服务器
本申请涉及数据处理
,更具体的说是涉及关系数据库中的关系操作。
技术介绍
关系数据库是采用关系模型作为数据组织形式的数据库。在关系模型中,实体以及实体之间的联系都是用关系来表示的,在用户看来,一个关系模型的逻辑结构就是一张二维表。在关系模型中的关系操作可以包括:选择、投影和连接等查询操作。其中,匹配是从两个关系的笛卡尔积中选取属性间满足一定条件的元组。在进行匹配时,需要依次对两个关系中的各个元组之间进行匹配检测,即依次检测两个关系中的各个元组之间是否满足连接条件,并从两个关系中提取出与连接条件匹配的元组集合。然而由于每个关系中元组的数量一般都较大,这样,在匹配过程中进行匹配检测的数据处理量也会非常大,从而影响到数据库系统性能。
技术实现思路
本申请提供了一种数据处理方法和数据库服务器,以减少匹配中的数据处理量,提高数据库系统的性能。第一方面,本申请实施例提供一种数据处理方法,该方法应用于数据库系统,该数据库系统包含第一数据集合和第二数据集合,该第一数据集合包括至少一个元组,该第二数据集合包括至少一个元组,该方法中从第一数据集合中获取待处理的第一元组;在第一数据集合的检测记录中,检测与第一元组具有相同目标属性的元组的元组信息(如整条元组或者元组的目标属性的信息),该检测记录包含所述第一数据集合中与所述第二数据集合不满足连接条件的元组的元组信息,该目标属性包括该连接条件所设定的需要进行匹配的属性;当该检测记录中不存在与该第一元组具有相同属性的元组的元组信息时,依据该连接条件将第一元组与所述第二数据集合进行匹配。由于在检测记录中存在与第一元组具有相同目标属性的元组的信息的情况下,可以确定第二数据集合中不存在与第一元组满足连接条件的元组,从而仅仅在检测记录中不存在与该第一元组具有相同目标属性的元组的信息,再将该第一元组与该第二数据集合进行匹配检测,可以减少循环进行匹配的次数,减少了数据处理量,有利于提高了数据库系统性能。在一个可能的设计中,与第一元组具有相同目标属性的元组可以为:与该第一元组相同的元组。在一个可能的设计中,在依据连接条件将第一元组与第二数据集合进行匹配之后,如果第一元组与第二数据集合中的任意一个元组均不满足连接条件,将该第一元组的元组信息存储到检测记录中。在一个可能的设计中,当该检测记录中存在与第一元组具有相同目标属性的元组的元组信息时,结束该第一元组与第二数据集合的匹配,从而无需将该第一元组与该第二数据集合进行匹配,减少了与第二数据集合进行匹配的次数。在一个可能的设计中,在从所述第一数据集合中获取待处理的第一元组之前,还可以将第一数据集合中的元组划分为至少一个元组集合,任一元组集合包括至少一个元组,其中任一元组集合中的全部元组的目标属性相同;相应的,获取第一元组可以是:从所述至少一个元组集合中获取待处理的第一元组集合,然后,从该第一元组集合中获取第一元组。这样,在依据连接条件将第一元组与第二数据集合进行匹配之后,如果该第一元组与第二数据集合中的任意一个元组均不满足连接条件时,结束该第一元组集合中所有元组与第二数据集合的匹配,有利于进一步减少处理量。进一步,当该检测记录中存在与该第一元组具有相同属性的元组的元组信息时,结束该第一元组集合中所有元组与第二数据集合的匹配,从而可以减少从检测该检测记录的次数,也可以减少匹配次数,进而大大减少了数据处理量。第二方面,本专利技术实施例提供了一种数据库服务器,该数据库服务器具有实现上述方法实际中数据库服务器行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,数据库服务器的结构中包括处理器和存储器,处理器被配置为执行上述方法中相应的功能。该存储器被配置为存储上述方法所涉及的第一数据集合和第二数据集合该存储器还用于与处理器耦合,其保存数据库服务器必要的程序指令和数据。第三方面,本专利技术实施例提供了一种数据库服务系统,该数据库服务器系统包含第一数据集合和第二数据集合,该第一数据集合包括至少一个元组,该第二数据集合包括至少一个元组,该系统包括,包括:获取单元,用于从该第一数据集合中获取待处理的第一元组;检测单元,用于在第一数据集合的检测记录中,检测与第一元组具有相同目标属性的元组的元组信息,检测记录包含第一数据集合中与第二数据集合不满足连接条件的元组的元组信息,目标属性包括连接条件所设定的需要进行匹配的属性;匹配单元,用于当检测记录中不存在与该第一元组具有相同属性的元组的元组信息时,依据连接条件将该第一元组与第二数据集合进行匹配。第四方面,本专利技术实施例提供了一种计算机存储介质,用于储存为第二方面所描述的数据处理的数据库服务器所用的计算机软件指令,其包含用于执行第一方面的数据处理方法所设计的程序。本专利技术实施例的第二、三、四等方面和第一方面的设计思路一致,技术手段类似,技术方案带来的具体有益效果请参考第一方面,不再赘述。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请的一种可能的应用场景示意图;图2为本申请实施例提供的一种数据处理方法一个实施例的流程示意图;图3示出了本申请实施例中对属于不同元组序列内的元组进行排序的示意图;图4示出了本申请提供的一种数据处理方法又一个实施例的流程示意图;图5示出了本申请提供的一种数据库服务器一种可能的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例的技术方案可应用于数据库系统,从最终用户角度来看,数据库系统可以分为单用户数据库系统、分布式数据库系统等等。为了便于理解,以分布式数据库系统为例对本申请实施例的应用场景进行介绍。分布式数据库系统是指数据库中的数据在逻辑上是一个整体,但物理地分布在计算机网络的不同节点上,如图1所示,分布式数据库系统100可以包括多个数据节点101,这多个数据节点之间可以通过网络相连,网络可以是互联网、因特网协议存储区域网络(IPSAN,InternetProtocolStorageAreaNetwork)以及私有网络等等。网络中的每个数据节点可以认为是一台数据库服务器,数据节点可以独立处理本地数据库中的数据,执行局部应用;也可以同时存储和处理多个异地数据库中的数据,执行全局应用。数据节点101可以包括:处理器、硬盘、内存、系统总线、IO设备、通信模块以及电源模块等等。可选的,在分布式数据库系统中还可以包括客户端102,客户端的用户请求(如,数据读取请求、数据编辑请求等)被传送到数据库服务器,数据库服务器进行处理后,只将结果(而不是全部数据)返回给用户,从而减少网络上的数据传输量。特别的,在本申请实施例中所述的数据库系统本文档来自技高网...
一种数据处理方法和数据库服务器

【技术保护点】
一种数据处理方法,应用于数据库系统,所述数据库系统包含第一数据集合和第二数据集合,所述第一数据集合包括至少一个元组,所述第二数据集合包括至少一个元组,所述方法,包括:从所述第一数据集合中获取待处理的第一元组;在所述第一数据集合的检测记录中,检测与所述第一元组具有相同目标属性的元组的元组信息,所述检测记录包含所述第一数据集合中与所述第二数据集合不满足连接条件的元组的元组信息,所述目标属性包括所述连接条件所设定的需要进行匹配的属性;当所述检测记录中不存在与所述第一元组具有相同属性的元组的元组信息时,依据所述连接条件将所述第一元组与所述第二数据集合进行所述匹配。

【技术特征摘要】
1.一种数据处理方法,应用于数据库系统,所述数据库系统包含第一数据集合和第二数据集合,所述第一数据集合包括至少一个元组,所述第二数据集合包括至少一个元组,所述方法,包括:从所述第一数据集合中获取待处理的第一元组;在所述第一数据集合的检测记录中,检测与所述第一元组具有相同目标属性的元组的元组信息,所述检测记录包含所述第一数据集合中与所述第二数据集合不满足连接条件的元组的元组信息,所述目标属性包括所述连接条件所设定的需要进行匹配的属性;当所述检测记录中不存在与所述第一元组具有相同属性的元组的元组信息时,依据所述连接条件将所述第一元组与所述第二数据集合进行所述匹配。2.根据权利要求1所述的方法,其特征在于,在所述第一数据集合的检测记录中,检测与所述第一元组具有相同目标属性的元组的元组信息,包括:在所述第一数据集合的检测记录中,检测与所述第一元组相同的元组的元组信息。3.根据权利要求1或2所述的方法,其特征在于,在所述依据所述连接条件将所述第一元组与所述第二数据集合进行所述匹配之后,还包括:当所述第一元组与所述第二数据集合中的任意一个元组均不满足所述连接条件时,将所述第一元组的元组信息存储到所述检测记录中。4.根据权利要求1至3任一项所述的方法,其特征在于,还包括:当所述检测记录中存在与所述第一元组具有相同目标属性的元组的元组信息时,结束所述第一元组与第二数据集合的所述匹配。5.根据权利要求1至4任一项所述的方法,其特征在于,在所述从所述第一数据集合中获取待处理的第一元组之前,还包括:将所述第一数据集合中的元组划分为至少一个元组集合,任一元组集合包括至少一个元组,所述任一元组集合中的全部元组的所述目标属性相同;则,所述从所述第一数据集合中获取待处理的第一元组,包括:从所述至少一个元组集合中获取待处理的第一元组集合;从所述第一元组集合中获取第一元组;则,在所述依据所述连接条件将所述第一元组与所述第二数据集合进行匹配之后,还包括:当所述第一元组与所述第二数据集合中的任意一个元组均不满足所述连接条件时,结束所述第一元组集合中所有元组与所述第二数据集合的所述匹配。6.根据权利要求5所述的方法,其特征在于,还包括:当所述检测记录中存在与所述第一元组具有相同属性的元组的元组信息时,结束所述第一元组集合中所有元组与所述第二数据集合的所述匹配。7.一种数据库服务器,其特征在于,包括:存储器,用于存储第一数据集合和第二数据集合,所述第一数据...

【专利技术属性】
技术研发人员:孟聪
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1