面向大数据处理的机器数级数据比较方法技术

技术编号:18591399 阅读:24 留言:0更新日期:2018-08-04 19:57
本发明专利技术属于机器数级数据比较方法技术领域,特别是涉及一种面向大数据处理的机器数级数据比较方法,对于定点数据,若要比较两个定点数据的大小关系,将定点数据分别视为有符号数和无符号数,设计两条相应的流水线,同时对寄存器中的数据逐位进行比较,根据从高位到低位的顺序判断各位的比较结果,进而确定定点数据比较结果;对于浮点数据,将其视为对应位数的有符号定点数据进行比较。该方法不解释查询字段所代表的含义,而是从机器数的角度,将所要查询的字段分成定点数据和浮点数据两类,在机器数级,直接对二进制数值进行比较,不需要分析查询字段的数据类型,避免了转换、解释等过程,大幅度提高系统的查询速度。

Large data processing oriented machine level data comparison method

The invention belongs to the technical field of machine number level data comparison. In particular, it involves a digital data comparison method for large data processing. For fixed data, if the size relation of two fixed-point data is compared, the fixed data are considered as signed numbers and unsigned numbers respectively, and two corresponding pipelining are designed. At the same time, the data in registers are compared by bit, and the comparison results are judged according to the order from high to low. Then the result of comparison of fixed point data is determined; and the floating point data is compared with the fixed point data of the corresponding digits. This method does not explain the meaning of the query field, but from the angle of the machine number, the fields are divided into two classes of fixed point data and floating point data. At the machine number level, the binary values are compared directly. It does not need to analyze the data type of the query field and avoids the process of conversion and interpretation. High system query speed.

【技术实现步骤摘要】
面向大数据处理的机器数级数据比较方法
本专利技术属于机器数级数据比较方法
,特别是涉及一种面向大数据处理的机器数级数据比较方法。
技术介绍
互联网、移动通信、社交网络、电子商务等技术的发展已将人类社会带入了以“ZB”为量级的大数据时代。大数据具有数据体量巨大(Volume)、数据类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)的4V特点,对数据信息的管理查询要求与难度越来越高。数据库系统是管理信息系统的核心,基于数据库的联机事务处理(OLTP)以及联机分析处理(OLAP)是针对网络协议解析与数据库检索等应用的核心操作。从大多数系统的使用实例来看,查询操作在各种数据库操作中所占据的比重较大,而查询操作所付出的时间代价往往又是最大,尤其是对于海量的数据而言,查询所需时间更是急剧上升。传统数据查询是根据检索条件逐条进行比较的,比如使用SQL语句对数据库中的许多信息进行查询操作,数据表在接受查询请求时,将逐条判断是否符合查询条件,如图1所示,如果符合查询条件就将该条记录提取出来,然后将所有的行为组织在一起,形成另外一个类似表的结构,构成查询结果。查询条件中包含数值、字符、逻辑、日期等多种数据类型,还需要对各数据类型的信息特征进行转换、连接、比较、归并等过程,严重影响查询速度。
技术实现思路
为了克服现有技术中存在的缺陷,本专利技术的目的是提供一种面向大数据处理的机器数级数据比较方法,该方法能够提高计算系统的查询速度、可靠性、灵活性,而且具有良好的硬件支持性。为了实现上述目的,本专利技术采用以下的技术方案:本专利技术提供一种面向大数据处理的机器数级数据比较方法,将数据划分为定点数据和浮点数据;对于定点数据,若要比较两个定点数据的大小关系,将定点数据分别视为有符号数和无符号数,设计两条相应的流水线,同时对寄存器中的数据逐位进行比较,根据从高位到低位的顺序判断各位的比较结果,进而确定定点数据比较结果,并将定点数据比较结果存入结果标志寄存器中;对于浮点数据,将其视为对应位数的有符号定点数据进行比较。进一步地,对于定点数据,若要比较两个定点数据的大小关系,假设查询判断模板为M,待查询的数据为N,判断条件包括M=N,M>N和M<N。进一步地,当判断条件为M=N时,对于有符号数和无符号数,从高位到低位,每次取一位数值,与查询判断模板M对应位的数值进行对比,若相等,则取下一位,全部对应位的数值均相等,则M=N;M=N的判断规则表示为:进一步地,当判断条件为M>N时,要分别求出有符号数和无符号数两种情况;对于有符号数,首先判断符号位S,若M的符号位为0,N的符号位为1,则判断M>N;若符号位相等,则取N字段的下一位数值,与M的下一位数值进行大小判断,若M1>N1,则判断M>N,若M1=N1,则再取下一位数值,判断M2和N2的大小关系,如果相等则再比较下一位;M>N的判断规则表示为:对于无符号数,根据从高位到低位的顺序判断各位的比较结果,进而确定无符号定点数据比较结果,M>N的判断规则表示为:进一步地,当判断条件为M<N时,与判断条件为M>N类似,要分别求出有符号数和无符号数两种情况;对于有符号数,M<N的判断规则表示为:对于无符号数,M<N的判断规则表示为:进一步地,对于浮点数据,寄存器中的数值大小为:n=S*F*RE;其中,S为符号,E为阶码,F为尾数,R为基数,若要比较两个浮点数据的大小关系,通过上式计算出浮点数据的数值,然后比较数值的大小,或者,根据符号S,阶码E,尾数F之间的关系进行比较,假设查询判断模板为M(S,E,F),待查询的数据为N(S',E',F'),判断条件包括M(S,E,F)=N(S',E',F'),M(S,E,F)>N(S',E',F')和M(S,E,F)<N(S',E',F')。进一步地,当判断条件为M(S,E,F)=N(S',E',F')时,分别比较S和S',E和E',F和F'是否相等,若不相等,则M(S,E,F)≠N(S',E',F'),否则,M(S,E,F)=N(S',E',F'),即M(S,E,F)=N(S',E',F')的判断规则表示为:进一步地,当判断条件为M(S,E,F)>N(S',E',F')时,先比较S和S',若S<S',则M(S,E,F)>N(S',E',F'),若S=S',比较E和E',若E>E',则M(S,E,F)>N(S',E',F'),若E=E',比较F和F',若F>F',则M(S,E,F)>N(S',E',F'),M(S,E,F)>N(S',E',F')的判断规则表示为:进一步地,当判断条件为M(S,E,F)<N(S',E',F')时,与判断条件为M(S,E,F)>N(S',E',F')类似,M(S,E,F)<N(S',E',F')的判断规则表示为:进一步地,所述浮点数据按照浮点数格式分为单精度浮点数和双精度浮点数,单精度浮点数共32位,双精度浮点数共64位,将32位单精度浮点数和64位双精度浮点数分别看作32位有符号定点数和64位有符号定点数进行比较。与现有技术相比,本专利技术具有以下优点:1、本专利技术提出的一种面向大数据处理的机器数级数据比较方法,对查询信息字段,不翻译解释,直接对其二进制形式的机器数进行比较,避免解释转换的过程,加快了查询速度。2、本专利技术将查询字段分为定点数据和浮点数据,而不去分析查询字段的具体数据类型(数值、字符、逻辑、日期等),直接对二进制值的机器数进行比较,提高了查询效率。3、本专利技术提出了有符号定点数和无符号定点数与模板进行比较时的判断逻辑,并且证明了,对于符合标准形式规格化的浮点数,与模板比较的判断逻辑与相等位数的有符号定点数相同,比较时可以直接调用有符号定点数的比较逻辑,使用方便。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是传统数据库查询实现方式示意图;图2是本专利技术定点数据存储格式示意图;图3是本专利技术浮点数据存储格式示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有实施例,都属于本专利技术保护的范围。事实上,无论查询字段代表何种含义,对于硬件设备而言都是机器数,也即二进制数据,至于字段是数值、字符、逻辑、日期还是别的数据类型,从机器数的角度看,要么是定点数据、要么是浮点数据,因此若从机器数级对字段进行比较,就可以避免上述转换、连接本文档来自技高网...

【技术保护点】
1.一种面向大数据处理的机器数级数据比较方法,其特征在于,将数据划分为定点数据和浮点数据;对于定点数据,若要比较两个定点数据的大小关系,将定点数据分别视为有符号数和无符号数,设计两条相应的流水线,同时对寄存器中的数据逐位进行比较,根据从高位到低位的顺序判断各位的比较结果,进而确定定点数据比较结果,并将定点数据比较结果存入结果标志寄存器中;对于浮点数据,将其视为对应位数的有符号定点数据进行比较。

【技术特征摘要】
1.一种面向大数据处理的机器数级数据比较方法,其特征在于,将数据划分为定点数据和浮点数据;对于定点数据,若要比较两个定点数据的大小关系,将定点数据分别视为有符号数和无符号数,设计两条相应的流水线,同时对寄存器中的数据逐位进行比较,根据从高位到低位的顺序判断各位的比较结果,进而确定定点数据比较结果,并将定点数据比较结果存入结果标志寄存器中;对于浮点数据,将其视为对应位数的有符号定点数据进行比较。2.根据权利要求1所述的面向大数据处理的机器数级数据比较方法,其特征在于,对于定点数据,若要比较两个定点数据的大小关系,假设查询判断模板为M,待查询的数据为N,判断条件包括M=N,M>N和M<N。3.根据权利要求2所述的面向大数据处理的机器数级数据比较方法,其特征在于,当判断条件为M=N时,对于有符号数和无符号数,从高位到低位,每次取一位数值,与查询判断模板M对应位的数值进行对比,若相等,则取下一位,全部对应位的数值均相等,则M=N;M=N的判断规则表示为:4.根据权利要求2所述的面向大数据处理的机器数级数据比较方法,其特征在于,当判断条件为M>N时,要分别求出有符号数和无符号数两种情况;对于有符号数,首先判断符号位S,若M的符号位为0,N的符号位为1,则判断M>N;若符号位相等,则取N字段的下一位数值,与M的下一位数值进行大小判断,若M1>N1,则判断M>N,若M1=N1,则再取下一位数值,判断M2和N2的大小关系,如果相等则再比较下一位;M>N的判断规则表示为:对于无符号数,根据从高位到低位的顺序判断各位的比较结果,进而确定无符号定点数据比较结果,M>N的判断规则表示为:5.根据权利要求4所述的面向大数据处理的机器数级数据比较方法,其特征在于,当判断条件为M<N时,与判断条件为M>N类似,要分别求出有符号数和无符号数两种情况;对于有符号数,M<N的判断规则表示为:对于无符号数,M<N的判断规则表示为:6.根据权利要求1所述的面向大数据处理的机器数级数据比较方法,其特征在于,对于浮点数据,寄存器中的数值...

【专利技术属性】
技术研发人员:唐永鹤蒋烈辉董卫宇何红旗苏童王瑞敏侯一凡朱晓东苗新亮
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1