The invention belongs to the technical field of machine number level data comparison. In particular, it involves a digital data comparison method for large data processing. For fixed data, if the size relation of two fixed-point data is compared, the fixed data are considered as signed numbers and unsigned numbers respectively, and two corresponding pipelining are designed. At the same time, the data in registers are compared by bit, and the comparison results are judged according to the order from high to low. Then the result of comparison of fixed point data is determined; and the floating point data is compared with the fixed point data of the corresponding digits. This method does not explain the meaning of the query field, but from the angle of the machine number, the fields are divided into two classes of fixed point data and floating point data. At the machine number level, the binary values are compared directly. It does not need to analyze the data type of the query field and avoids the process of conversion and interpretation. High system query speed.
【技术实现步骤摘要】
面向大数据处理的机器数级数据比较方法
本专利技术属于机器数级数据比较方法
,特别是涉及一种面向大数据处理的机器数级数据比较方法。
技术介绍
互联网、移动通信、社交网络、电子商务等技术的发展已将人类社会带入了以“ZB”为量级的大数据时代。大数据具有数据体量巨大(Volume)、数据类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)的4V特点,对数据信息的管理查询要求与难度越来越高。数据库系统是管理信息系统的核心,基于数据库的联机事务处理(OLTP)以及联机分析处理(OLAP)是针对网络协议解析与数据库检索等应用的核心操作。从大多数系统的使用实例来看,查询操作在各种数据库操作中所占据的比重较大,而查询操作所付出的时间代价往往又是最大,尤其是对于海量的数据而言,查询所需时间更是急剧上升。传统数据查询是根据检索条件逐条进行比较的,比如使用SQL语句对数据库中的许多信息进行查询操作,数据表在接受查询请求时,将逐条判断是否符合查询条件,如图1所示,如果符合查询条件就将该条记录提取出来,然后将所有的行为组织在一起,形成另外一个类似表的结构,构成查询结果。查询条件中包含数值、字符、逻辑、日期等多种数据类型,还需要对各数据类型的信息特征进行转换、连接、比较、归并等过程,严重影响查询速度。
技术实现思路
为了克服现有技术中存在的缺陷,本专利技术的目的是提供一种面向大数据处理的机器数级数据比较方法,该方法能够提高计算系统的查询速度、可靠性、灵活性,而且具有良好的硬件支持性。为了实现上述目的,本专利技术采用以下的技术方案:本专利技术提供一种面向 ...
【技术保护点】
1.一种面向大数据处理的机器数级数据比较方法,其特征在于,将数据划分为定点数据和浮点数据;对于定点数据,若要比较两个定点数据的大小关系,将定点数据分别视为有符号数和无符号数,设计两条相应的流水线,同时对寄存器中的数据逐位进行比较,根据从高位到低位的顺序判断各位的比较结果,进而确定定点数据比较结果,并将定点数据比较结果存入结果标志寄存器中;对于浮点数据,将其视为对应位数的有符号定点数据进行比较。
【技术特征摘要】
1.一种面向大数据处理的机器数级数据比较方法,其特征在于,将数据划分为定点数据和浮点数据;对于定点数据,若要比较两个定点数据的大小关系,将定点数据分别视为有符号数和无符号数,设计两条相应的流水线,同时对寄存器中的数据逐位进行比较,根据从高位到低位的顺序判断各位的比较结果,进而确定定点数据比较结果,并将定点数据比较结果存入结果标志寄存器中;对于浮点数据,将其视为对应位数的有符号定点数据进行比较。2.根据权利要求1所述的面向大数据处理的机器数级数据比较方法,其特征在于,对于定点数据,若要比较两个定点数据的大小关系,假设查询判断模板为M,待查询的数据为N,判断条件包括M=N,M>N和M<N。3.根据权利要求2所述的面向大数据处理的机器数级数据比较方法,其特征在于,当判断条件为M=N时,对于有符号数和无符号数,从高位到低位,每次取一位数值,与查询判断模板M对应位的数值进行对比,若相等,则取下一位,全部对应位的数值均相等,则M=N;M=N的判断规则表示为:4.根据权利要求2所述的面向大数据处理的机器数级数据比较方法,其特征在于,当判断条件为M>N时,要分别求出有符号数和无符号数两种情况;对于有符号数,首先判断符号位S,若M的符号位为0,N的符号位为1,则判断M>N;若符号位相等,则取N字段的下一位数值,与M的下一位数值进行大小判断,若M1>N1,则判断M>N,若M1=N1,则再取下一位数值,判断M2和N2的大小关系,如果相等则再比较下一位;M>N的判断规则表示为:对于无符号数,根据从高位到低位的顺序判断各位的比较结果,进而确定无符号定点数据比较结果,M>N的判断规则表示为:5.根据权利要求4所述的面向大数据处理的机器数级数据比较方法,其特征在于,当判断条件为M<N时,与判断条件为M>N类似,要分别求出有符号数和无符号数两种情况;对于有符号数,M<N的判断规则表示为:对于无符号数,M<N的判断规则表示为:6.根据权利要求1所述的面向大数据处理的机器数级数据比较方法,其特征在于,对于浮点数据,寄存器中的数值...
【专利技术属性】
技术研发人员:唐永鹤,蒋烈辉,董卫宇,何红旗,苏童,王瑞敏,侯一凡,朱晓东,苗新亮,
申请(专利权)人:中国人民解放军战略支援部队信息工程大学,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。