The invention belongs to the field of database technology, which involves a method, terminal and medium for predicate push in a SQL connection operation, including the following steps: the fact table and the dimension table are carried out Hash join, the Hash table is generated according to the dimension table, the fact table histogram is generated according to the fact table, and the Hash table and the events are based on the Hash table. The region of the N predicate histogram obtained by the real table histogram, the N is a positive integer; the N predicate histogram area is converted to a predicate and the predicate is pushed down to the data storage layer. Compared with the minimum value / maximum value and the complete Hash push phase, the invention can improve the data filtering ability according to the fact table histogram, thus improving the computing efficiency of the storage layer.
【技术实现步骤摘要】
一种SQL连接操作中谓词下推的方法、终端及介质
本专利技术属于数据库
,具体涉及一种SQL连接操作中谓词下推的方法、终端及介质。
技术介绍
数据库,更准确地说是RDBMS(关系型数据库管理系统)广泛地应用于各种应用程序,SQL是数据库中执行查询最常用的语言。数据库中包括多张表,包含相似值的特定列能存储在多张表中,表之间可以通过这特定列进行相互关联。例如,CustomerTable表存储了CustomerId列,还存储所有客户和其相关信息(例如,姓名、年龄、性别和生日等),同时,StoreSalesTable表也能存储CustomerId列,还存储了某一业务的销售信息。通过Join查询,您无需返回CustomerId,即可获取所有销售信息和客户姓名,从而实现高效查询。Join是SQL查询的关键因素,优化Join计算至关重要。目前存在几种Join方式,三目前最重要的Join算法是:MergeJoin、NestedJoin和HashJoin。数据库可以在多个软件层构建。例如,存储层从非易失性存储(例如,HDD)保存或获取数据。优化数据库的方式之一是尽可能在存储层过滤数据,而不是在更高层(例如,引擎层)过滤数据。例如,执行select*fromtableTwherea=10;语句,如果a不是表的键,则会开始全表扫描,每一行的值与10进行比较,如果相等,则保存该行的值,否则跳过。“a=10”被称为“谓词”,它可以在比存储层更高的层进行数据过滤,但如果谓词下推至存储层,数据能被更早过滤,执行相同操作的成本会更少,而且性能会提高。在Trafodion中,处理Has ...
【技术保护点】
1.一种SQL连接操作中谓词下推的方法,其特征在于,包括以下步骤:将事实表和维度表进行Hash join,根据所述维度表生成Hash表,根据所述事实表生成事实表直方图;根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域,所述N为正整数;将所述N个谓词直方图区域转换为谓词,并将所述谓词下推至数据存储层。
【技术特征摘要】
1.一种SQL连接操作中谓词下推的方法,其特征在于,包括以下步骤:将事实表和维度表进行Hashjoin,根据所述维度表生成Hash表,根据所述事实表生成事实表直方图;根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域,所述N为正整数;将所述N个谓词直方图区域转换为谓词,并将所述谓词下推至数据存储层。2.根据权利要求1所述的一种SQL连接操作中谓词下推的方法,其特征在于,所述Hash表中包括若干个键值。3.根据权利要求2所述的一种SQL连接操作中谓词下推的方法,其特征在于,所述根据所述Hash表和所述事实表直方图得到的N个谓词直方图区域具体为:对所述Hash表中的键值进行Hash排序,生成排序列表;根据所述...
【专利技术属性】
技术研发人员:埃里克·欧哈迪,刘明,
申请(专利权)人:贵州易鲸捷信息技术有限公司,
类型:发明
国别省市:贵州,52
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。