【技术实现步骤摘要】
数据查询方法及装置
[0001]本申请主要涉及数据库
,具体涉及一种数据查询方法及装置。
技术介绍
[0002]随着信息化的不断深入发展,数据生成速度正在提高,需要处理的数据量急速膨胀,大数据时代即将到来。所谓大数据指所涉及的数据量规模巨大,以至于无法通过主流软件在合理的时间内进行处理的数据。在面对海量数据时,传统关系数据库虽然具有支持完整性约束、支持事务等优点,但是在大规模海量数据面前显得力不从心。大数据查询技术是大数据管理的核心技术之一,伴随着云计算技术以及NoSQL数据库技术的发展,针对大数据查询已经产生了许多新型的查询技术。目前,关于大数据的查询技术都是完整查询,即无论如何定义查询条件匹配算法,无论如何对查询结果集排序,查询都将确定地返回所有匹配数据,查询所需的时间代价较大。并且现有技术要么在联邦查询引擎进行联邦查询,要么通过数据库直接查询,没有根据查询请求的特点选择合适的查询执行方式,造成数据查询效率较低。
[0003]也即,现有技术中数据查询效率较低。
技术实现思路
[0004]本申 ...
【技术保护点】
【技术特征摘要】
1.一种数据查询方法,其特征在于,应用于数据查询系统,所述数据查询系统包括联邦查询引擎和多个数据源,所述数据查询方法包括:获取查询请求;将所述查询请求拆分为多个查询片段,其中,一个查询片段对应一个数据源;分别计算所述查询片段在联邦查询引擎执行的联邦执行开销和在多个数据源执行的数据源执行开销;基于所述查询片段的联邦执行开销和数据源执行开销将各个所述查询片段发送至联邦查询引擎或者多个数据源执行,得到联邦查询引擎执行得到的联邦查询结果或多个数据源执行得到的数据源查询结果;将所述联邦查询结果和所述数据源查询结果发送至联邦查询引擎进行关联操作,得到目标查询结果。2.根据权利要求1所述的数据查询方法,其特征在于,所述基于所述查询片段的联邦执行开销和数据源执行开销将各个所述查询片段发送至联邦查询引擎或者多个数据源执行,得到联邦查询引擎执行得到的联邦查询结果或多个数据源执行得到的数据源查询结果,包括:判断所述查询片段的联邦执行开销是否大于数据源执行开销;若所述查询片段的联邦执行开销大于数据源执行开销,则将所述查询片段发送对应的数据源执行,得到数据源查询结果;若所述查询片段的联邦执行开销不大于数据源执行开销,则将所述查询片段发送至联邦查询引擎执行,得到联邦查询结果。3.根据权利要求2所述的数据查询方法,其特征在于,所述数据查询系统包括多个数据中心,每个所述数据中心包括多个所述数据源;所述若所述查询片段的联邦执行开销不大于数据源执行开销,则将所述查询片段发送至联邦查询引擎执行,得到联邦查询结果,包括:若所述查询片段的联邦执行开销不大于数据源执行开销,分别将各个数据中心确定为目标数据中心;获取所述联邦查询引擎在所述目标数据中心运行时,所述目标数据中心与各个其他数据中心的数据传输量和传输权重;基于所述目标数据中心与各个其他数据中心的数据传输量和传输权重确定所述联邦查询引擎在所述目标数据中心运行时的运行开销,得到各个数据中心的运行开销;将所述查询片段发送至联邦查询引擎,控制所述联邦查询引擎在运行开销最小的数据中心执行,得到联邦查询结果。4.根据权利要求3所述的数据查询方法,其特征在于,所述将所述查询片段发送至联邦查询引擎,控制所述联邦查询引擎在运行开销最小的数据中心执行,得到联邦查询结果,包括:获取查询片段的语句特征;判断所述语句特征是否属于流计算特征类型;若所述语句特征属于流计算特征类型,则将所述查询片段发送至联邦查询引擎,控制所述联邦查询引擎在运行开销最小的数据中心启动流处理型引擎实例运行,得到联邦查询
结果。5.根据权利要求4所述的数据查询方法,其特征在于,所述若所述语句特征属于流计算特征类型,则将所述查询片段发送至...
【专利技术属性】
技术研发人员:关勋,蔡适择,曾昭正,付建勇,陈天宇,
申请(专利权)人:顺丰科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。