数据库的查询重构方法、装置、设备及存储介质制造方法及图纸

技术编号:16819137 阅读:173 留言:0更新日期:2017-12-16 12:35
本发明专利技术适用计算机技术领域,提供了一种数据库的查询重构方法、装置、设备及存储介质,该方法包括:当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图,根据查询视图对数据库的元组进行标记,生成数据库的标记属性,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面,根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询,从而提高了查询重构效率,进而提高数据库系统的查询效率。

Query refactoring method, device, device and storage medium for database

The invention is applied to computer technology, provides a database query reconstruction method, apparatus, equipment and storage medium, the method comprises: when receiving the user's request, the original query receives user input, to obtain the original query view in the default database, marking according to the view of the database query tuple the markup attribute generated database, access to user specified properties, through the model of support vector machine for training the preset user specified properties, generating hyperplane according to the attribute classification and expression of super user plane designated, to reconstruct the original query, instead of generating the original query corresponding to the query, so as to improve the query the reconstruction efficiency, and improve the query efficiency of database system.

【技术实现步骤摘要】
数据库的查询重构方法、装置、设备及存储介质
本专利技术属于计算机
,尤其涉及一种数据库的查询重构方法、装置、设备及存储介质。
技术介绍
数据库查询是数据库系统的重要功能之一。在大数据背景下,面对海量的异构数据,数据库技术也不断发展,出现了诸如云管理、分布式数据库、内存数据库、NoSQL等多种多样的数据库系统,然而数据库查询仍然是这些系统的核心业务之一,如何让用户对数据进行快速高效的查询因此变得尤为重要。使用数据查询语言查询指定数据库对于非专家用户通常是一项非常具有挑战性的任务,尤其是在数据模式的不确定性情况下,例如用户对数据存储的不明确、数据存储结构复杂以及多变,数据查询往往缺乏模式或者只有不完整的模式来帮助用户指定其查询,这使得数据库查询的效率问题变得更加重要。查询重构可以针对用户输入的一个有效的查询找到一个相同或者相似但是更加高效的替代查询语句。这一方法也是数据库领域的一个研究热点问题,可以被广泛的应用在数据库系统查询优化、数据反向工程、数据库安全等领域。当用户输入一个数据库查询后,如何找到一个相同或者相似的查询,该查询返回与原始查询相同的结果,但新生成的查询执行更加高效,这是一个非常有意义和有技术挑战的难点问题。例如,在篮球数据库中,可以通过查询诸如积分、篮板、助攻等多个不同属性的组合来寻找优秀的球员。但是由于涉及模式属性繁多甚至跨实体,这种组合查询往往效率不高,如何利用较少数目且尽可能使用索引属性重构另一个替代查询并返回相同的结果具有很高的实践价值,因为重构的查询涉及较少、较优数据模式属性,因而可以使得整个系统具有更高的响应效率和反应速度,进而提高系统性能。已有数据库数据分析技术主要基于两类方法:简单的选择策略和机器学习方法。简单的选择策略主要包括最近邻居方法和子结构搜索方法;机器学习方法包括决策树和神经网络。简单的选择策略缺乏经验指导,无法适应新的数据环境,已有很多研究证明应用机器学习方法进行数据查找优于这类方法。决策树法以“按输出查询”(QOP)的形式进行查询重构:给定一个查询,使用决策树生成该查询的多个实例等效查询(IEQ)。通过分析多个查询的成本,可以选择类似输出的最优查询。也有一些方法尝试以视图定义问题(VDP)解决了这个问题,VDP问题可以为数据库视图找出最准确和最简洁的定义,还可以根据阈值查找近似的定义。通过为数据库视图寻找定义的方式可以在一定程度上解决这一问题。但是,决策树在处理这一问题时,将属性分为两个互斥的集合,导致属性之间的比较关系丢失,并且决策树方法依赖于对数据的认识,需要用户提前预知数据的模式属性,此外,决策树方法易过拟合。VDP问题没有挖掘已有的查询Q和视图V之间的关联,因而生成的查询跟用户输入查询之间差异很大。
技术实现思路
本专利技术的目的在于提供一种数据库的查询重构方法、装置、设备及存储介质,旨在解决由于现有数据库系统的查询重构效率低下,导致数据库系统的查询效率不高的问题。一方面,本专利技术提供了一种数据库的查询重构方法,所述方法包括下述步骤:当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;根据所述查询视图对所述数据库的元组进行标记,生成所述数据库的标记属性;获取所述用户指定的属性,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面;根据所述分类超平面的表达式和所述用户指定的属性,对所述原始查询进行重构,生成所述原始查询对应的替代查询。另一方面,本专利技术提供了一种数据库的查询重构装置,所述装置包括:查询视图获取单元,用于当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;标记属性生成单元,用于根据所述查询视图对所述数据库的元组进行标记,生成所述数据库的标记属性;超平面生成单元,用于获取所述用户指定的属性,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面;以及查询生成单元,用于根据所述分类超平面的表达式和所述用户指定的属性,对所述原始查询进行重构,生成所述原始查询对应的替代查询。另一方面,本专利技术还提供了一种数据库查询设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述查询重构方法的步骤。另一方面,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述查询重构方法的步骤。本专利技术当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图,根据查询视图对数据库的元组进行标记,生成数据库的标记属性,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面,根据分类超平面的表达式和用户指定的属性,对原始查询进行重构,生成原始查询对应的替代查询,从而提高了查询重构效率,进而提高数据库系统的查询效率。附图说明图1是本专利技术实施例一提供的数据库的查询重构方法的实现流程图;图2是本专利技术实施例二提供的数据库的查询重构方法的实现流程图;图3是本专利技术实施例三提供的数据库的查询重构装置的结构示意图;图4是本专利技术实施例四提供的数据库的查询重构装置的结构示意图;以及图5是本专利技术实施例五提供的数据库查询设备的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。以下结合具体实施例对本专利技术的具体实现进行详细描述:实施例一:图1示出了本专利技术实施例一提供的数据库的查询重构方法的实现流程,为了便于说明,仅示出了与本专利技术实施例相关的部分,详述如下:在步骤S101中,当接收到用户的查询请求时,接收用户输入的原始查询,获取原始查询在预设的数据库上的查询视图。本专利技术实施例适用于数据库系统,尤其适用于数据库系统的查询优化,以方便进行数据库系统的查询重构。在本专利技术实施例中,当接收到用户的查询请求时,说明用户需要从数据库中寻找数据,此时,接收用户输入的原始查询,根据原始查询的查询语句在用户指定的数据库中进行查询,得到对应的查询视图。在步骤S102中,根据查询视图对数据库的元组进行标记,生成数据库的标记属性。在本专利技术实施例中,得到对应的查询视图之后,将数据库中属于查询视图的元组和不属于查询视图的元组进行区别标记,在数据库中添加一列标记数据,即增加了数据库属性。具体地,在对元组进行区别标记时,可以将属于查询视图的元组标记为+1,将不属于查询视图的元组标记为-1。在步骤S103中,获取用户指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面。在本专利技术实施例中,获取用户在输入的原始查询中指定的属性,通过预设的支持向量机模型对用户指定的属性进行训练,以获取用户的查询意图,并根据用户的查询意图生成分类超平面,以对用户指定的属性进行最佳分类。优选地,预设的支持向量机模型为C-支持向量分类机模型。进一步优选地,在通过预设的支持向量机模型对用户指定的属性进行训练,生成分类超平面时,首先根据用户指定的属性,确定训练的表达式为然后根据确定的表达式,获取对应的本文档来自技高网
...
数据库的查询重构方法、装置、设备及存储介质

【技术保护点】
一种数据库的查询重构方法,其特征在于,所述方法包括下述步骤:当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;根据所述查询视图对所述数据库的元组进行标记,生成所述数据库的标记属性;获取所述用户指定的属性,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面;根据所述分类超平面的表达式和所述用户指定的属性,对所述原始查询进行重构,生成所述原始查询对应的替代查询。

【技术特征摘要】
1.一种数据库的查询重构方法,其特征在于,所述方法包括下述步骤:当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;根据所述查询视图对所述数据库的元组进行标记,生成所述数据库的标记属性;获取所述用户指定的属性,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面;根据所述分类超平面的表达式和所述用户指定的属性,对所述原始查询进行重构,生成所述原始查询对应的替代查询。2.如权利要求1所述的方法,其特征在于,所述方法还包括:获取所述替代查询的查询结果,并向所述用户输出所述查询结果;接收所述用户对所述查询结果的反馈信息;当所述反馈信息为非预设正面反馈时,跳转至获取所述用户指定的属性的步骤,直至接收到的所述反馈信息为所述预设正面反馈。3.如权利要求1所述的方法,其特征在于,所述预设的支持向量机模型为C-支持向量分类机模型。4.如权利要求3所述的方法,其特征在于,通过预设的支持向量机模型对所述用户指定的属性进行训练,生成分类超平面的步骤,包括:根据所述用户指定的属性,确定训练的表达式为其中,所述C为预先确定的指定参数,所述ξi是松弛变量,所述参数ξi和所述系数向量w满足约束条件di(wTφ(xi)+b)≥1-ξi,所述xi为训练矢量,所述φ()为映射函数;根据所述确定的表达式,获取对应的对偶表达式其中,所述α满足约束条件dTα=0,所述α为向量x的对偶向量,所述d为预设的参数,所述e为单位向量,所述Q为l×l的正半定数矩阵;根据所述α对所述对偶表达式进行训练,以得到分类超平面,所述分类超平面的表达式为所述K(xi,x)为预设的内核函数。5.一种数据库的查询重构装置,其特征在于,所述装置包括:查询视图获取单元,用于当接收到用户的查询请求时,接收所述用户输入的原始查询,获取所述原始查询在预设的数据库上的查询视图;标记属性生成单元,用于根据所述查询视图对所述数据库的元组进行标记,...

【专利技术属性】
技术研发人员:张金波曲强
申请(专利权)人:深圳先进技术研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1