【技术实现步骤摘要】
索引信息构建方法、索引信息推荐方法、装置以及电子设备
[0001]本申请涉及计算机
,更具体地,涉及一种索引信息构建方法、索引信息推荐方法、装置以及电子设备。
技术介绍
[0002]随着大数据时代的到来,数据库所包含的内容也越来越多,导致对数据库中内容查询的速度也开始变慢,因此,索引信息的构建开始成为研究热点。在相关方式中,可以通过用户手动配置索引信息,基于手动配置的索引信息提高对数据的查询速度。但相关方式中,还存在索引构建的效率低下的问题,从而导致对数据的查询速度也较低。
技术实现思路
[0003]鉴于上述问题,本申请提出了一种索引信息构建方法、索引信息推荐方法、装置、电子设备以及计算机程序产品,以实现改善上述问题。
[0004]第一方面,本申请提供了一种索引信息构建方法,所述方法包括:获取统计信息,所述统计信息包括多条目标语句对应的数据表的连接关系和所述数据表的列信息;基于所述连接关系和所述列信息,构建目标模型;基于所述目标模型和所述列信息,构建所述目标模型对应的索引信息。
[000 ...
【技术保护点】
【技术特征摘要】
1.一种索引信息构建方法,其特征在于,所述方法包括:获取统计信息,所述统计信息包括多条目标语句对应的数据表的连接关系和所述数据表的列信息;基于所述连接关系和所述列信息,构建目标模型;基于所述目标模型和所述列信息,构建所述目标模型对应的索引信息。2.根据权利要求1所述的方法,其特征在于,所述列信息包括单列频率、双列频率、列性质、单列基数、双列基数,所述获取统计信息,包括:获取多条目标语句各自对应的结构化信息,所述结构化信息包括对应数据表的表名、列名、所述列名对应的关键字;基于所述表名、所述列名和所述列名对应的关键字,得到所述连接关系、所述单列频率、所述双列频率、所述单列基数、所述双列基数,所述单列频率为每个所述列名在所述多个目标语句中出现的次数、所述双列频率为相同的两个列名出现在同一条目标语句中的次数、所述单列基数为对应列中不相同元素的个数,所述双列基数为对应的两列中不相同元素的个数;基于所述列名和所述列名对应的关键字,得到所述列性质,其中,若所述列名对应的关键字为第一关键字,所述列性质为度量列,若所述列名对应的关键字为第二关键字,所述列性质为分组列。3.根据权利要求2所述的方法,其特征在于,所述目标模型有多个,所述基于所述连接关系和所述列信息,构建目标模型,包括:获取所述多条目标语句中具有相同连接关系的目标语句,以得到多对具有相同连接关系的目标语句;构建所述多对具有相同连接关系的目标语句各自对应的参考模型,以得到多个参考模型;基于所述多个参考模型各自对应的目标语句的列性质,得到所述多个目标模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述多个参考模型各自对应的目标语句的列性质,得到所述多个模型,包括:基于每个所述参考模型对应的目标语句的列性质,确认参考模型对应的目标语句中是否存在列性质冲突的目标语句,所述列性质冲突表示在同一条目标语句中相同列名的列性质包括分组列和度量列;若有参考模型对应的目标语句中存在列性质冲突的目标语句,将对应的目标语句中存在列性质冲突的目标语句的参考模型作为待处理模型;基于所述待处理模型对应的存在列性质冲突的目标语句,构建对应的第一模型,以及基于所述待处理模型对应的不存在列性质冲突的目标语句,构建对应的第二模型;将待处理模型对应的第一模型、所述第二模型和不存在列性质冲突的目标语句的参考模型,作为所述多个目标模型。5.根据权利要求2所述的方法,其特征在于,所述索引信息包括包含维度和维度类型,所述基于所述目标模型和所述列信息,构建所述目标模型对应的索引信息,包括:获取所述目标模型对应的多个维度,所述维度为所述目标模型中的分组列;若所述多个维度中存在两个维度出现在同一条目标语句中,则将所述两个维度相连,
得到所述目标模型对...
【专利技术属性】
技术研发人员:李汶钢,王卓,陈康柳,王武,
申请(专利权)人:深圳市深信服信息安全有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。