数据库索引方法及系统技术方案

技术编号:15746808 阅读:137 留言:0更新日期:2017-07-03 02:55
本发明专利技术提供了一种数据库索引方法及系统,所述方法包含:获取索引关键字;根据索引关键字查询数据库,获得查询信息或查询周期;将所述查询信息或查询周期与预定阈值比较,根据比较结果获得所述历史业务信息,根据所述历史业务信息获得复数个概率索引关键字,根据所述概率索引关键字和所述索引关键字查询数据库,获得目标数据。通过统计各类业务发生的概率,能将发生概率比重大的某些业务的未知变量变成已知,使其访问路径能匹配更多的索引项,提高这类业务的访问效率,从而提高整体业务的处理效率。

Database indexing method and system

The present invention provides a system and a database index method, the method includes: obtaining the keyword index; index according to the keyword query database, query information or query cycle; the query information or query cycle with a predetermined threshold value according to the comparison, obtains the historical business information according to the comparison result, obtain a plurality of probability index key the history of business information, according to the probability index key and the key index, query the database to obtain the target data. Through the probability statistics of all kinds of business, can be the probability of the unknown variables than some business major becomes known, the access path can match the index more, improve the access efficiency of this type of business, so as to improve the processing efficiency of the overall business.

【技术实现步骤摘要】
数据库索引方法及系统
本专利技术涉及数据索引领域,尤指一种数据库索引方法及系统。
技术介绍
现有数据查询中,多数采用通过已知条件于数据库中海量数据筛选符合该些已知条件的数据供用户选择,已知条件越多,筛选获得的目标数据则更为精准;若已知条件较少,且数据库中符合该已知条件的数据较多时,则用户无法有效且快速的定位其需要的目标数据,同时海量数据的匹配也给硬件和软件上造成了一定的负荷困扰;为此当前数据索引领域中,当已知的条件较少,亦即未知的条件较多时,匹配的部分索引满足的数据量很大,造成访问数据库时间很长;尤其是批量处理此类数据时,耗时时间窗口很大,不能满足业务处理要求。现有通用的方案是对所有的业务类型采用其特点的交集来访问数据库,使其能匹配的数据库索引字段少,因此返回的查询结果量大,造成后续的处理缓慢。
技术实现思路
本专利技术目的在于在现有硬件基础上,提供一种更为快捷有效,且资源浪费更小的数据库索引方法及系统。为达上述目的,本专利技术所提供的一种数据库索引方法,包含:获取索引关键字;根据索引关键字查询数据库,获得查询信息或查询周期;将所述查询信息或查询周期与预定阈值比较,根据比较结果获得所述历史业务信息,根据所述历史业务信息获得复数个概率索引关键字,根据所述概率索引关键字和所述索引关键字查询数据库,获得目标数据。在上述数据库索引方法中,优选的,所述根据比较结果获得所述历史业务信息包含:分析所述查询信息的结果数目,当所述查询信息的结果数目高于预定阈值时,获取所述查询信息对应业务类别的历史业务信息。在上述数据库索引方法中,优选的,所述根据比较结果获得所述历史业务信息包含:分析所述查询周期的时长,当所述查询周期的时长高于预定阈值时,获取所述查询信息对应业务类别的历史业务信息。在上述数据库索引方法中,优选的,根据所述历史业务信息获得复数个概率索引关键字包含:根据所述历史业务信息,分析获得所述历史业务信息中各类别的业务数据比例,根据各类别的业务数据比例获得对应各类别的复数个概率索引关键字。在上述数据库索引方法中,优选的,所述各类别包含以预定时间周期划分的各时间段;所述概率索引关键字为日期。在上述数据库索引方法中,优选的,根据所述概率索引关键字和所述索引关键字查询数据库包含:根据各预定时间周期内的业务数据比例及所述业务数据比例高低,获得概率由高到低的复数个概率索引关键字,根据概率高低将对应的概率索引关键字分别依次加入所述索引关键字中查询数据库。本专利技术还提供一种数据库索引系统,所述系统包含关键字获取模块、查询模块和统计模块;所述关键字获取模块用于获取索引关键字;所述查询模块与所述关键字获取模块相连,用于根据索引关键字查询数据库,获得查询信息或查询周期;所述统计模块与所述查询模块相连,用于将所述查询信息或查询周期与预定阈值比较,根据比较结果获得所述历史业务信息,根据所述历史业务信息获得复数个概率索引关键字,根据所述概率索引关键字和所述索引关键字查询数据库,获得目标数据。在上述数据库索引系统中,优选的,所述统计模块还包含比较单元,所述比较单元用于分析所述查询信息的结果数目,当所述查询信息的结果数目高于预定阈值时,获取所述查询信息对应业务类别的历史业务信息。在上述数据库索引系统中,优选的,所述统计模块还包含时钟单元,所述时钟单元用于分析所述查询周期的时长,当所述查询周期的时长高于预定阈值时,获取所述查询信息对应业务类别的历史业务信息。在上述数据库索引系统中,优选的,所述统计模块还包含检索表单元,所述检索表单元用于根据所述历史业务信息,分析获得所述历史业务信息中各类别的业务数据比例,根据各类别的业务数据比例获得对应各类别的复数个概率索引关键字;以及根据各类别的业务数据比例及所述业务数据比例高低,获得概率由高到低的复数个概率索引关键字,根据概率高低将对应的概率索引关键字分别依次加入所述索引关键字中查询数据库。本专利技术的有益技术效果在于:通过本专利技术所提供的数据库索引方法及系统,可统计各类业务发生的概率,能将发生概率比重大的某些业务的未知变量变成已知,使其访问路径能匹配更多的索引项,提高这类业务的访问效率,从而提高整体业务的处理效率。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,并不构成对本专利技术的限定。在附图中:图1为本专利技术所提供的数据库索引方法的流程示意图;图2为本专利技术所提供的数据库索引系统的结构示意图;图3A-图3B为本专利技术一实施例所提供的原理对比示意图;图4为本专利技术一实施例所提供的比例示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本专利技术做进一步详细说明。在此,本专利技术的示意性实施例及其说明用于解释本专利技术,但并不作为对本专利技术的限定。请参考图1所示,本专利技术所提供的一种数据库索引方法,包含:S101获取索引关键字;S102根据索引关键字查询数据库,获得查询信息或查询周期;S103将所述查询信息或查询周期与预定阈值比较,根据比较结果获得所述历史业务信息,根据所述历史业务信息获得复数个概率索引关键字,根据所述概率索引关键字和所述索引关键字查询数据库,获得目标数据。以此,根据历史业务信息总结得到更多的索引条件,进一步降低索引数据的范围,提高索引的效率。在本专利技术一优选的实施例中,上述步骤S102中包含:根据所述历史业务信息,分析获得所述历史业务信息中各类别的业务数据比例,根据各类别的业务数据比例获得对应各类别的复数个概率索引关键字,例如业务类别为A、B、C时,则于类别A中概括获得一概率索引关键字,于类别B中概括获得一概率索引关键字,于类别C中概括获得一概率索引关键字,其后根据A、B、C各自的比例大小分别将对应的概率索引关键字带入用户输入的索引关键字中进行数据查询。在上述实施例中,本专利技术并不仅限于一次概括索引,也就是说,当判断A为占比较高的数据时,且A数据量也较大时,例如数据量高于预定阈值即1000条或800条等,进一步可将A中数据也根据不同类型进行分类分为A1,A2,A3等数据,在对该些数据分别概括及占比排序后进行索引;本领域相关技术人员当可知其预定阈值的条目数可根据实际情况选择设置,本专利技术在此并不限制预定阈值的条目数以及概括索引的次数。请参考图3A至图3B所示,传统的数据索引如图3A所示,在,传统的应用程序在访问数据库表时,都是按照全部业务的交集条件来匹配数据表的索引,即图3A中字段1和字段2为已知条件进行索引,此时因未知变量较多,为此,当面对海量数据时,索引速度较慢,占用资源较高;针对该情况,本专利技术通过上述方法,利用大数据的分析方法,如图3B所示,从海量的历史业务数据中挖掘客户行为的规律,即通过索引关键字所面对的业务数据分析各类别所占比例,再根据各类别所占比例的大小确定索引的优先顺序,例如该类别数量为2,其中一部分为80%,另一部分为20%,此时则将占比80%的数据作为优先索引数据,占比20%其后的索引数据,以此索引;根据不同优先顺序确定不同的概率索引关键字,将匹配更多索引字段的高频率发生业务抽取出来进行路径B的访问(如80%的数据),其他的数据(20%)由于只能确定字段1和字段2,还是按路径A进行访问,通过这种方法提高批量数据的处理效率。在本专利技术一优选的实施例中,所本文档来自技高网...
数据库索引方法及系统

【技术保护点】
一种数据库索引方法,其特征在于,所述方法包含:获取索引关键字;根据索引关键字查询数据库,获得查询信息或查询周期;将所述查询信息或查询周期与预定阈值比较,根据比较结果获得历史业务信息,根据所述历史业务信息获得复数个概率索引关键字,根据所述概率索引关键字和所述索引关键字查询数据库,获得目标数据。

【技术特征摘要】
1.一种数据库索引方法,其特征在于,所述方法包含:获取索引关键字;根据索引关键字查询数据库,获得查询信息或查询周期;将所述查询信息或查询周期与预定阈值比较,根据比较结果获得历史业务信息,根据所述历史业务信息获得复数个概率索引关键字,根据所述概率索引关键字和所述索引关键字查询数据库,获得目标数据。2.根据权利要求1所述的数据库索引方法,其特征在于,所述根据比较结果获得所述历史业务信息包含:分析所述查询信息的结果数目,当所述查询信息的结果数目高于预定阈值时,获取所述查询信息对应业务类别的历史业务信息。3.根据权利要求1所述的数据库索引方法,其特征在于,所述根据比较结果获得所述历史业务信息包含:分析所述查询周期的时长,当所述查询周期的时长高于预定阈值时,获取所述查询信息对应业务类别的历史业务信息。4.根据权利要求1所述的数据库索引方法,其特征在于,根据所述历史业务信息获得复数个概率索引关键字包含:根据所述历史业务信息,分析获得所述历史业务信息中各类别的业务数据比例,根据各类别的业务数据比例获得对应各类别的复数个概率索引关键字。5.根据权利要求4所述的数据库索引方法,其特征在于,所述各类别包含以预定时间周期划分的各时间段;所述概率索引关键字为日期。6.根据权利要求5所述的数据库索引方法,其特征在于,根据所述概率索引关键字和所述索引关键字查询数据库包含:根据各预定时间周期内的业务数据比例及所述业务数据比例高低,获得概率由高到低的复数个概率索引关键字,根据概率高低将对应的概率索...

【专利技术属性】
技术研发人员:彭丰华
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1