一种查询优化方法及装置制造方法及图纸

技术编号:14565404 阅读:86 留言:0更新日期:2017-02-05 22:47
一种查询优化方法及装置,该方法包括如下步骤:获取检索词;获取与检索词匹配的关键词及关键词的优先度;根据关键词及其优先度执行检索;检索完成后获取本次检索时间;获取上一次利用该关键词进行检索的检索时间;判断本次检索时间是否大于上一次的检索时间,是则降低本次检索中的各个关键词的优先度;否则提高本次检索中的各个关键词的优先度。本发明专利技术在每一次查询之后,都会分析当次的检索时间与上一次利用同一组关键词进行检索的检索时间的差别,修改参与检索的关键词的优先度。从而,随着检索次数的增加,各个关键词的优先度会越来越合理,检索效率也会越来越高。

【技术实现步骤摘要】

本专利技术涉及数据查询
,具体涉及一种查询优化方法及装置
技术介绍
资源描述框架(RDF)是一种用户描述web资源的标记语言,拥有非常大的包容性,社交网络、知识图谱等越来越多的领域使用RDF图数据库。SparQL是RDF图数据的标准查询语言,但与传统的关系型数据库的查询不同,SparQL查询的复杂性更高,同一查询,查询条件的组织顺序不同,检索效率相差很大。因此,为了提高检索效率需要进行优化处理。现有的SparQL查询优化大多是从分布式并行查询方面来提高查询效率。虽然具有一定的成效,但是只从一个方面来提升查询效率,毕竟有限。
技术实现思路
因此,本专利技术要解决的技术问题在于现有的查询优化方法只从分布式并行查询方面提高查询效率,提升的空间有限。为此,本专利技术提供了如下技术方案:一种查询优化方法,包括如下步骤:获取检索词;获取与检索词匹配的关键词及关键词的优先度;根据关键词及其优先度执行检索;检索完成后获取本次检索时间;获取上一次利用关键词进行检索的检索时间;判断本次检索时间是否大于上一次的检索时间,是则降低本次检索中的各个关键词的优先度;否则提高本次检索中的各个关键词的优先度。优选地,获取检索词的步骤包括:获取用户的查询请求语句;利用分词法获取检索词。优选地,获取与检索词匹配的关键词的步骤包括:提取RDF图数据的全部关键词;将检索词与RDF图数据的全部关键词分别进行匹配,获取匹配的关键词。优选地,判断本次检索时间是否大于上一次的检索时间,是则降低本次检索中的各个关键词的优先度;否则提高本次检索中的各个关键词的优先度的步骤包括:将关键词的优先度系数乘以大于1的系数,降低关键词的优先度;将关键词的优先度系数乘以大于0小于1的系数,提高关键词的优先度。优选地,还包括:保存本次检索时间和修改后的关键词的优先度。一种查询优化装置,包括:第一获取单元,用于获取检索词;第二获取单元,用于获取与检索词匹配的关键词及关键词的优先度;检索单元,用于根据关键词及其优先度执行检索;第三获取单元,用于检索完成后获取本次检索时间;第四获取单元,用于获取上一次利用关键词进行检索的检索时间;优先度调整单元,用于判断本次检索时间是否大于上一次的检索时间,是则降低本次检索中的各个关键词的优先度;否则提高本次检索中的各个关键词的优先度。优选地,第一获取单元包括:查询请求语句获取子单元,用于获取用户的查询请求语句;检索词获取子单元,用于利用分词法获取检索词。优选地,第二获取单元包括:提取子单元,用于提取RDF图数据的全部关键词;匹配子单元,用于将检索词与RDF图数据的全部关键词分别进行匹配,获取匹配的关键词。优选地,优先度调整单元包括:优先度降低子单元,用于将关键词的优先度系数乘以大于1的系数,降低关键词的优先度;优先度提高子单元,用于将关键词的优先度系数乘以大于0小于1的系数,提高关键词的优先度。优选地,还包括:保存单元,用于保存本次检索时间和修改后的关键词的优先度。本专利技术技术方案,具有如下优点:本专利技术提供的查询优化方法及装置,在每一次查询之后,都会分析当次的检索时间与上一次利用同一组关键词进行检索的检索时间的差别,修改参与检索的关键词的优先度。从而,随着检索次数的增加,各个关键词的优先度会越来越合理,检索效率也会越来越高。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例1中一种查询优化方法的流程图;图2为本专利技术实施例2中一种查询优化装置的原理框图;具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。此外,下面所描述的本专利技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。实施例1如图1所示,本实施例提供了一种查询优化方法,包括如下步骤:S1:获取检索词;S2:获取与检索词匹配的关键词及关键词的优先度;S3:根据关键词及其优先度执行检索;S4:检索完成后获取本次检索时间;S5:获取上一次利用该关键词进行检索的检索时间;S6:判断本次检索时间是否大于上一次的检索时间,是则降低本次检索中的各个关键词的优先度;否则提高本次检索中的各个关键词的优先度。本实施例提供的查询优化方法,在每一次查询之后,都会分析当次的检索时间与上一次利用同一组关键词进行检索的检索时间的差别,修改参与检索的关键词的优先度。从而,随着检索次数的增加,各个关键词的优先度会越来越合理,检索效率也会越来越高。本实施例中,关键词的优先度是通过优先度系数来量化的,优先度系数越小优先度越高。该查询优化方法主要适用于RDF图数据中的SparQL查询,因为SparQL查询中同一组关键词的顺序会影响检索效率。另外,该查询优化方法中,如果本次检索是该关键词组合的第一次检索,即不存在上一次检索时间,则不进行关键词优先度的调整。如果本次检索时间正好等于上一次的检索时间,也不进行关键词优先度的调整。其中,如果与检索词匹配的用于检索的关键词只有一个的话,每次检索的时间应该都是一样的,因此一般都不需要调整其优先度。因此,本实施例中需要调整关键词优先度的,检索中都至少用到两个关键词的组合,因其组合顺序不同才会导致两次检索的时间不同。具体地,上述步骤S1,即获取检索词的步骤包括:首先,获取用户的查询请求语句;然后,利用分词法获取检索词。具体地,上述步骤S2中,即获取与检索词匹配的关键词的步骤包括:首先,提取RDF图数据的全部关键词;然后,将检索词与RDF图数据的全部关键词分别进行匹配,获取匹配的关键词。上述RDF图数据的全部关键词是通过预先处理RDF图数据,然后经关键词的提取、分类和去重后最终得到的。之后,还需要初始化RDF图数据的全部关键词的优先度,即本文档来自技高网...

【技术保护点】
一种查询优化方法,其特征在于,包括如下步骤:获取检索词;获取与所述检索词匹配的关键词及所述关键词的优先度;根据所述关键词及其优先度执行检索;检索完成后获取本次检索时间;获取上一次利用所述关键词进行检索的检索时间;判断本次检索时间是否大于上一次的检索时间,是则降低本次检索中的各个关键词的优先度;否则提高本次检索中的各个关键词的优先度。

【技术特征摘要】
1.一种查询优化方法,其特征在于,包括如下步骤:
获取检索词;
获取与所述检索词匹配的关键词及所述关键词的优先度;
根据所述关键词及其优先度执行检索;
检索完成后获取本次检索时间;
获取上一次利用所述关键词进行检索的检索时间;
判断本次检索时间是否大于上一次的检索时间,是则降低本次检索中
的各个关键词的优先度;否则提高本次检索中的各个关键词的优先度。
2.根据权利要求1所述的方法,其特征在于,所述获取检索词的步骤
包括:
获取用户的查询请求语句;
利用分词法获取所述检索词。
3.根据权利要求1或2所述的方法,其特征在于,所述获取与所述检
索词匹配的关键词的步骤包括:
提取RDF图数据的全部关键词;
将所述检索词与所述RDF图数据的全部关键词分别进行匹配,获取匹

\t配的关键词。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述判断本
次检索时间是否大于上一次的检索时间,是则降低本次检索中的各个关键
词的优先度;否则提高本次检索中的各个关键词的优先度的步骤包括:
将所述关键词的优先度系数乘以大于1的系数,降低所述关键词的优
先度;
将所述关键词的优先度系数乘以大于0小于1的系数,提高所述关键
词的优先度。
5.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:
保存本次检索时间和修改后的关键词的优先度。
6.一种查询优化装置,其特征在于,包括:
第...

【专利技术属性】
技术研发人员:孙伟孟令彬黄树红
申请(专利权)人:北大方正集团有限公司北京方正阿帕比技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1