一种基于Elasticsearch的专利检索统计引擎制造技术

技术编号:36000215 阅读:14 留言:0更新日期:2022-12-17 23:17
本发明专利技术公开了一种基于Elasticsearch的专利检索统计引擎,包括:标准请求参数获取模块,用于获取标准请求参数;Elasticsearch查询语句转换模块,用于将标准请求参数转换为Elasticsearch查询语句;专利检索模块,用于利用Elasticsearch查询语句在Elasticsearch中进行专利检索;标准响应结果获得模块,用于将Elasticsearch检索结果转换为标准响应结果输出;本发明专利技术定义了一种专利检索统计的接口规范,基于Elasticsearch实现专利检索统计引擎,能处理包括复杂条件检索、多维数据统计分析、专利去重文档合并和异步专利检索等在内的多种专利检索统计需求。种专利检索统计需求。种专利检索统计需求。

【技术实现步骤摘要】
一种基于Elasticsearch的专利检索统计引擎


[0001]本专利技术属于检索引擎及统计分析领域,具体涉及一种基于Elasticsearch的专利检索统计引擎。

技术介绍

[0002]随着人类社会各领域技术的快速发展,涌现出了无数的智慧结晶。同时,人们对这些知识的产权保护意识也在日益加强。作为知识产权的一种,目前全世界累计已有上亿件专利,这些海量的专利蕴含了很高的价值。因此,如何更好地对这些专利的信息进行提取、查询,是实现专利价值利用的基础。随着知识产权领域信息化建设水平的提高,专利的数据管理已经不再是主要问题,目前,专利数据的多维度检索,已经成为了能够解决专利信息查询的关键技术和核心能力。
[0003]在专利检索领域,使用者通常需要对专利的各种属性进行复杂的组合条件检索;同时,由于一个专利申请文档可能会对应一到多个专利公开公告文档,有时需要对同一个专利申请的多个文档进行去重。另外,还可能需要满足一些需要消耗大量资源、大量时间的非实时的数据统计分析需求,而现有的可用于专利检索的搜索引擎,比如Elasticsearch等,无法支持复杂的条件检索、专利去重文档合并、多维数据统计分析以及异步专利检索等多种需求。

技术实现思路

[0004]为了解决现有技术中存在的上述问题,本专利技术提供了一种基于Elasticsearch的专利检索统计引擎。本专利技术要解决的技术问题通过以下技术方案实现:
[0005]一种基于Elasticsearch的专利检索统计引擎,包括:
[0006]标准请求参数获取模块,用于获取标准请求参数;其中,所述标准请求参数表征待处理的专利检索统计需求的属性信息;所述专利检索统计需求包括复杂条件检索、多维数据统计分析、专利去重文档合并和异步专利检索;所述标准请求参数的结构是针对检索输入预先定义的标准的数据结构;
[0007]Elasticsearch查询语句转换模块,用于利用标准请求参数与Elasticsearch查询语句的逻辑对应关系,将所述标准请求参数转换为Elasticsearch查询语句;
[0008]专利检索模块,用于利用所述Elasticsearch查询语句在Elasticsearch中进行专利检索,得到Elasticsearch检索结果;
[0009]标准响应结果获得模块,用于将所述Elasticsearch检索结果转换为标准响应结果输出;其中,所述标准响应结果的结构是针对检索输出预先定义的标准的数据结构。
[0010]本专利技术的有益效果:
[0011]本专利技术实施例在Elasticsearch基础上,通过定义一种专利检索统计的接口规范,实现了一种基于Elasticsearch的专利检索统计引擎,包括标准请求参数获取模块、Elasticsearch查询语句转换模块、专利检索模块和标准响应结果获得模块。其中,标准请
求参数获取模块用于获取标准请求参数;Elasticsearch查询语句转换模块用于利用标准请求参数与Elasticsearch查询语句的逻辑对应关系,将所述标准请求参数转换为Elasticsearch查询语句;专利检索模块用于利用所述Elasticsearch查询语句在Elasticsearch中进行专利检索,得到Elasticsearch检索结果;标准响应结果获得模块用于将所述Elasticsearch检索结果转换为标准响应结果输出;其中,所述标准请求参数表征待处理的专利检索统计需求的属性信息;所述专利检索统计需求包括复杂条件检索、多维数据统计分析、专利去重文档合并和异步专利检索;所述标准请求参数的结构是针对检索输入预先定义的标准的数据结构;所述标准响应结果的结构是针对检索输出预先定义的标准的数据结构。可见,本专利技术实施例的基于Elasticsearch的专利检索统计引擎通过制定标准请求参数及标准响应结果,为专利的检索统计确定了规范,能够基于Elasticsearch实现复杂条件检索、多维数据统计分析、专利去重文档合并、异步专利检索等多种功能,能够满足现有专利检索统计分析领域的多种需求,同时具备相应规范,且支持扩展和优化,为专利检索和统计分析等提供了良好的技术支持。
附图说明
[0012]图1为本专利技术实施例所提供的一种基于Elasticsearch的专利检索统计引擎的结构示意图;
[0013]图2为本专利技术实施例所提供的基于Elasticsearch的专利检索统计引擎的处理流程示意图;
[0014]图3为本专利技术实施例中标准请求参数与Elasticsearch查询语句的逻辑对应关系的示意图;
[0015]图4为本专利技术实施例中专利检索模块利用Elasticsearch查询语句在Elasticsearch中进行专利检索的流程示意图;
[0016]图5为本专利技术实施例中实际的专利检索结果与标准响应结果的逻辑对应关系的示意图;
[0017]图6为本专利技术实施例中预设的专利检索表达式语句转换方法的流程示意图;
[0018]图7为本专利技术实施例所提供的next函数的算法流程示意图。
具体实施方式
[0019]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0020]为了满足现有专利检索统计分析领域中复杂的条件检索、专利去重文档合并、多维数据统计分析以及异步专利检索等多种需求,本专利技术实施例提供了一种基于Elasticsearch的专利检索统计引擎。
[0021]请参见图1所示的基于Elasticsearch的专利检索统计引擎的结构示意图,以及图2所示的基于Elasticsearch的专利检索统计引擎的处理流程示意图,本专利技术实施例的基于Elasticsearch的专利检索统计引擎可以包括标准请求参数获取模块、Elasticsearch查询
语句转换模块、专利检索模块和标准响应结果获得模块。
[0022]以下对各个模块的作用分别进行说明。
[0023](一)标准请求参数获取模块
[0024]标准请求参数获取模块,用于获取标准请求参数。
[0025]其中,标准请求参数表征待处理的专利检索统计需求的属性信息;专利检索统计需求包括复杂条件检索、多维数据统计分析、专利去重文档合并和异步专利检索;当然,本专利技术实施例中的专利检索统计需求不限于以上。
[0026]其中,标准请求参数的结构是针对检索输入预先定义的标准的数据结构。
[0027]具体的,为了将复杂的Elasticsearch检索功能封装成简洁、标准的专利检索功能,本专利技术实施例预先针对检索输入定义了一个标准的数据结构,作为该专利检索统计引擎的标准请求参数的结构。
[0028]可选的一种实施方式中,标准请求参数的结构,包括:
[0029]索引名in本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Elasticsearch的专利检索统计引擎,其特征在于,包括:标准请求参数获取模块,用于获取标准请求参数;其中,所述标准请求参数表征待处理的专利检索统计需求的属性信息;所述专利检索统计需求包括复杂条件检索、多维数据统计分析、专利去重文档合并和异步专利检索;所述标准请求参数的结构是针对检索输入预先定义的标准的数据结构;Elasticsearch查询语句转换模块,用于利用标准请求参数与Elasticsearch查询语句的逻辑对应关系,将所述标准请求参数转换为Elasticsearch查询语句;专利检索模块,用于利用所述Elasticsearch查询语句在Elasticsearch中进行专利检索,得到Elasticsearch检索结果;标准响应结果获得模块,用于将所述Elasticsearch检索结果转换为标准响应结果输出;其中,所述标准响应结果的结构是针对检索输出预先定义的标准的数据结构。2.根据权利要求1所述的基于Elasticsearch的专利检索统计引擎,其特征在于,所述标准请求参数的结构,包括:索引名indexName、专利检索表达式searchExpr、排序属性sortField、数据偏移offset、数据限制limit、统计字段列表statisticsFieldList、去重字段collapseField、异步检索编号asyncSearchId和异步检索需求async;其中,所述排序属性sortField包括排序字段名fieldName和排序方向reverseOrder;异步检索需求async的值表示是否进行异步检索;所述标准响应结果的结构,包括:专利文档列表docList、命中数count、去重命中数countAfterCollapse、统计数据statisticsData、异步检索编号asyncSearchId和异步检索状态asyncSearchStatus。3.根据权利要求2所述的基于Elasticsearch的专利检索统计引擎,其特征在于,所述Elasticsearch查询语句转换模块利用标准请求参数与Elasticsearch查询语句的逻辑对应关系,将所述标准请求参数转换为Elasticsearch查询语句的过程,包括:将所述标准请求参数中searchExpr的值利用预设的专利检索表达式语句转换方法转换为Elasticsearch查询语句,并赋值到Query DSL中的query属性上;将所述标准请求参数中sortField的值转换为Elasticsearch查询语句中排序语句的格式,并赋值到Query DSL的sort属性上;将所述标准请求参数中offset的值赋值到Query DSL中的from属性上;将所述标准请求参数中limit的值赋值到Query DSL中的size属性上;针对所述标准请求参数中statisticsFieldList内的每个统计,基于Elasticsearch中的terms分组聚合函数,将该统计对应的值转换为Elasticsearch查询语句中聚合查询语句的格式,构造对应的JSON对象,并赋值到Query DSL的aggs属性上;将所述标准请求参数中collapseField的值转换为Elasticsearch查询语句中去重查询语句的格式,并赋值到Query DSL的collapse属性上。4.根据权利要求3所述的基于Elasticsearch的专利检索统计引擎,其特征在于,所述将所述标准请求参数中searchExpr的值利用预设的专利检索表达式语句转换方法转换为Elasticsearch查询语句,包括:利用预先构建的分词器解析searchExpr中专利检索表达式对应的字符串,得到解析出
的多个分词;其中,searchExpr中的专利检索表达式、所述分词器基于预先定义的可扩展的专利检索表达式语法结构构建;基于所述专利检索表达式语法结构,将所述多个分词处理为标准语法节点的列表;根据所述标准语法节点的列表生成标准语法树;利用预先构建的语法转换器,将所述标准语法树转换为Elasticsearch查询语句。5.根据权利要求3所述的基于Elasticsearch的专利检索统计引擎,其特征在于,所述针对所述标准请求参数中statisticsFieldList内的每个统计,基于Elasticsearch中的terms分组聚合函数,将该统计对应的值转换为Elasticsearch查询语句中聚合查询语句的格式,构造对应的JSON对象,并赋值到Query DSL的aggs属性上,包括:针对所述标准请求参数中statisticsFieldList内的每个统计,若该统计为单级维度,利用Elasticsearch中的terms分组聚合函数将该单级维度统计对应的字段值转换为Elasticsearch查询语句的格式,得到该单级维度统计对应的Elasticsearch聚合查询语句;其中,statisticsFieldList内的每一项为统计字段statisticsField,代表一个独立的统计;针对所述标准请求参...

【专利技术属性】
技术研发人员:李扩拉
申请(专利权)人:陕西融盛知识产权平台有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1