【技术实现步骤摘要】
一种基于Elasticsearch的专利检索统计引擎
[0001]本专利技术属于检索引擎及统计分析领域,具体涉及一种基于Elasticsearch的专利检索统计引擎。
技术介绍
[0002]随着人类社会各领域技术的快速发展,涌现出了无数的智慧结晶。同时,人们对这些知识的产权保护意识也在日益加强。作为知识产权的一种,目前全世界累计已有上亿件专利,这些海量的专利蕴含了很高的价值。因此,如何更好地对这些专利的信息进行提取、查询,是实现专利价值利用的基础。随着知识产权领域信息化建设水平的提高,专利的数据管理已经不再是主要问题,目前,专利数据的多维度检索,已经成为了能够解决专利信息查询的关键技术和核心能力。
[0003]在专利检索领域,使用者通常需要对专利的各种属性进行复杂的组合条件检索;同时,由于一个专利申请文档可能会对应一到多个专利公开公告文档,有时需要对同一个专利申请的多个文档进行去重。另外,还可能需要满足一些需要消耗大量资源、大量时间的非实时的数据统计分析需求,而现有的可用于专利检索的搜索引擎,比如Elasticsearch等,无法支持复杂的条件检索、专利去重文档合并、多维数据统计分析以及异步专利检索等多种需求。
技术实现思路
[0004]为了解决现有技术中存在的上述问题,本专利技术提供了一种基于Elasticsearch的专利检索统计引擎。本专利技术要解决的技术问题通过以下技术方案实现:
[0005]一种基于Elasticsearch的专利检索统计引擎,包括:
[0006]标准 ...
【技术保护点】
【技术特征摘要】
1.一种基于Elasticsearch的专利检索统计引擎,其特征在于,包括:标准请求参数获取模块,用于获取标准请求参数;其中,所述标准请求参数表征待处理的专利检索统计需求的属性信息;所述专利检索统计需求包括复杂条件检索、多维数据统计分析、专利去重文档合并和异步专利检索;所述标准请求参数的结构是针对检索输入预先定义的标准的数据结构;Elasticsearch查询语句转换模块,用于利用标准请求参数与Elasticsearch查询语句的逻辑对应关系,将所述标准请求参数转换为Elasticsearch查询语句;专利检索模块,用于利用所述Elasticsearch查询语句在Elasticsearch中进行专利检索,得到Elasticsearch检索结果;标准响应结果获得模块,用于将所述Elasticsearch检索结果转换为标准响应结果输出;其中,所述标准响应结果的结构是针对检索输出预先定义的标准的数据结构。2.根据权利要求1所述的基于Elasticsearch的专利检索统计引擎,其特征在于,所述标准请求参数的结构,包括:索引名indexName、专利检索表达式searchExpr、排序属性sortField、数据偏移offset、数据限制limit、统计字段列表statisticsFieldList、去重字段collapseField、异步检索编号asyncSearchId和异步检索需求async;其中,所述排序属性sortField包括排序字段名fieldName和排序方向reverseOrder;异步检索需求async的值表示是否进行异步检索;所述标准响应结果的结构,包括:专利文档列表docList、命中数count、去重命中数countAfterCollapse、统计数据statisticsData、异步检索编号asyncSearchId和异步检索状态asyncSearchStatus。3.根据权利要求2所述的基于Elasticsearch的专利检索统计引擎,其特征在于,所述Elasticsearch查询语句转换模块利用标准请求参数与Elasticsearch查询语句的逻辑对应关系,将所述标准请求参数转换为Elasticsearch查询语句的过程,包括:将所述标准请求参数中searchExpr的值利用预设的专利检索表达式语句转换方法转换为Elasticsearch查询语句,并赋值到Query DSL中的query属性上;将所述标准请求参数中sortField的值转换为Elasticsearch查询语句中排序语句的格式,并赋值到Query DSL的sort属性上;将所述标准请求参数中offset的值赋值到Query DSL中的from属性上;将所述标准请求参数中limit的值赋值到Query DSL中的size属性上;针对所述标准请求参数中statisticsFieldList内的每个统计,基于Elasticsearch中的terms分组聚合函数,将该统计对应的值转换为Elasticsearch查询语句中聚合查询语句的格式,构造对应的JSON对象,并赋值到Query DSL的aggs属性上;将所述标准请求参数中collapseField的值转换为Elasticsearch查询语句中去重查询语句的格式,并赋值到Query DSL的collapse属性上。4.根据权利要求3所述的基于Elasticsearch的专利检索统计引擎,其特征在于,所述将所述标准请求参数中searchExpr的值利用预设的专利检索表达式语句转换方法转换为Elasticsearch查询语句,包括:利用预先构建的分词器解析searchExpr中专利检索表达式对应的字符串,得到解析出
的多个分词;其中,searchExpr中的专利检索表达式、所述分词器基于预先定义的可扩展的专利检索表达式语法结构构建;基于所述专利检索表达式语法结构,将所述多个分词处理为标准语法节点的列表;根据所述标准语法节点的列表生成标准语法树;利用预先构建的语法转换器,将所述标准语法树转换为Elasticsearch查询语句。5.根据权利要求3所述的基于Elasticsearch的专利检索统计引擎,其特征在于,所述针对所述标准请求参数中statisticsFieldList内的每个统计,基于Elasticsearch中的terms分组聚合函数,将该统计对应的值转换为Elasticsearch查询语句中聚合查询语句的格式,构造对应的JSON对象,并赋值到Query DSL的aggs属性上,包括:针对所述标准请求参数中statisticsFieldList内的每个统计,若该统计为单级维度,利用Elasticsearch中的terms分组聚合函数将该单级维度统计对应的字段值转换为Elasticsearch查询语句的格式,得到该单级维度统计对应的Elasticsearch聚合查询语句;其中,statisticsFieldList内的每一项为统计字段statisticsField,代表一个独立的统计;针对所述标准请求参...
【专利技术属性】
技术研发人员:李扩拉,
申请(专利权)人:陕西融盛知识产权平台有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。