基于先行断言决策算法和LL递归下降法的检索方法技术

技术编号:14701729 阅读:50 留言:0更新日期:2017-02-24 20:08
本发明专利技术提供一种基于先行断言决策算法和LL递归下降法的检索分析器,包括:1、按照扩展巴科斯范式EBNF设计编写分析器的语法规则;2、生成分析器的java代码,将生成的java代码进行编译;3、Antlr进行检索表达式解析时,如果错误发生,则立即停止解析;否,则进入步骤4;4、将检索表达式解析成抽象语法树,并通过可视化界面,将该抽象语法树中的各个节点与检索表达式的内容进行关联;5、由分析器将该检索表达式进行重构,将该抽象语法树进行对应的逻辑运算符转换或著录项拆分操作;6、分析器向目标专利检索平台进行查询,并将查询后的数据抓取到本地,供工作人员分析。本发明专利技术提高了专利检索的分析效率。

【技术实现步骤摘要】

本专利技术涉及一种检索方法,尤其涉及一种基于先行断言决策算法和LL递归下降法的检索分析器。
技术介绍
随着科技的发展,人们对知识产权的关注度也越来越高。有效分析和利用专利信息是企业专利管理中最基础的一环,贯穿企业的技术开发、专利申请、保护、运营等每一环节,因此企业应该建立完善的专利信息管理制度并充分利用辅助分析工具,为生产经营决策提供参考,为企业提高自主创新能力和参与国际竞争创造有利条件。现有的检索分析器常用的是专利检索语言分析器进行检索分析,存在的缺点是:分析速度较慢,且无法直观地展示检索表达式的结构,影响工作效率,制约了平台和软件在我国的使用和推广。
技术实现思路
本专利技术要解决的技术问题,在于提供一种基于先行断言决策算法和LL递归下降法的检索分析器,通过对LL递归下降法分析器的现状和技术特点进行分析,搭建专利检索领域语言词法分析器、语法分析器,为知识产权现代服务业提供可视化辅助分析工具。本专利技术是这样实现的:一种基于先行断言决策算法和LL递归下降法的检索分析器,包括如下步骤:步骤1、按照扩展巴科斯范式EBNF设计编写分析器的语法规则,将不同的检索表达式进行归纳,归纳出各种元素,每种元素具有对应的语法规则;步骤2、利用AntlrWorts2工具生成所述分析器的java源代码,将生成的java源代码进行编译;步骤3、调用Antlr的java类库解析检索表达式,Antlr进行解析时,如果错误发生,则立即停止解析,并对不符合语法规则的检索表达式进行一定的错误提示,告知错误所在的具体位置;否,则说明解析成功,进入步骤4;步骤4、将检索表达式解析成抽象语法树,获取当前抽象语法树的节点个数,对所有节点进行遍历,并通过可视化界面,将该抽象语法树中的各个节点与检索表达式的内容进行关联;通过点击该语法树中的各个节点,将节点对应的所述检索表达式的内容进行高亮;步骤5、使用某一检索表达式向所述分析器发起查询请求,由所述分析器将该检索表达式进行重构,在访问该抽象语法树所有节点的过程中,根据节点的类型进行检索表达式的重构,将该抽象语法树进行对应的逻辑运算符转换或著录项拆分操作;步骤6、重构后,所述分析器向目标专利检索平台进行查询,并将查询后的数据抓取到本地,供工作人员进行分析。进一步地,所述步骤5中该检索表达式进行重构的过程具体为:一个检索表达式解析成一个抽象语法树,检索表达式包括著录项表达式和条件表达式,著录项表达式包括著录项节点、连接符节点和操作符节点,条件表达式包括条件项节点、连接符节点和操作符节点,如果著录项表达式中的著录项节点个数为1,则该著录项表达式中不存在操作符节点,在输出时,直接将条件表达式中的操作符节点替换为对应的逻辑运算符;如果著录项表达式中的著录项节点个数为大于1,则该著录项表达式中存在操作符节点,先获取条件表达式,将条件表达式中的操作符节点替换为对应的逻辑运算符后存放于内存中作为条件,再获取著录项表达式,将著录项表达式中的操作符节点替换为对应的逻辑运算符,在各个著录项节点后通过著录项表达式中的连接符拼接上存放于内存中的条件,并通过对应的逻辑运算符进行连接。进一步地,所述步骤6中数据抓取的方式为:分析目标专利检索平台的数据结构及数据提交方式后,使用爬虫技术进行数据抓取。进一步地,所述步骤6中数据抓取的频率控制方式为:所述分析器还设置了一个任务队列,并利用线程池技术,控制发送过来的查询请求的顺序;同时,每次查询请求结束后,都设置一个暂停时间,防止抓取频率过快;如果查询请求被拒绝,所述分析器就将该任务标记为失败,先执行其他未开始的任务,待所有任务完成后,再重新开始继续所有被标记为失败的任务;每个失败任务的重试次数为n次。本专利技术具有如下优点:本专利技术为福建省企业专利管理员和知识产权服务从业人员提供了辅助分析工具,对福建省企业实施知识产权战略具有重大意义。向企业和知识产权服务人员推广应用该项目研究成果,能提高企业专利信息检索与应用水平,推动企业自身知识产权系统建设,帮助企业掌握专利数据库与专利分析系统的使用方法,从而全面提升福建省企事业单位知识产权信息利用水平。附图说明下面参照附图结合实施例对本专利技术作进一步的说明。图1为本专利技术方法执行流程图。具体实施方式为使得本专利技术更明显易懂,现以一优选实施例,并配合附图作详细说明如下。基于先行断言决策算法和LL递归下降法的检索分析器是基于开源项目Antlr进行研发。如图1所示,本专利技术的一种基于先行断言决策算法和LL递归下降法的检索分析器,包括如下步骤:步骤1、按照扩展巴科斯范式EBNF设计编写分析器的语法规则,将不同的检索表达式进行归纳,归纳出各种元素,每种元素具有对应的语法规则,各个元素用伪EBNF简单表示如下:检索表达式:过滤表达式(逻辑运算符过滤表达式)*;过滤表达式:著录项(,著录项)*运算符条件(,条件)*;著录项表达式:标识符;条件表达式:“非”的任意字符“|标识符;标识符:[英文字母|数字|中文]+;即使个别检索表达式存在语法差异,但在设计分析器规则时只要确保上述元素都有对应规则,即可形成一套可切换可扩展的专利检索表达式分析体系;步骤2、利用AntlrWorts2工具生成所述分析器的java源代码,将生成的java源代码进行编译;步骤3、调用Antlr的java类库解析检索表达式,Antlr进行解析时,如果错误发生,则立即停止解析,并对不符合语法规则的检索表达式进行一定的错误提示,告知错误所在的具体位置;否,则说明解析成功,进入步骤4;步骤4、将检索表达式解析成抽象语法树,获取当前抽象语法树的节点个数,对所有节点进行遍历,并通过可视化界面,将该抽象语法树中的各个节点与检索表达式的内容进行关联;通过点击该语法树中的各个节点,将节点对应的所述检索表达式的内容进行高亮;步骤5、使用某一检索表达式向所述分析器发起查询请求,由所述分析器将该检索表达式进行重构,在访问该抽象语法树所有节点的过程中,根据节点的类型进行检索表达式的重构,将该抽象语法树进行对应的逻辑运算符转换或著录项拆分操作;该检索表达式进行重构的过程具体为:一个检索表达式解析成一个抽象语法树,检索表达式包括著录项表达式和条件表达式,著录项表达式包括著录项节点、连接符节点和操作符节点,条件表达式包括条件项节点、连接符节点和操作符节点,如果著录项表达式中的著录项节点个数为1,则该著录项表达式中不存在操作符节点,在输出时,直接将条件表达式中的操作符节点替换为对应的逻辑运算符;如果著录项表达式中的著录项节点个数为大于1,则该著录项表达式中存在操作符节点,先获取条件表达式,将条件表达式中的操作符节点替换为对应的逻辑运算符后存放于内存中作为条件,再获取著录项表达式,将著录项表达式中的操作符节点替换为对应的逻辑运算符,在各个著录项节点后通过著录项表达式中的连接符拼接上存放于内存中的条件,并通过对应的逻辑运算符进行连接;步骤6、重构后,所述分析器向目标专利检索平台进行查询,并将查询后的数据抓取到本地,供工作人员进行分析;其中,数据抓取的方式为:分析目标专利检索平台的数据结构及数据提交方式后,使用爬虫技术进行数据抓取;数据抓取的频率控制方式为:所述分析器还设置了一个任务队列,并利用线程池技术,控制发送过来的查询请求的顺序;同本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201610848455.html" title="基于先行断言决策算法和LL递归下降法的检索方法原文来自X技术">基于先行断言决策算法和LL递归下降法的检索方法</a>

【技术保护点】
一种基于先行断言决策算法和LL递归下降法的检索分析器,其特征在于:包括如下步骤:步骤1、按照扩展巴科斯范式EBNF设计编写分析器的语法规则,将不同的检索表达式进行归纳,归纳出各种元素,每种元素具有对应的语法规则;步骤2、利用AntlrWorts2工具生成所述分析器的java源代码,将生成的java源代码进行编译;步骤3、调用Antlr的java类库解析检索表达式,Antlr进行解析时,如果错误发生,则立即停止解析,并对不符合语法规则的检索表达式进行一定的错误提示,告知错误所在的具体位置;否,则说明解析成功,进入步骤4;步骤4、将检索表达式解析成抽象语法树,获取当前抽象语法树的节点个数,对所有节点进行遍历,并通过可视化界面,将该抽象语法树中的各个节点与检索表达式的内容进行关联;通过点击该语法树中的各个节点,将节点对应的所述检索表达式的内容进行高亮;步骤5、使用某一检索表达式向所述分析器发起查询请求,由所述分析器将该检索表达式进行重构,在访问该抽象语法树所有节点的过程中,根据节点的类型进行检索表达式的重构,将该抽象语法树进行对应的逻辑运算符转换或著录项拆分操作;步骤6、重构后,所述分析器向目标专利检索平台进行查询,并将查询后的数据抓取到本地,供工作人员进行分析。...

【技术特征摘要】
1.一种基于先行断言决策算法和LL递归下降法的检索分析器,其特征在于:包括如下步骤:步骤1、按照扩展巴科斯范式EBNF设计编写分析器的语法规则,将不同的检索表达式进行归纳,归纳出各种元素,每种元素具有对应的语法规则;步骤2、利用AntlrWorts2工具生成所述分析器的java源代码,将生成的java源代码进行编译;步骤3、调用Antlr的java类库解析检索表达式,Antlr进行解析时,如果错误发生,则立即停止解析,并对不符合语法规则的检索表达式进行一定的错误提示,告知错误所在的具体位置;否,则说明解析成功,进入步骤4;步骤4、将检索表达式解析成抽象语法树,获取当前抽象语法树的节点个数,对所有节点进行遍历,并通过可视化界面,将该抽象语法树中的各个节点与检索表达式的内容进行关联;通过点击该语法树中的各个节点,将节点对应的所述检索表达式的内容进行高亮;步骤5、使用某一检索表达式向所述分析器发起查询请求,由所述分析器将该检索表达式进行重构,在访问该抽象语法树所有节点的过程中,根据节点的类型进行检索表达式的重构,将该抽象语法树进行对应的逻辑运算符转换或著录项拆分操作;步骤6、重构后,所述分析器向目标专利检索平台进行查询,并将查询后的数据抓取到本地,供工作人员进行分析。2.根据权利要求1所述的一种基于先行断言决策算法和LL递归下降法的检索分析器,其特征在于:所述步骤5中该检索表达式进行重构的过程具体为:一个检索表达式解析成一个抽象语法树,...

【专利技术属性】
技术研发人员:林俊黄雄杰陈鹏陈平
申请(专利权)人:福建省知识产权信息公共服务中心
类型:发明
国别省市:福建;35

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1