一种基于关键词检索的目标数据库优化方法和装置制造方法及图纸

技术编号:24708122 阅读:100 留言:0更新日期:2020-06-30 23:59
本发明专利技术提供了一种基于关键词检索的目标数据库优化方法和装置,通过根据第一专利文献确定第一核心关键词获得第一专利数据库;根据第一核心关键词对第一专利数据库中各专利文献出现的频率排序;根据检索排序获得第一去噪指令,根据第一专利文献,获得第一分类号信息;根据第一分类号信息,获得第二分类号信息;利用第一、第二分类号信息对第二专利数据库进行检索,获得第四专利数据库;根据第四专利数据库,获得第一优化指令将所述第四专利数据库恢复至所述第三专利数据库中,解决需要依托专业人士进行专利检索处理分析,过程复杂存在检索结果不准确的技术问题。达到了自动检索去噪效验的全面优化过程,提高了检索结果的准确性的技术效果。

【技术实现步骤摘要】
一种基于关键词检索的目标数据库优化方法和装置
本专利技术涉及数据处理
,尤其涉及一种基于关键词检索的目标数据库优化方法和装置。
技术介绍
随着社会制度的不断发展与完善,专利文献数量的迅速增加,使得各国企业对于专利权的保护越来越重视。对于企业而言,如何从大量的专利文献中精确地检索并分析出满足自身需求的信息,对整个企业的发展至关重要。知识经济时代,知识产权作为一个企业乃至国家提供核心竞争力的战略资源,凸显出前所未有的重要性。专利含有大量的技术信息,用户通过对相关专利进行检索分析,可获知当前
内的技术发展趋势,从而对后期研发提供方向,并可以规避侵权风险。专利文献检索是企业全面了解现有技术,提高研发起点,规避知识产权风险的基础工作。由于网上公开的原始专利数据信息不全、语言晦涩、冗长难懂,企业如果不掌握专业的检索方法和技能,检索存在困难。但本专利技术申请人发现现有技术至少存在如下技术问题:现有技术中需要依托专业人士进行专利检索处理分析,且过程复杂,存在检索结果不准确的技术问题。
技术实现思路
本专利技术实施例提供了一种基于关键词检索的目标数据库优化方法和装置,解决了现有技术中需要依托专业人士进行专利检索处理分析,且过程复杂,存在检索结果不准确的技术问题。鉴于上述问题,提出了本申请实施例以便提供一种基于关键词检索的目标数据库优化方法和装置。第一方面,本专利技术提供了一种基于关键词检索的目标数据库优化方法,所述方法包括:根据第一专利文献,确定第一核心关键词,并根据所述第一核心关键词从专利检索数据库中进行检索,获得第一专利数据库;根据所述第一核心关键词,对所述第一专利数据库中进行检索排序,获得所述第一核心关键词在所述第一专利数据库中的各专利文献出现的频率序列;根据所述检索排序,获得第一去噪指令,所述第一去噪指令用于根据预定条件对所述检索排序中不满足所述预定条件的第二专利数据库进行删除,获得第三专利数据库;根据所述第一专利文献,获得第一分类号信息;根据所述第一分类号信息,获得第二分类号信息;利用所述第一分类号信息、第二分类号信息对所述第二专利数据库进行检索,获得第四专利数据库;根据所述第四专利数据库,获得第一优化指令,所述第一优化指令用于将所述第四专利数据库恢复至所述第三专利数据库中,获得第五专利数据库为目标数据库。优选的,所述根据第一专利文献,确定第一核心关键词,包括:根据所述第一专利文献,获得第一核心词、第二核心词,其中,所述第一核心词与第二核心词不同;根据所述第一核心词从所述专利检索数据库中检索,获得第六专利数据库;根据所述第二核心词从所述专利检索数据库中检索,获得第七专利数据库;根据所述第一分类号信息和第二分类号信息分别对所述第六专利数据库、第七专利数据库进行检索,获得第三数量占比、第四数量占比;根据所述第三数量占比、第四数量占比,分别判断是否满足第一预定条件,确定所述第一核心关键词。优选的,所述根据所述第三数量占比、第四数量占比,分别判断是否满足第一预定条件,确定所述第一核心关键词,包括:判断所述第三数量占比是否满足所述第一预定条件,当所述第三数量占比满足所述第一预定条件时,将所述第一核心词确定为第一关键词;判断所述第四数量占比是否满足所述第一预定条件,当所述第四数量占比满足所述第一预定条件时,将所述第二核心词确定为第二关键词;根据所述第一关键词、第二关键词,判断所述第一关键词、第二关键词是否满足第一关联性;当所述第一关键词、第二关键词满足所述第一关联性时,将所述第一关键词、第二关键词确定为所述第一核心关键词。优选的,所述判断所述第一关键词、第二关键词是否满足第一关联性之后,包括:当所述第一关键词、第二关键词不满足第一关联性时,根据所述第三数量占比、第四数量占比判断大小,当所述第三数量占比大于所述第四数量占比时,将所述第一关键词确定为所述第一核心关键词;当所述第四数量占比大于所述第三数量占比时,将所述第二关键词确定为所述第一核心关键词。优选的,所述根据所述第一分类号信息,获得第二分类号信息,包括:根据所述第一分类号信息,获得第一属性;获得第二关联性;根据所述第一属性、第二关联性,获得所述第二分类号信息。第二方面,本专利技术提供了一种基于关键词检索的目标数据库优化装置,所述装置包括:第一获得单元,所述第一获得单元用于根据第一专利文献,确定第一核心关键词,并根据所述第一核心关键词从专利检索数据库中进行检索,获得第一专利数据库;第二获得单元,所述第二获得单元用于根据所述第一核心关键词,对所述第一专利数据库中进行检索排序,获得所述第一核心关键词在所述第一专利数据库中的各专利文献出现的频率序列;第三获得单元,所述第三获得单元用于根据所述检索排序,获得第一去噪指令,所述第一去噪指令用于根据预定条件对所述检索排序中不满足所述预定条件的第二专利数据库进行删除,获得第三专利数据库;第四获得单元,所述第四获得单元用于根据所述第一专利文献,获得第一分类号信息;第五获得单元,所述第五获得单元用于根据所述第一分类号信息,获得第二分类号信息;第六获得单元,所述第六获得单元用于利用所述第一分类号信息、第二分类号信息对所述第二专利数据库进行检索,获得第四专利数据库;第一执行单元,所述第一执行单元用于根据所述第四专利数据库,获得第一优化指令,所述第一优化指令用于将所述第四专利数据库恢复至所述第三专利数据库中,获得第五专利数据库为目标数据库。优选的,所述装置还包括:第七获得单元,所述第七获得单元用于根据所述第一专利文献,获得第一核心词、第二核心词,其中,所述第一核心词与第二核心词不同;第八获得单元,所述第八获得单元用于根据所述第一核心词从所述专利检索数据库中检索,获得第六专利数据库;第九获得单元,所述第九获得单元用于根据所述第二核心词从所述专利检索数据库中检索,获得第七专利数据库;第十获得单元,所述第十获得单元用于根据所述第一分类号信息和第二分类号信息分别对所述第六专利数据库、第七专利数据库进行检索,获得第三数量占比、第四数量占比;第一确定单元,所述第一确定单元用于根据所述第三数量占比、第四数量占比,分别判断是否满足第一预定条件,确定所述第一核心关键词。优选的,所述装置还包括:第二执行单元,所述第二执行单元用于判断所述第三数量占比是否满足所述第一预定条件,当所述第三数量占比满足所述第一预定条件时,将所述第一核心词确定为第一关键词;第三执行单元,所述第三执行单元用于所述第四数量占比是否满足所述第一预定条件,当所述第四数量占比满足所述第一预定条件时,将所述第二核心词确定为第二关键词;第一判断单元,所述第一判断单元用于根据所述第一关键词、第二关键词,判断所述第一关键词、第二关键词是否满足第一关联性;第二确定单元,所述第二确定单元用于当所述第一关键词、第二关键词满足所述第一关联性时,将所述第一关键词、第二关键词确定为所述第一核心关键词。优选的,所述装置还包括:本文档来自技高网...

【技术保护点】
1.一种基于关键词检索的目标数据库优化方法,其特征在于,所述方法包括:/n根据第一专利文献,确定第一核心关键词,并根据所述第一核心关键词从专利检索数据库中进行检索,获得第一专利数据库;/n根据所述第一核心关键词,对所述第一专利数据库中进行检索排序,获得所述第一核心关键词在所述第一专利数据库中的各专利文献出现的频率序列;/n根据所述检索排序,获得第一去噪指令,所述第一去噪指令用于根据预定条件对所述检索排序中不满足所述预定条件的第二专利数据库进行删除,获得第三专利数据库;/n根据所述第一专利文献,获得第一分类号信息;/n根据所述第一分类号信息,获得第二分类号信息;/n利用所述第一分类号信息、第二分类号信息对所述第二专利数据库进行检索,获得第四专利数据库;/n根据所述第四专利数据库,获得第一优化指令,所述第一优化指令用于将所述第四专利数据库恢复至所述第三专利数据库中,获得第五专利数据库为目标数据库。/n

【技术特征摘要】
1.一种基于关键词检索的目标数据库优化方法,其特征在于,所述方法包括:
根据第一专利文献,确定第一核心关键词,并根据所述第一核心关键词从专利检索数据库中进行检索,获得第一专利数据库;
根据所述第一核心关键词,对所述第一专利数据库中进行检索排序,获得所述第一核心关键词在所述第一专利数据库中的各专利文献出现的频率序列;
根据所述检索排序,获得第一去噪指令,所述第一去噪指令用于根据预定条件对所述检索排序中不满足所述预定条件的第二专利数据库进行删除,获得第三专利数据库;
根据所述第一专利文献,获得第一分类号信息;
根据所述第一分类号信息,获得第二分类号信息;
利用所述第一分类号信息、第二分类号信息对所述第二专利数据库进行检索,获得第四专利数据库;
根据所述第四专利数据库,获得第一优化指令,所述第一优化指令用于将所述第四专利数据库恢复至所述第三专利数据库中,获得第五专利数据库为目标数据库。


2.如权利要求1所述的方法,其特征在于,所述根据第一专利文献,确定第一核心关键词,包括:
根据所述第一专利文献,获得第一核心词、第二核心词,其中,所述第一核心词与第二核心词不同;
根据所述第一核心词从所述专利检索数据库中检索,获得第六专利数据库;
根据所述第二核心词从所述专利检索数据库中检索,获得第七专利数据库;
根据所述第一分类号信息和第二分类号信息分别对所述第六专利数据库、第七专利数据库进行检索,获得第三数量占比、第四数量占比;
根据所述第三数量占比、第四数量占比,分别判断是否满足第一预定条件,确定所述第一核心关键词。


3.如权利要求2所述的方法,其特征在于,所述根据所述第三数量占比、第四数量占比,分别判断是否满足第一预定条件,确定所述第一核心关键词,包括:
判断所述第三数量占比是否满足所述第一预定条件,当所述第三数量占比满足所述第一预定条件时,将所述第一核心词确定为第一关键词;
判断所述第四数量占比是否满足所述第一预定条件,当所述第四数量占比满足所述第一预定条件时,将所述第二核心词确定为第二关键词;
根据所述第一关键词、第二关键词,判断所述第一关键词、第二关键词是否满足第一关联性;
当所述第一关键词、第二关键词满足所述第一关联性时,将所述第一关键词、第二关键词确定为所述第一核心关键词。


4.如权利要求3所述的方法,其特征在于,所述判断所述第一关键词、第二关键词是否满足第一关联性之后,包括:
当所述第一关键词、第二关键词不满足第一关联性时,根据所述第三数量占比、第四数量占比判断大小,当所述第三数量占比大于所述第四数量占比时,将所述第一关键词确定为所述第一核心关键词;
当所述第四数量占比大于所述第三数量占比时,将所述第二关键词确定为所述第一核心关键词。


5.如权利要求1所述的方法,其特征在于,所述根据所述第一分类号信息,获得第二分类号信息,包括:
根据所述第一分类号信息,获得第一属性;
获得第二关联性;
根据所述第一属性、第二关联性,获得所述第二分类号信息。


6.一种基于关键词检索的目标数据库优化装置,其特征在...

【专利技术属性】
技术研发人员:邓梅
申请(专利权)人:江苏润桐数据服务有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1