一种基于模糊集合模型的大数据专利检索方法技术

技术编号:17033044 阅读:65 留言:0更新日期:2018-01-13 19:29
本发明专利技术公开了一种基于模糊集合模型的大数据专利检索方法,属于大数据专利检索技术领域。该方法基于模糊集合检索模型,对传统的布尔检索模型进行改进,用户利用模糊索引和精确索引提交专利检索词,将用户检索词的布尔表达式转化为等价的析取范式形式:同时根据析取范式排除一定不相关的文档,确定可能相关文档集合,然后利用经典数据库中的材料,确定每个析取范式对应的模糊文档集合,并计算出隶属于模糊文档集合的隶属值,最后进行用户检索匹配函数和匹配值计算,用户根据呈现的结果,选择所需专利,或者进行二次检索过滤,再次重复上述过程。该方法能够避免传统专利检索方法中检索式构造的非友善性和的二值匹配相关性。

【技术实现步骤摘要】
一种基于模糊集合模型的大数据专利检索方法
本专利技术涉及一种大数据专利检索方法,属于专利检索
,具体涉及一种基于模糊集合模型的大数据专利检索方法。
技术介绍
20世纪80年代以来,随着世界经济的发展和新技术革命的到来,专利文献作为一种既可以体现科技创新力,又可以保护科研成果不受侵犯的科技法律文献,其重要性越来越受到重视。据世界知识产权组织(WorldIntellectualPropertyOrganization)报道,专利文献包含全世界每年90%~95%的最新科研成果,其中有70%左右的专利技术技术从未在其他非专利文献上发表。专利文献指导技术创新,将可以节约40%的研究经费和60%的研究时间,专利已经成为了企业科技创新和投资者商业战略决策的重要科技参考文献。中国专利数据截止到2013年底达到了600万条,超过了美国和日本,跃居世界第一。面对如此大量的专利信息,用户获取有价值信息的代价也越来越高,正是这种需求导致了专利数据各种研究工作的开展以及各种商业专利服务平台的出现。相对传统文本而言,专利文献有其特殊性,主要表现在5个方面:(1)复杂性。专利文献记载着技术解决方案,确定了专本文档来自技高网...
一种基于模糊集合模型的大数据专利检索方法

【技术保护点】
一种基于模糊集合模型的大数据专利检索方法,其特征在于,所述方法包括如下步骤:步骤S1:用户结合模糊索引和精确索引提交专利检索词,将用户检索词的布尔表达式转化为等价的析取范式形式:q=q1Vq2V……Vqt其中,q为析取范式,t为含有的合取子项的个数,V代表合取子项的并集;步骤S2:根据析取范式q,排除一定不相关的专利文档,确定可能相关专利文档集合D;步骤S3:利用经典专利数据库中的材料,确定每个析取范式qi对应的模糊专利文档集合Di;步骤S4:遍历集合D中的专利文档,对数据库中专利文档dj计算出dj隶属于模糊专利文档集合Di的隶属值ωij;步骤S5:对专利数据库中文档dj和析取范式q定义用户检...

【技术特征摘要】
1.一种基于模糊集合模型的大数据专利检索方法,其特征在于,所述方法包括如下步骤:步骤S1:用户结合模糊索引和精确索引提交专利检索词,将用户检索词的布尔表达式转化为等价的析取范式形式:q=q1Vq2V……Vqt其中,q为析取范式,t为含有的合取子项的个数,V代表合取子项的并集;步骤S2:根据析取范式q,排除一定不相关的专利文档,确定可能相关专利文档集合D;步骤S3:利用经典专利数据库中的材料,确定每个析取范式qi对应的模糊专利文档集合Di;步骤S4:遍历集合D中的专利文档,对数据库中专利文档dj计算出dj隶属于模糊专利文档集合Di的隶属值ωij;步骤S5:对专利数据库中文档dj和析取范式q定义用户检索匹配函数,并输出匹配值;步骤S6:通过匹配值的大小排序,向用户输出前N个专利文档结果;步骤S7:用户根据呈现的结果,选择所需专利文档,或者进行二次检索过滤,再次重复上述过程。2.根据权利要求1所述的一种基于模糊集合模型的大数据专利检索方法,其特征在于,步骤S3中所述经典数据库为国家知识产权局专利数据库、国际专利数据库、美国专利数据库、日本专利数据库;并可根据专利类别进一步限定为发明专利数据库、发明专利数据库和外观设计专利数据库。3.根据权利要求1所述的一种基于模糊集合模型的大数据专利检索方法,其特征在于,步骤S4中所述隶属值ωij计算方法如下:首先定义索引词关联矩阵:以索引词集合K中的元素作为行和列,索引词之间语义关系...

【专利技术属性】
技术研发人员:盛时永
申请(专利权)人:合肥集知网知识产权运营有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1