一种专利数据挖掘系统及方法技术方案

技术编号:26730644 阅读:18 留言:0更新日期:2020-12-15 14:31
本发明专利技术提供一种专利数据挖掘系统,包括与专利数据库连接的服务器,其特征在于:所述服务器包括关键词输入模块、专利检索模块、专利筛选模块、专利文件提取模块、专利分类模块、技术抓取模块、基础模型模块、逆向检索模型模块、技术收集模型模块和专利分析模块。本发明专利技术提高了专利技术人员的感应效果。

【技术实现步骤摘要】
一种专利数据挖掘系统及方法
本专利技术涉及专利技术挖掘领域,尤其涉及一种专利数据挖掘系统及方法。
技术介绍
随着我国科学技术的快速发展和人们知识产权保护意识的增强,越来越多的企业、机构、个人愿意用法律保护他们的技术和产品、品牌、作品,通过申请专利、商标、版权来获取保护。知识产权在进行申请保护过程中,大部分都是现有专利工程师根据所涉及领域和关键词进行人工检索,而专利工程师检索专利时,往往只检索一些授权的专利,很少会检索无效的专利,尤其是经过复审无效的专利,因为经过复审无效的专利,相对来说,它的技术创新程度可能不是太够,但是,因为它能够进入复审无效状态,说明了它还是有一定的市场价值空间,也就是说它的技术跟实际的应用是比较接近的,可以从中了解最接近这个行业现状的技术、产品、工艺或配方等,对这个行业有个大概的把握,然后从这些专利当中筛选出关键技术词(包括工艺、参数或数据等),在反过来进行逆向检索,检索这些关键技术词的空白区以及收集这些关键技术词之间的交叉重合区,然后分析空白区和交叉重合区,空白区可以说是目前还没有技术的,而交叉重合区是比较符合行业实际的。经检索发现,专利申请号CN201110432218.0的专利技术专利,公开了一种专利信息呈现方法及系统,包括:S10,创建专利列表窗口及若干个与专利列表窗口关联以分别呈现不同专利信息的子窗口;S20,下载并存储专利信息,所述专利信息中的所有专利以列表方式呈现在专利列表窗口;S30,在专利列表窗口选择要查看的专利及子窗口;S40,所述子窗口自专利信息数据库获取其所要呈现的信息内容并呈现于其中,以方便用户的浏览查看。专利申请号:CN201010217459.9的专利技术专利,公开了一种专利信息分析方法及装置,用以实现专利信息分析的可扩展性。专利信息分析方法,包括:接收用户发起的针对特定的分析模板的分析指令;根据所述分析指令从配置的至少一个分析模板中提取该特定的分析模板,所述分析模板用于定义分析项目和度量指标;通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,并根据该特定的分析模版定义的度量指标,查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;将得到的分析结果呈现给用户。专利申请号:CN201210579351.3的专利技术专利,公开了一种信息呈现方法和装置,其中在信息呈现方法中,通过提取数据集的属性信息;选择属性信息中的三个维度,分别作为三维空间的X轴、Y轴和Z轴;为数据集中的每个样本数据,确定对应的三维坐标;将每个样本数据显示在由所述X轴、Y轴和Z轴构成的三维空间中。由于将平面数据以三维方式进行呈现,从而便于用户了解样本数据之间的相关度和聚集度。提高了用户的感知效果。专利申请号:CN200910216835.X的专利技术专利,公开了一种专利检索方法和系统,包括:获取用户的专利检索请求;从所述专利检索请求中读取用户的专利检索条件;判断所述专利检索条件是否为系统定期进行后台检索所用的专利检索条件;如果是,将系统定期进行后台检索的检索结果提供给用户;否则,则根据用户的专利检索条件进行检索,并将检索结果提供给用户。本专利技术技术方案通过预先为系统设置相关的专利检索条件,并定期进行后台检索,从而在收到用户的检索请求时,能够将系统按照预先设置的相关检索条件定期进行后台检索的检索结果提供给用户,大大缩减了用户的等待时间。综合上述所述我们可以看出,目前,市面还是比较缺少专利挖掘这方面的数据,因此,我们有必要解决这一类的问题,以便于专利技术人员对专利技术的挖掘。
技术实现思路
本专利技术的目的在于克服现有技术存在的以上问题,提供一种专利数据挖掘系统及方法,本专利技术通过检索分析专利数据库中复审无效的专利,研究其关键技术词语出现频次最多以及逆向检索中的空白区,从而便于专利技术人员挖掘数据之间的相关度和聚集度。提高了专利技术人员的感应效果。为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现:一种专利数据挖掘系统,包括与专利数据库连接的服务器,所述服务器包括关键词输入模块、专利检索模块、专利筛选模块、专利文件提取模块、专利分类模块、技术抓取模块、基础模型模块、逆向检索模型模块、技术收集模型模块和专利分析模块,其中:关键词输入模块,用于输入目标技术的关键词语;专利检索模块,用于在专利数据库中检索输入的关键词语;专利筛选模块,用于在专利数据库中筛选出符合关键词语的专利复审无效信息的专利;专利文件提取模块,用于将专利复审无效信息的专利文件从数据库中提取出来;专利分类模块,用于将提取出来的专利文件按照专利类型进行分类;技术抓取模块,用于抓取各类专利文件中的技术部分;基础模型模块,用于将归类后的专利文件以及抓取后的技术部分生成数据基础模型图;技术收集模型模块,用于收集各类专利文件技术部分中的关键技术词语,并将其生成数据集合图;逆向检索模型模块,用于在专利数据库中逆向检索各类专利文件技术部分中的关键技术词语的,并将其进行逆向检索生成逆向检索图;专利分析模块,用于分析逆向检索图中无结果所对应的技术部分以及数据集合图中重合度最高所对应的技术部分。一种专利数据挖掘方法,该方法包括以下步骤,步骤1)通过关键词输入窗口输入需要检索的关键词语;步骤2)在专利数据库中检索带有关键词语的专利文件;步骤3)在专利文件中筛选出符合关键词语的复审无效的专利文件;步骤4)将复审无效的专利文件从数据库中提取出来;步骤5)将提取出来的专利文件按照专利类型进行分类;步骤6)抓取各类专利文件中的技术部分,并将抓取的技术部分与分类后的专利文件做成数据基础模型图;步骤7)收集各类专利文件中技术部分相同的关键技术词语,并将收集到的关键技术词语归类到数据基础模型图中统计其关键技术词语出现的频次;步骤8)分析各类专利文件中的技术部分,并将技术部分内的关键技术词语在数据库中进行逆向检索;步骤9)将逆向检索的关键技术词语以及逆向检索的结果归类到数据基础模型图中;步骤10)分析步骤7中出现重合度最高的关键技术词语以及步骤9中没有检索到的逆向关键技术词语。作为优选,所述关键词语包括产品名称或技术特征。作为优选,所述关键技术词语为权利要求书中带有“序号”的词语以及权利要求书中“包括、所述、和、通过、设置有、与和连接”等词的后面和/或前面的词语。作为优选,所述专利类型包括产品专利、工艺专利、方法专利、配方专利和/或零部件总成专利;其中,产品专利就是以产品结构为主的专利;零部件总成就是由各种零件组成的专利。作为优选,所述技术部分包括专利文件中的权利要求书或专利文件中描述结构、工艺、方法、配方和零部件总成的部分。作为优选,所述数据基础模型图用于显示各类专利文件以及各类专利文件所对应的技术部分。作为优选,所述逆向检索图用于在数据基础模型图中显示各类专利文件逆向检索的关键本文档来自技高网
...

【技术保护点】
1.一种专利数据挖掘系统,包括与专利数据库连接的服务器,其特征在于:所述服务器包括关键词输入模块、专利检索模块、专利筛选模块、专利文件提取模块、专利分类模块、技术抓取模块、基础模型模块、逆向检索模型模块、技术收集模型模块和专利分析模块,其中:/n关键词输入模块,用于输入目标技术的关键词语;/n专利检索模块,用于在专利数据库中检索输入的关键词语;/n专利筛选模块,用于在专利数据库中筛选出符合关键词语的专利复审无效信息的专利;/n专利文件提取模块,用于将专利复审无效信息的专利文件从数据库中提取出来;/n专利分类模块,用于将提取出来的专利文件按照专利类型进行分类;/n技术抓取模块,用于抓取各类专利文件中的技术部分;/n基础模型模块,用于将归类后的专利文件以及抓取后的技术部分生成数据基础模型图;/n技术收集模型模块,用于收集各类专利文件技术部分中的关键技术词语,并将其生成数据集合图;/n逆向检索模型模块,用于在专利数据库中逆向检索各类专利文件技术部分中的关键技术词语的,并将其进行逆向检索生成逆向检索图;/n专利分析模块,用于分析逆向检索图中无结果所对应的技术部分以及数据集合图中重合度最高所对应的技术部分。/n...

【技术特征摘要】
1.一种专利数据挖掘系统,包括与专利数据库连接的服务器,其特征在于:所述服务器包括关键词输入模块、专利检索模块、专利筛选模块、专利文件提取模块、专利分类模块、技术抓取模块、基础模型模块、逆向检索模型模块、技术收集模型模块和专利分析模块,其中:
关键词输入模块,用于输入目标技术的关键词语;
专利检索模块,用于在专利数据库中检索输入的关键词语;
专利筛选模块,用于在专利数据库中筛选出符合关键词语的专利复审无效信息的专利;
专利文件提取模块,用于将专利复审无效信息的专利文件从数据库中提取出来;
专利分类模块,用于将提取出来的专利文件按照专利类型进行分类;
技术抓取模块,用于抓取各类专利文件中的技术部分;
基础模型模块,用于将归类后的专利文件以及抓取后的技术部分生成数据基础模型图;
技术收集模型模块,用于收集各类专利文件技术部分中的关键技术词语,并将其生成数据集合图;
逆向检索模型模块,用于在专利数据库中逆向检索各类专利文件技术部分中的关键技术词语的,并将其进行逆向检索生成逆向检索图;
专利分析模块,用于分析逆向检索图中无结果所对应的技术部分以及数据集合图中重合度最高所对应的技术部分。


2.根据权利要求1所述的一种专利数据挖掘系统,其特征在于:所述关键词语包括产品名称或技术特征。


3.根据权利要求1所述的一种专利数据挖掘系统,其特征在于:所述关键技术词语为权利要求书中带有“序号”的词语以及权利要求书中“包括、所述、和、通过、设置有、与和连接”等词的后面和/或前面的词语。


4.根据权利要求1所述的一种专利数据挖掘系统,其特征在于:所述专利类型包括产品专利、工艺专利、方法专利、配方专利和/或零部件总成专利;其中,产品专利就是以产品结构为主的专利;零部件总成就是由各种零件组成的专利。


5.根据权利要求1所述的一种专利数据挖...

【专利技术属性】
技术研发人员:王和祥
申请(专利权)人:苏州显知禾创科技服务有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1