一种基于数据挖掘的专利信息预测系统技术方案

技术编号:27194082 阅读:32 留言:0更新日期:2021-01-31 11:43
一种基于数据挖掘的专利信息预测系统,包括依次电连接的数据筛选模块、数据挖掘模块、数据分析模块和结果上传模块;其中:数据筛选模块从海量大数据中筛选出与关键词需求相关联的关键数据信息,数据挖掘模块基于预定规则,对关键数据信息进行数据挖掘,数据分析模块对挖掘结果进行分析,以得到关键词需求分析结果,结果上传模块将分析结果上传给服务平台以进行显示。整个导航过程实现了智能化,用智能化系统代替人工,在操作上相对简便,减少人力所耗费的时间和资源,加快了处理速度,提高效率,并且系统统计分析的结果更加精确,出错率减少。率减少。率减少。

【技术实现步骤摘要】
一种基于数据挖掘的专利信息预测系统


[0001]本专利技术涉及数据分析
,尤其是一种基于数据挖掘的专利信息预测系统。

技术介绍

[0002]随着我国科学技术的快速发展和人们知识产权保护意识的增强,越来越多的企业、机构、个人愿意用法律保护他们的技术和产品、品牌、作品,通过申请专利、商标、版权来获取保护。
[0003]知识产权在进行申请保护过程中,大部分都是现有专利工程师根据所涉及领域和关键词进行人工检索,而专利工程师检索专利时,往往只检索一些授权的专利,很少会检索无效的专利,尤其是经过复审无效的专利,因为经过复审无效的专利,相对来说,它的技术创新程度可能不是太够,但是,因为它能够进入复审无效状态,说明了它还是有一定的市场价值空间,也就是说它的技术跟实际的应用是比较接近的,可以从中了解最接近这个行业现状的技术、产品、工艺或配方等,对这个行业有个大概的把握,然后从这些专利当中筛选出关键技术词(包括工艺、参数或数据等),在反过来进行逆向检索,检索这些关键技术词的空白区以及收集这些关键技术词之间的交叉重合区,然后分析空白区和交叉重合区,空白区可以说是目前还没有技术的,而交叉重合区是比较符合行业实际的。
[0004]经检索发现,专利申请号CN201110432218.0的专利技术专利,公开了一种专利信息呈现方法及系统,包括:S10,创建专利列表窗口及若干个与专利列表窗口关联以分别呈现不同专利信息的子窗口;S20,下载并存储专利信息,所述专利信息中的所有专利以列表方式呈现在专利列表窗口;S30,在专利列表窗口选择要查看的专利及子窗口;S40,所述子窗口自专利信息数据库获取其所要呈现的信息内容并呈现于其中,以方便用户的浏览查看。
[0005]专利申请号:CN201010217459.9的专利技术专利,公开了一种专利信息分析方法及装置,用以实现专利信息分析的可扩展性。专利信息分析方法,包括:接收用户发起的针对特定的分析模板的分析指令;根据所述分析指令从配置的至少一个分析模板中提取该特定的分析模板,所述分析模板用于定义分析项目和度量指标;通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,并根据该特定的分析模版定义的度量指标,查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;将得到的分析结果呈现给用户。
[0006]专利申请号:CN201210579351.3的专利技术专利,公开了一种信息呈现方法和装置,其中在信息呈现方法中,通过提取数据集的属性信息;选择属性信息中的三个维度,分别作为三维空间的X轴、Y轴和Z轴;为数据集中的每个样本数据,确定对应的三维坐标;将每个样本数据显示在由所述X轴、Y轴和Z轴构成的三维空间中。由于将平面数据以三维方式进行呈现,从而便于用户了解样本数据之间的相关度和聚集度。提高了用户的感知效果。
[0007]专利申请号:CN200910216835.X的专利技术专利,公开了一种专利检索方法和系统,包括:获取用户的专利检索请求;从所述专利检索请求中读取用户的专利检索条件;判断所述专利检索条件是否为系统定期进行后台检索所用的专利检索条件;如果是,将系统定期进
行后台检索的检索结果提供给用户;否则,则根据用户的专利检索条件进行检索,并将检索结果提供给用户。本专利技术技术方案通过预先为系统设置相关的专利检索条件,并定期进行后台检索,从而在收到用户的检索请求时,能够将系统按照预先设置的相关检索条件定期进行后台检索的检索结果提供给用户,大大缩减了用户的等待时间。
[0008]综合上述所述我们可以看出,目前,市面还是比较缺少专利挖掘这方面的数据,因此,我们有必要解决这一类的问题,以便于专利技术人员对专利技术的挖掘。

技术实现思路

[0009]为了解决上述现有技术中存在的问题,本专利技术提供一种基于数据挖掘的专利信息预测系统。
[0010]本专利技术解决其技术问题所采用的技术方案是:
[0011]一种基于数据挖掘的专利信息预测系统,包括依次电连接的数据筛选模块、数据挖掘模块、数据分析模块和结果上传模块。其中:数据筛选模块从海量大数据中筛选出与关键词需求相关联的关键数据信息,数据挖掘模块基于预定规则,对关键数据信息进行数据挖掘,数据分析模块对挖掘结果进行分析,以得到关键词需求分析结果,结果上传模块将分析结果上传给服务平台以进行显示。
[0012]本专利技术还具有以下附加技术特征:
[0013]作为本专利技术技术方案进一步具体优化的:数据筛选模块包括关键词输入单元、专利检索单元、专利筛选单元、专利文件提取单元、专利分类单元、技术抓取单元和基础模型单元。
[0014]其中:
[0015]关键词输入单元,用于输入目标技术的关键词语。
[0016]专利检索单元,用于在专利数据库中检索输入的关键词语。
[0017]专利筛选单元,用于在专利数据库中筛选出符合关键词语的专利复审无效信息的专利。
[0018]专利文件提取单元,用于将专利复审无效信息的专利文件从数据库中提取出来。
[0019]专利分类单元,用于将提取出来的专利文件按照专利类型进行分类。
[0020]技术抓取单元,用于抓取各类专利文件中的技术部分。
[0021]基础模型单元,用于将归类后的专利文件以及抓取后的技术部分生成数据基础模型图。
[0022]作为本专利技术技术方案进一步具体优化的:数据挖掘模块包括关键词输入单元和数据挖掘计算单元。其中:
[0023]关键词输入单元包括基本关键词输入和高级关键词输入,基本关键词输入根据专利关键词、
、申请单位、专利权单位、专利技术人、申请时间、授权时间选项选择其中一种进行专利关键词输入。高级关键词输入根据专利关键词、
、申请单位、专利权单位、专利技术人、申请时间、授权时间选项选择其中多种组合进行专利关键词输入。
[0024]数据挖掘计算单元,使用Apriori数据挖掘算法。Apriori数据挖掘算法中在选择关键词输入单元(1)中基本关键词输入选项中最小支持度设置为S,且S=40%,最小置信度设置为P,且P=80%。Apriori数据挖掘算法中在选择关键词输入单元(1)中高级关键词输
入选项中最小支持度设置为S,且S=50%,最小置信度设置为P,且P=60%。
[0025]作为本专利技术技术方案进一步具体优化的:数据分析模块包括词频分析单元、语义分析单元、专利分析单元、文献分析单元、分析结果处理单元和数据挖掘单元。其中:
[0026]词频分析单元,用于对专利数据进行词频分析,将词频分析后的专利数据导入云计算专利数据库。
[0027]语义分析单元,用于对文献数据进行语义分析,将语义分析后的文献数据导入云计算文献数据库。
[0028]专利分析单元,用于对专利数据进行分析后,输出专利分析报告。
[0029]文献分析单元,用于对文献数据进行分析后,输出文献分析报告。
[0030]分析结果处理单元,用于处理专利分析报告和文献分析报本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据挖掘的专利信息预测系统,其特征在于,包括依次电连接的数据筛选模块、数据挖掘模块、数据分析模块和结果上传模块;其中:数据筛选模块从海量大数据中筛选出与关键词需求相关联的关键数据信息,数据挖掘模块基于预定规则,对关键数据信息进行数据挖掘,数据分析模块对挖掘结果进行分析,以得到关键词需求分析结果,结果上传模块将分析结果上传给服务平台以进行显示。2.根据权利要求1所述的一种基于数据挖掘的专利信息预测系统,其特征在于:数据筛选模块包括关键词输入单元、专利检索单元、专利筛选单元、专利文件提取单元、专利分类单元、技术抓取单元和基础模型单元;其中:关键词输入单元,用于输入目标技术的关键词语;专利检索单元,用于在专利数据库中检索输入的关键词语;专利筛选单元,用于在专利数据库中筛选出符合关键词语的专利复审无效信息的专利;专利文件提取单元,用于将专利复审无效信息的专利文件从数据库中提取出来;专利分类单元,用于将提取出来的专利文件按照专利类型进行分类;技术抓取单元,用于抓取各类专利文件中的技术部分;基础模型单元,用于将归类后的专利文件以及抓取后的技术部分生成数据基础模型图。3.根据权利要求1所述的一种基于数据挖掘的专利信息预测系统,其特征在于:数据挖掘模块包括关键词输入单元和数据挖掘计算单元;其中:关键词输入单元包括基本关键词输入和高级关键词输入,基本关键词输入根据专利关键词、技术领域、申请单位、专利权单位、发明人、申请时间、授权时间选项选择其中一种进行专利关键词输入;高级关键词输入根据专利关键词、技术领域、申请单位、专利权单位、发明...

【专利技术属性】
技术研发人员:曹亮李湘丽刘双印徐龙琴郭鹏飞付志文徐浩根
申请(专利权)人:仲恺农业工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1