一种基于网络特征的专利技术质量分级方法及系统技术方案

技术编号:29256981 阅读:11 留言:0更新日期:2021-07-13 17:29
本发明专利技术公开了一种基于网络特征的专利技术质量分级方法,包括:S1:获取专利信息;S2:构建IPC分类号的有向加权网络;S3:计算网络的网络特征指标,衡量IPC分类号的新颖性和典型性;S4计算专利的新颖性和典型性,并以两者为依据将专利分为多类,最后根据被引数信息,为多类专利划分等级;S5:以网络特征指标为自变量,被引数为因变量进行回归分析,确定网络特征指标与被引数之间的关系。本发明专利技术还包括一种基于网络特征的专利技术质量分级方法系统,由数据获取与存储模块、网络构建模块、专利分级模块、被引数预测模块、用户界面组成。本发明专利技术不仅能对专利进行分级,还能预测新申请专利的未来被引数,可以为申请人有针对性地处理专利未来事项提供参考。

【技术实现步骤摘要】
一种基于网络特征的专利技术质量分级方法及系统
本专利技术涉及网络科学领域领域,尤其涉及一种基于网络特征的专利分级方法及系统。
技术介绍
随着科学技术的发展,上至国家,下至企业,都越来越注重对自己的高新技术的保护,其中保护技术的最重要的途径之一就是为技术申请专利。技术是个体专利技术者单独努力或者集体合作的结果,在专利制度出现之前,技术大多数都是以实物为载体向人们展示特点,专利制度出现后,技术又多了一种向人们展示其特点的载体——专利文件。专利文件能够有效展示专利技术的技术单元及技术单元间的组合方式、技术效果等有关信息,所以在研究专利技术技术的典型性以及新颖性时,往往使用具体的专利文件来替代抽象的专利技术技术。研究者在研究专利技术技术时,一般着重于专利技术技术价值的研究,而专利技术技术价值又与技术的典型性与新颖性紧密相连,两者共同决定了专利技术技术的最终价值,因此研究者在研究专利技术技术价值时更倾向于使用专利文件中的各个指标来衡量专利技术技术价值。公开号为CN110298545A的一种基于神经网络的专利评价方法、系统和介质专利公开了一种以神经网络和相似性计算和基础的专利技术质量评价方法。该方法首先以论文与专利之间的相似性为基础,同时将该相似性计算结果与论文的引用情况、论文发表时间、论文发表期刊、论文作者等多个因素输入神经网络进行训练,形成论文与评价专利之间的技术质量评价模型。这种方法需要的数据量非常大,同时计算过程十分复杂,计算用到的参数非常多,评估效率十分低下。公开号为CN109902168A的一种专利评价方法和系统专利公开了一种专利评价方法和系统,通过自然语言处理和复杂网络算法将专利以技术集群方式聚合,赋予专利科学技术属性,并置于全球同行业技术中进行评价。自然语言处理和复杂网络算法需要大量的数据进行训练,为了同全球同行业技术的专利进行比对,更是需要大量的时间来进行,算法效率依然十分低下。
技术实现思路
本专利技术要克服现有技术的上述缺点,提供一种基于网络特征的专利技术质量分级方法及系统,能更快地对专利进行分级,并对专利的被引数进行预测。为实现上述目的,本专利技术提供了如下方案:一种基于网络特征的专利技术质量分级方法,包括以下步骤:S1:从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中;S2:用数据库中的专利信息构建IPC分类号的有向加权网络;S3:计算S2步骤中构建的有向加权网络的网络特征指标,用网络特征指标来衡量IPC分类号的新颖性和典型性;S4:通过S3步骤计算出的网络特征指标计算专利的新颖性和典型性,并以两者为依据将数据库中的专利分为多类,最后根据每一类专利的被引数信息,为多类专利划分等级;S5:以S3步骤中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数。进一步地,步骤S2中构建有向加权网络的具体方法如下:网络中的源节点为每项专利中的主分类号,目标节点为每项专利中的除了主分类号以外的分类号,连边方向由源节点指向目标节点,连边权重为连边在有向加权网络中出现的次数。优选地,步骤S3中所述的网络特征指标包括节点的入度和出度,节点的入度表示IPC分类号的典型性,节点的出度的负数表示IPC分类号的新颖性。优选地,步骤S4具体包括:S4.1:专利新颖性和典型性的计算:具体方法如下:(1)对于只有一个分类号的专利,专利的新颖性等于分类号的新颖性,专利的典型性等于分类号的典型性;(2)对于具有两个及以上分类号的专利,专利的新颖性为其余分类号的平均新颖性,专利的典型性为主分类号的典型性;S4.2:根据计算得出的专利的新颖性和典型性,将专利分为四组,具体方法为:先为新颖性和典型性划定两个分界点,然后按照新颖性和典型性的高低,将专利分为低典型性低新颖性类,低典型性高新颖性类,高典型性低新颖性类,高典型性高新颖性类,然后计算每一类专利的高被引专利占比,其中高被引专利定义为被引数占同年所有专利被引数前5%的专利,根据高被引专利占比的高低,将所述四类专利分为I级—IV级专利。优选地,步骤S5中的自变量包括节点的入度和出度,多项式回归公式为:其中,ycp表示专利的被引数,xnov表示专利的新颖性,xcon表示专利的典型性,α0-α5表示等待确定的各项系数。一种基于网络特征的专利技术质量分级系统,包括数据获取与存储模块、网络构建模块、专利分级模块、被引数预测模块、用户界面;所述数据获取与存储模块从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中;所述网络构建模块通过数据库中的专利信息构建IPC分类号的有向加权网络,具体方法如下:网络中的源节点为每项专利中的主分类号,目标节点为每项专利中的除了主分类号以外的分类号,连边方向由源节点指向目标节点,连边权重为连边在有向加权网络中出现的次数;所述专利分级模块通过计算网络构建模块构建的有向加权网络的各项网络特征指标,衡量IPC分类号的新颖性和典型性,从而计算专利的新颖性和典型性,并以两者为依据将数据库中的专利分为多类,最后根据每一类专利的被引数信息,为多类专利划分等级;所述被引数预测模块以专利分级模块中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数,所述的数据获取与存储模块连接在网络构建模块之前,所述专利分级模块、被引数预测模块并联在网络构建模块之后。用户交互界面,用户在这个界面将新申请专利的IPC分类号输入,然后经过其他模块的计算,得出专利分级的结果和被引数的预测,用户根据本系统的结果,有针对性地处理这个新申请的专利。本专利技术的技术构思:通过将网络科学的知识引入到专利评价领域,将IPC分类号构建成有向加权的IPC分类号网络,由于这个分类号网络在构建的时候使用了专利内的IPC分类号信息,使得这个分类号网络可以反映在某个地区或国家内的技术单元使用情况,包括技术之间的配对或者单独使用。然后用网络特征指标来量化IPC分类号的新颖性与典型性,从而去计算专利技术特征的新颖性与典型性。然后根据专利技术特征的新颖性和典型性进行分组,计算每组的高被引专利占比,从而为几组专利进行分级。同时使用多项式回归分析专利技术特征的新颖性和典型性与被引数之间的关系,从而达到预测新申请的专利在未来受到的被引数的目的。本专利技术的有益效果:使用IPC分类号构建网络,基于专利的
角度出发分析专利技术特征的新颖性和典型性,使得计算出来的新颖性和典型性更加贴近专利实际上的新颖性和典型性,同时使用网络的方式计算网络特征指标,计算时间较之机器学习算法大大缩短。同时使用多项式回归分析确定专利技术特征新颖性和典型性与被引数之间存在的关系,从而使得新申请的专利可以使用申请专利时就具有的IPC分类号情况来预测专利未来可能会受到的被引数,从而为申请人对专利后续本文档来自技高网
...

【技术保护点】
1.一种基于网络特征的专利技术质量分级方法,其特征在于:包括以下步骤:/nS1:从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中;/nS2:用数据库中的专利信息构建IPC分类号的有向加权网络;/nS3:计算S2步骤中构建的有向加权网络的网络特征指标,用网络特征指标来衡量IPC分类号的新颖性和典型性;/nS4:通过S3步骤计算出的网络特征指标计算专利的新颖性和典型性,并以两者为依据将数据库中的专利分为多类,最后根据每一类专利的被引数信息,为多类专利划分等级;/nS5:以S3步骤中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数。/n

【技术特征摘要】
1.一种基于网络特征的专利技术质量分级方法,其特征在于:包括以下步骤:
S1:从互联网获取专利的各项信息,包括但不限于专利的IPC分类号、被引数等信息,储存在数据库中;
S2:用数据库中的专利信息构建IPC分类号的有向加权网络;
S3:计算S2步骤中构建的有向加权网络的网络特征指标,用网络特征指标来衡量IPC分类号的新颖性和典型性;
S4:通过S3步骤计算出的网络特征指标计算专利的新颖性和典型性,并以两者为依据将数据库中的专利分为多类,最后根据每一类专利的被引数信息,为多类专利划分等级;
S5:以S3步骤中计算出的网络特征指标为自变量,被引数为因变量进行多项式回归分析,确定网络特征指标与被引数之间的关系,用这个关系来预测新申请专利的未来被引数。


2.如权利要求1所述的一种基于网络特征的专利技术质量分级方法,其特征在于:步骤S2中构建有向加权网络的具体方法如下:网络中的源节点为每项专利中的主分类号,目标节点为每项专利中的除了主分类号以外的分类号,连边方向由源节点指向目标节点,连边权重为连边在有向加权网络中出现的次数。


3.如权利要求1所述的一种基于网络特征的专利技术质量分级方法,其特征在于:步骤S3中所述的网络特征指标包括节点的入度和出度,节点的入度表示IPC分类号的典型性,节点的出度的负数表示IPC分类号的新颖性。


4.如权利要求3所述的一种基于网络特征的专利技术质量分级方法,其特征在于:步骤S4具体包括:
S4.1:专利技术特征的新颖性和典型性的计算:具体方法如下:(1)对于只有一个分类号的专利,专利技术特征的新颖性等于分类号的新颖性,专利技术特征的典型性等于分类号的典型性;(2)对于具有两个及以上分类号的专利,专利技术特征的新颖性为其余分类号的平均新颖性,专利技术特征的典型性为主分类号的典型性;
S4.2:根据计算得出的专利技术特征的新颖性和典型性,将专利分为四组,具体方法为:先为新颖性和典型性划定两个分界点,然后按照新颖性和典型性的高低,将专利分为低典型性...

【专利技术属性】
技术研发人员:傅晨波邱君瀚岳昕晨潘星宇胡剑波罗浩耕余金隆
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1