System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于专利技术图谱的查新方法技术_技高网

一种基于专利技术图谱的查新方法技术

技术编号:41085321 阅读:4 留言:0更新日期:2024-04-25 13:47
本发明专利技术提出了一种基于专利技术图谱的查新方法,主要步骤为:针对专利文本的技术关键词提取;专利技术图谱生成;专利技术图谱相似度计算;基于加权融合相似度的查新方法。通过神经网络对专利文本进行分段式的分析,然后通过分段的关联属性生成专利技术图谱,对图谱通过图神经网络对于两篇专利文本进行相似度对比,这种查新方式能够快速有效的解决相同的专业技术不同的表达造成的专利难以进行查新的问题,节省查新时间,提高查新效率,减少资源的消耗。

【技术实现步骤摘要】

本专利技术涉及计算机,特别涉及一种基于专利技术图谱的查新方法


技术介绍

1、在当前科技飞速发展的时代,有创新有新意的技术方法层出不穷,为了尽量的避免重复专利技术、确定技术前景、确保创新的有效性,对于专利的申请量在不断增长,专利的查新工作的难度也在逐渐增长。其中工作的重点就是新申请的专利的查新功能。

2、新专利在申请时需要进行专利的查新,对于现在的查新方法对于专利文本的相似度查询上有很多不足,之前的文本相似度查询更多的是针对于文本本身的行文以及重复的内容的查询,而忽略了对于相同的技术方法进行不同的表达时也存在很大的相似度,在查新方面通过一些专利范围和查重的筛选后,还有很多的相似专利,为了达到专利的保护性,还需要大量的人工检查和分析。

3、现有技术通过专利接收输入的科技项目的标识信息,根据所述标识信息在预设专利数据库中查询与所述标识信息匹配的多维度专利信息。根据所述多维度专利信息,生成所述科技项目对应的专利图谱。根据所述标识信息在预设专利数据库中查询与所述标识信息匹配的多维度专利信息,根据权利要求所述的方法,所述多维度专利信息包括:科技项目对应的当前已申请的专利信息﹑科技项目对应的专利申请指标信息﹑科技项目对应的当前已完成的专利检索分析报告信息﹑科技项目对应的专利检索分析报告指标信息,生成所述科技项目对应的专利图谱,进行专利的查新。然而,此项技术所需要的属性数据量极大,整理出来需要的成本极高。

4、对于专利的查新维度大多不在具体的专利文本中,分析的维度多为专利所携带的属性,比如领域、专利地域、专利类型等等,重点不在于对于专利文本的分析,所以对于专利文本的重复性查询效果不好。


技术实现思路

1、针对上述问题,第一方面,本专利技术一种基于专利技术图谱的查新方法,包括下述步骤:

2、提取针对专利文本的技术关键词;

3、生成专利技术图谱;

4、计算专利技术图谱相似度;

5、基于加权融合相似度确定最佳取值。

6、在上述方案的基础上,所述技术关键词的提取方法是一种基于聚类的无监督专利关键词提取方法,具体为:

7、执行预处理操作,获得专利文本和所属
中所有单词的词向量;

8、计算专利中每个专利
的单词的词向量的算术平均值:

9、基于专利向量对使用birch聚类算法将相关专利进行自动聚类,计算每个专利簇的簇心向量:

10、根据词向量模型将专利文本部分中的每个候选单词转换为向量,使用在聚类模块中训练的birch聚类模型来预测专利的类别,找到对应专利簇的簇心向量;

11、利用余弦相似度计算候选单词的词向量与簇心之间的相似度:

12、提取出专利中相似度最高的前n个词作为专利的技术关键词。

13、在上述方案的基础上,所述专利技术图谱的生成方法具体为:

14、通过多层的全连接神经网络训练一个通过专利文本总字数应选择的取词范围以及应筛选初始图谱头实体词的数量以及应筛选的图的尾实体的数量;

15、计算专利文本内的词的关系数量,其计算原则为单个范围能关系数量最多算一次;

16、提取生成一个专业技术词库,进行总体专利词频的排序;

17、通过排序把已获得的技术词汇再进行加权平均排序得到图谱中头节点筛选,按照点的权重值排序;

18、在单篇专利文本中关系较强的个头实体词数量通过专利文本和文本的词频以及关键词分类结合训练的神经网络进行筛选;

19、通过已选择的图谱头实体词,按照图状关系加入到预先建立的图计算技术体系中,建立初始专利技术图谱;

20、通过关系对相关联词汇进行排序,通过关系的数量初步选择前50%的节点,使用ntn神经网络结合初步选择后的尾结点和该点与其他尾节点的关系进行加权计算排序,选择权重较高的60%进行选取;

21、将尾结点加入图谱后,进行全图谱的关系连接,生成技术图谱。

22、在上述方案的基础上,所述计算专利技术图谱相似度具体为:

23、用simgnn图神经网络中图形级嵌入交互技术,计算相似度s1,把连接关系作为simgnn中的attention中的关系点,计算单个图的点的嵌入向量;

24、计算对于两篇不同专利文献对应的两个专利技术图谱的点的相似度。

25、在上述方案的基础上,所述相似度包括基于ipc分类号的相似度,基于技术关键词的相似度,基于专利图谱的相似度;

26、分别确定一个相似度阈值;

27、当2个文本间的3个相似度值中至少有2个大于对应阈值时,认为两者可能相似,则进行加权融合以及相似度计算,否则认为两者不相似;

28、通过线性加权融合方法计算相似度值;

29、通过调节权重因子确定最佳取值组合。

30、第二方面,提供一种电子装置,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面中所述的方法的步骤。

31、第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中所述的方法的步骤。

32、第四方面,提供一种基于专利技术图谱的查新装置,包括多个处理模块以及控制器;

33、所述多个处理模块具体为:

34、第一处理模块,用于提取针对专利文本的技术关键词;

35、第二处理模块,用于生成专利技术图谱;

36、第三处理模块,用于计算专利技术图谱相似度;

37、第四处理模块,基于加权融合相似度确定最佳取值。

38、本专利技术的有益效果:

39、本专利技术可以通过对于专利的专业词汇的相关联情况更深入的进行文本查新的功能,提高专利查新的效率。

本文档来自技高网...

【技术保护点】

1.一种基于专利技术图谱的查新方法,其特征在于,包括下述步骤:

2.如权利要求1所述的一种基于专利技术图谱的查新方法,其特征在于,所述技术关键词的提取方法是一种基于聚类的无监督专利关键词提取方法,具体为:

3.如权利要求1所述的一种基于专利技术图谱的查新方法,其特征在于,所述专利技术图谱的生成方法具体为:

4.如权利要求1所述的一种基于专利技术图谱的查新方法,其特征在于,所述计算专利技术图谱相似度具体为:

5.如权利要求1所述的一种基于专利技术图谱的查新方法,其特征在于,所述相似度包括基于IPC分类号的相似度,基于技术关键词的相似度,基于专利图谱的相似度;

6.一种电子装置,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。

7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。

8.一种基于专利技术图谱的查新装置,其特征在于,包括多个处理模块以及控制器;

...

【技术特征摘要】

1.一种基于专利技术图谱的查新方法,其特征在于,包括下述步骤:

2.如权利要求1所述的一种基于专利技术图谱的查新方法,其特征在于,所述技术关键词的提取方法是一种基于聚类的无监督专利关键词提取方法,具体为:

3.如权利要求1所述的一种基于专利技术图谱的查新方法,其特征在于,所述专利技术图谱的生成方法具体为:

4.如权利要求1所述的一种基于专利技术图谱的查新方法,其特征在于,所述计算专利技术图谱相似度具体为:

5.如权利要求1所述的一种基于专利技术图谱的查新方...

【专利技术属性】
技术研发人员:刘建毅於素德胡泊
申请(专利权)人:北京卫平科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1