System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于自学习策略的专利成果转化推荐方法及装置制造方法及图纸_技高网

一种基于自学习策略的专利成果转化推荐方法及装置制造方法及图纸

技术编号:40445206 阅读:8 留言:0更新日期:2024-02-22 23:06
一种基于自学习策略的专利成果转化推荐方法及装置,方法包括:获取专利数据集;从每个企业的专利中各抽取一件专利,组成训练集;采用多种方法计算所述训练集中每件专利的摘要文本与所述数据集中剩余专利的摘要文本的相似度;根据采用预设方法计算得到的所述相似度,将所述数据集中剩余专利按照降序排列,得到前m件专利组成样本组,每个样本的样本特征为采用多种方法计算得到的多个所述相似度;基于所述样本组对支持向量机排序模型进行训练;获取待转化专利文本,将所述待转化专利文本输入所述支持向量机排序模型,得到推荐企业结果;该方法不需要人工标注数据,且采用多种方法计算相似度,推荐结果准确率高。

【技术实现步骤摘要】

本专利技术涉及知识产权推荐算法。


技术介绍

1、专利转化是指将专利技术转化为具体的商业化产品或过程,以实现其经济价值和社会效益。我国目前的专利转化率较低,大部分专利不能直接转化为现实生产力。其中原因有专利信息传播不畅,拥有众多专利技术专利的高校不能及时找到合适的企业合作和转化成果。

2、许多学者研究了高校专利转化和技术转移。首先,采用机器学习算法测度最优转化预测方案,识别和预测专利成果转化的影响因素;或采用adaboost算法预测高校专利可转化的概率,然而上述两种方案只使用了一个领域的专利数据,专利样本较少;也有研究发现高校专利成果转化模式,专利技术特征、专利成熟度等影响高校专利转化模式;或梳理得到高校专利转化的典型模式与演化路径,并借由典型模式之间的对比分析以及模式演化路径的特点分析,构建了高校专利转化模式选择的影响机制及模型,得出了合作创新能促进专利转化的结论,但是也只停留在建议和理念阶段;也有相关研究使用专利内部的文本特征定性地估计专利价值,而后使用专利的外部转化条件挖掘专利转化的机会,但是并未给出将专利转化给哪家具体的企业。

3、总而言之,现有的专利成果转化方法需要人工标注数据,或者只分析了影响转化的因素,没有分析如果想提高转化率给高校推荐适合合作的企业。然而在实际操作过程中,用户是需要基于专利成果推荐合适的企业的,同时,对大量专利数据进行人工标注数据的成本过高,实行起来存在困难。

4、因此,如何提供一种可行性强的专利成果转化推荐方法,成为本领域亟待解决的技术问题。


<p>技术实现思路

1、为了解决上述技术问题,本专利技术提供了一种基于自学习策略的专利成果转化推荐方法及装置,该方法基于专利文本中包含的企业信息,不需要人工标注数据,只需要企业的专利集合,可以辅助高校做与哪个企业合作的决策,且采用多种方法计算相似度,推荐结果准确率高。

2、基于同一专利技术构思,本专利技术具有四个独立的技术方案:

3、1、一种基于自学习策略的专利成果转化推荐方法,包括:

4、获取专利数据集,所述专利文本数据集来自不同企业;

5、从每个企业的专利中各抽取一件专利,组成训练集;

6、采用多种方法计算所述训练集中每件专利的摘要文本与所述数据集中剩余专利的摘要文本的相似度;

7、对于所述训练集中的每个专利,根据采用预设方法计算得到的所述相似度,将所述数据集中剩余专利按照降序排列,得到前m件专利组成样本组,每个样本的样本特征为采用多种方法计算得到的多个所述相似度;

8、基于所述样本组对支持向量机排序模型进行训练;

9、获取待转化专利文本,将所述待转化专利文本输入所述支持向量机排序模型,得到推荐企业结果。

10、进一步地,所述多种方法包括:余弦相似度、dice系数、fuzzywuzzy算法、bert模型算法、bleu算法以及编辑距离算法。

11、进一步地,所述预设方法为bleu算法。

12、进一步地,基于所述样本组对支持向量机排序模型进行训练之前,包括如下对样本相关度标注的步骤:

13、在所述样本组中,将与所述训练集中专利来自相同企业的专利样本中相似度最高的专利文本a的相关度设为4,来自相同企业的其他专利文本相关度设为3,在不同企业且相似度比专利文本a高的专利相关度设为2,在不同企业且相似度比专利文本a低的专利相关度设为1。

14、进一步地,基于所述样本组对支持向量机排序模型进行训练,包括:

15、将相关度为4的专利文本作为测试样本,将相关度为1-3的专利文本作为训练样本。

16、进一步地,训练时,所述支持向量机排序模型的c值为500,核函数为多项式核函数。

17、进一步地,训练时,所述支持向量机排序模型的c值为100,核函数为线性核函数。

18、2、一种基于自学习策略的专利成果转化推荐装置,包括:

19、数据获取模块,用于获取专利数据集,所述专利文本数据集来自不同企业;

20、训练集建立模块,用于从每个企业的专利中各抽取一件专利,组成训练集;

21、相似度计算模块,用于采用多种方法计算所述训练集中每件专利的摘要文本与所述数据集中剩余专利的摘要文本的相似度;

22、样本建立模块,用于对于所述训练集中的每个专利,根据采用预设方法计算得到的所述相似度,将所述数据集中剩余专利按照降序排列,得到前m件专利组成样本组,每个样本的样本特征为采用多种方法计算得到的多个所述相似度;

23、训练模块,用于基于所述样本组对支持向量机排序模型进行训练;

24、推荐模块,用于获取待转化专利文本,将所述待转化专利文本输入所述支持向量机排序模型,得到推荐企业结果。

25、3、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法。

26、4、一种电子设备,包括处理器和存储装置,所述存储装置中存有多条指令,所述处理器用于读取所述存储装置中的多条指令并执行上述方法。

27、本专利技术提供的基于自学习策略的专利成果转化推荐方法及装置,至少包括如下有益效果:

28、(1)该方法采用了自学习策略的方式,帮助高校为专利技术专利寻找适合转化成果并投入实际应用的企业,促进高校与企业合作,提高成果转化率。使用自学习的方法得到专利成果转化模型,无需手动标注数据,只需要企业专利数据集合即可,成本较低操作方便;

29、(2)通过实验对比验证训练后可知,本方法采用多种方法来计算相似度,相比单种相似度方法的性能有提升效果,专利成果转化预测模型采用线性核函数c值取100时取得了较好的性能,预测适合转化成果的企业准确率达到69.4%。

本文档来自技高网
...

【技术保护点】

1.一种基于自学习策略的专利成果转化推荐方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述多种方法包括:余弦相似度、Dice系数、fuzzywuzzy算法、bert模型算法、Bleu算法以及编辑距离算法。

3.根据权利要求1所述的方法,其特征在于,所述预设方法为Bleu算法。

4.根据权利要求1所述的方法,其特征在于,基于所述样本组对支持向量机排序模型进行训练之前,包括如下对样本相关度标注的步骤:

5.根据权利要求4所述的方法,其特征在于,基于所述样本组对支持向量机排序模型进行训练,包括:

6.根据权利要求1所述的方法,其特征在于,训练时,所述支持向量机排序模型的C值为500,核函数为多项式核函数。

7.根据权利要求1所述的方法,其特征在于,训练时,所述支持向量机排序模型的C值为100,核函数为线性核函数。

8.一种基于自学习策略的专利成果转化推荐装置,其特征在于,包括:

9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一所述的方法。

10.一种电子设备,包括处理器和存储装置,其特征在于,所述存储装置中存有多条指令,所述处理器用于读取所述存储装置中的多条指令并执行如权利要求1-7任一所述的方法。

...

【技术特征摘要】

1.一种基于自学习策略的专利成果转化推荐方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述多种方法包括:余弦相似度、dice系数、fuzzywuzzy算法、bert模型算法、bleu算法以及编辑距离算法。

3.根据权利要求1所述的方法,其特征在于,所述预设方法为bleu算法。

4.根据权利要求1所述的方法,其特征在于,基于所述样本组对支持向量机排序模型进行训练之前,包括如下对样本相关度标注的步骤:

5.根据权利要求4所述的方法,其特征在于,基于所述样本组对支持向量机排序模型进行训练,包括:

6.根据权利要求1所述的方法,其特...

【专利技术属性】
技术研发人员:杨沐昀吴禹橦徐冰曹海龙朱聪慧赵铁军
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1