System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 科技文献推荐方法、装置、电子设备及存储介质制造方法及图纸_技高网

科技文献推荐方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41327322 阅读:5 留言:0更新日期:2024-05-13 15:05
本发明专利技术提供一种科技文献推荐方法、装置、电子设备及存储介质,属于人工智能技术领域,所述方法包括:获取多篇科技文献的文本内容,并基于各科技文献的文本内容进行信息提取,得到多类型数据;基于多类型数据,构建异质图;将异质图输入至目标异质图学习模型,得到目标异质图学习模型输出的多个作者嵌入向量和多个第一文献嵌入向量;基于各作者嵌入向量和各第一文献嵌入向量进行科技文献推荐,得到各科技文献的作者对应的科技文献推荐结果。本发明专利技术提供的科技文献推荐方法,将研究方向数据与传统元数据结合为具有精细化数据的异质图,进而实现将更加精细化的描述数据作为枢纽挖掘文献与作者间的深层知识关联,从而提高科技文献推荐的准确性。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种科技文献推荐方法、装置、电子设备及存储介质


技术介绍

1、科技领域的知识在不断更新和发展,而科技文献是最直接的信息来源之一,通过科技文献推荐,可以了解到最新的研究成果、新发现、技术发展等重要信息。因此,科技文献推荐为学者提供了广泛且可靠的信息资源,帮助学者在科学研究中更加系统和有效地开展工作。

2、现有的科技文献推荐方法采用内容过滤的算法和基于网络结构图的推荐算法。但是,内容过滤的算法只检测相同属性或特征的项目之间的相似性,对于新的、缺乏关键词等内容特征的文献或没有太多研究经验的初级学者无法进行有效推荐,即会面临推荐的冷启动问题;基于网络结构图的推荐算法可以挖掘实体间深层次关系,但无法在很大程度将内容相关性、用户相关性考虑在内。因此,现有的科技文献推荐方法会导致科技文献推荐的准确性较低。


技术实现思路

1、本专利技术提供一种科技文献推荐方法、装置、电子设备及存储介质,用以解决现有技术中科技文献推荐的准确性低下的问题。

2、第一方面,本专利技术提供一种科技文献推荐方法,包括:

3、获取多篇科技文献的文本内容,并基于各科技文献的文本内容进行信息提取,得到多类型数据;所述多类型数据包括文献元数据和文献研究方向数据;所述文献元数据至少包括作者数据和文献数据;

4、基于多类型数据,构建异质图;

5、将所述异质图输入至目标异质图学习模型,得到所述目标异质图学习模型输出的多个作者嵌入向量和多个第一文献嵌入向量;所述目标异质图学习模型是基于多篇样本文献的文本内容中提取到的多类型样本数据进行训练得到的;

6、基于各作者嵌入向量和各第一文献嵌入向量进行科技文献推荐,得到各科技文献的作者对应的科技文献推荐结果。

7、在一个实施例中,所述基于各作者嵌入向量和各第一文献嵌入向量进行科技文献推荐,得到各科技文献的作者对应的科技文献推荐结果,包括:

8、对各科技文献的文本内容分别进行文本信息特征提取,得到多个第二文献嵌入向量;

9、基于各第一文献嵌入向量和各第二文献嵌入向量进行融合,得到多个目标文献嵌入向量;

10、基于各目标文献嵌入向量和各作者嵌入向量进行相似度计算,得到各科技文献的作者对应的科技文献推荐结果。

11、在一个实施例中,在基于各第一文献嵌入向量和各第二文献嵌入向量进行融合,得到多个目标文献嵌入向量时,针对每一篇科技文献对应的第一文献嵌入向量和第二文献嵌入向量执行如下步骤:

12、确定当前第一文献嵌入向量的第一文献权重值,以及当前第二文献嵌入向量的第二文献权重值;

13、对当前第一文献嵌入向量和所述第一文献权重值进行乘积计算,得到第一加权文献向量;

14、对当前第二文献嵌入向量和所述第二文献权重值进行乘积计算,得到第二加权文献向量;

15、对所述第一加权文献向量和所述第二加权文献向量进行求和计算,得到当前科技文献对应的目标文献嵌入向量。

16、在一个实施例中,在基于各目标文献嵌入向量和各作者嵌入向量进行相似度计算,得到各科技文献的作者对应的科技文献推荐结果时,针对每一篇科技文献对应的作者嵌入向量执行如下步骤:

17、将当前作者嵌入向量和各目标文献嵌入向量分别进行余弦相似度计算,得到多个相似值;

18、对各相似值进行降序排序,得到排序结果;

19、从所述排序结果中首个相似值开始,按照顺序抽取第一预设数量的相似值;

20、根据第一预设数量的相似值,生成当前科技文献的作者对应的科技文献推荐表。

21、在一个实施例中,所述目标异质图学习模型是通过如下步骤得到的:

22、获取多篇样本文献的文本内容,并基于各样本文献的文本内容进行信息提取,得到多类型样本数据;

23、基于多类型样本数据,构建样本异质图;

24、获取所述样本异质图中各文献节点的领域类别标签;

25、对所述样本异质图中各节点数据进行特征转换,得到各节点数据的初始特征;

26、基于元路径视图和各初始特征,确定所述样本异质图中各文献节点对应的第一文献向量样本,以及各作者节点对应的第一作者向量样本;

27、基于网络模式视图和各初始特征,确定所述样本异质图中各文献节点对应的第二文献向量样本,以及各作者节点对应的第二作者向量样本;

28、基于预设对比损失函数和预设分类损失函数进行加权求和计算,得到各文献节点的第一目标函数;

29、将预设对比损失函数确定为各作者节点的第二目标函数;

30、基于各文献节点对应的第一文献向量样本、第二文献向量样本、第一目标函数、领域类别标签,以及各作者节点对应的第一作者向量样本、第二作者向量样本、第二目标函数,对初始异质图学习模型进行训练,得到目标异质图学习模型。

31、在一个实施例中,在基于元路径视图和各初始特征,确定所述样本异质图中各文献节点对应的第一文献向量样本时,针对样本异质图中每一个文献节点进行如下步骤:

32、对当前文献节点构建第二预设数量的元路径;

33、分别对各元路径上的所有节点对应的初始特征进行聚合,得到各元路径的路径聚合特征;

34、确定各元路径的路径权重;

35、基于各元路径的路径聚合特征和路径权重进行嵌入计算,得到当前文献节点的第一文献向量样本。

36、在一个实施例中,在基于网络模式视图和各初始特征,确定所述样本异质图中各文献节点对应的第二文献向量样本时,针对样本异质图中每一个文献节点进行如下步骤:

37、确定当前文献节点的多个邻居节点;

38、将各邻居节点划分为多个类型的邻居节点组合;

39、分别确定各邻居节点组合中每一个邻居节点对当前文献节点的注意力值;

40、基于各邻居节点组合中每一个邻居节点对当前文献节点的注意力值,分别将各邻居节点组合中所有邻居节点对应的初始特征进行聚合,得到各邻居节点组合的邻居聚合特征;

41、确定各邻居节点组合对当前文献节点的类型权重;

42、基于各邻居节点组合的邻居聚合特征和类型权重进行嵌入计算,得到当前文献节点的第二文献向量样本。

43、第二方面,本专利技术还提供一种科技文献推荐装置,包括:

44、信息提取模块,用于获取多篇科技文献的文本内容,并基于各科技文献的文本内容进行信息提取,得到多类型数据;所述多类型数据包括文献元数据和文献研究方向数据;所述文献元数据至少包括作者数据和文献数据;

45、构建模块,用于基于多类型数据,构建异质图;

46、异质图学习模块,用于将所述异质图输入至目标异质图学习模型,得到所述目标异质图学习模型输出的多个作者嵌入向量和多个第一文献嵌入向量;所述目标异质图学习模型是基于多篇样本文献的文本内容中提取到的多类型本文档来自技高网...

【技术保护点】

1.一种科技文献推荐方法,其特征在于,包括:

2.根据权利要求1所述的科技文献推荐方法,其特征在于,所述基于各作者嵌入向量和各第一文献嵌入向量进行科技文献推荐,得到各科技文献的作者对应的科技文献推荐结果,包括:

3.根据权利要求2所述的科技文献推荐方法,其特征在于,在基于各第一文献嵌入向量和各第二文献嵌入向量进行融合,得到多个目标文献嵌入向量时,针对每一篇科技文献对应的第一文献嵌入向量和第二文献嵌入向量执行如下步骤:

4.根据权利要求2所述的科技文献推荐方法,其特征在于,在基于各目标文献嵌入向量和各作者嵌入向量进行相似度计算,得到各科技文献的作者对应的科技文献推荐结果时,针对每一篇科技文献对应的作者嵌入向量执行如下步骤:

5.根据权利要求1所述的科技文献推荐方法,其特征在于,所述目标异质图学习模型是通过如下步骤得到的:

6.根据权利要求5所述的科技文献推荐方法,其特征在于,在基于元路径视图和各初始特征,确定所述样本异质图中各文献节点对应的第一文献向量样本时,针对样本异质图中每一个文献节点进行如下步骤:

7.根据权利要求5所述的科技文献推荐方法,其特征在于,在基于网络模式视图和各初始特征,确定所述样本异质图中各文献节点对应的第二文献向量样本时,针对样本异质图中每一个文献节点进行如下步骤:

8.一种科技文献推荐装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述科技文献推荐方法的步骤。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述科技文献推荐方法的步骤。

...

【技术特征摘要】

1.一种科技文献推荐方法,其特征在于,包括:

2.根据权利要求1所述的科技文献推荐方法,其特征在于,所述基于各作者嵌入向量和各第一文献嵌入向量进行科技文献推荐,得到各科技文献的作者对应的科技文献推荐结果,包括:

3.根据权利要求2所述的科技文献推荐方法,其特征在于,在基于各第一文献嵌入向量和各第二文献嵌入向量进行融合,得到多个目标文献嵌入向量时,针对每一篇科技文献对应的第一文献嵌入向量和第二文献嵌入向量执行如下步骤:

4.根据权利要求2所述的科技文献推荐方法,其特征在于,在基于各目标文献嵌入向量和各作者嵌入向量进行相似度计算,得到各科技文献的作者对应的科技文献推荐结果时,针对每一篇科技文献对应的作者嵌入向量执行如下步骤:

5.根据权利要求1所述的科技文献推荐方法,其特征在于,所述目标异质图学习模型是通过如下步骤得到的:

6.根据权...

【专利技术属性】
技术研发人员:张运良王莉军李琳娜郭晓琪王力高雄
申请(专利权)人:中国科学技术信息研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1