面向海量科研资料的科研成果综合推荐方法及装置制造方法及图纸

技术编号:33375706 阅读:9 留言:0更新日期:2022-05-11 22:43
本发明专利技术公开一种面向海量科研资料的科研成果综合推荐方法及装置,包括:基于用户的个人信息与科研资料的属性,分别提取个人信息特征与属性特征;将个人信息特征与属性特征输入BP神经网络,得到第一推荐结果;通过计算个人信息特征与属性特征的相似度,得到第二推荐结果;依据第一推荐结果和/或第二推荐结果,得到综合推荐结果。本发明专利技术从海量科研课题文档中快速准确提取数十种课题相关属性特征,进行关键科研要素比对分析,通过几十种属性特征,建立了基于BP神经网络的精细化科研成果推荐模型,更加精准的为客户推荐科研课题。更加精准的为客户推荐科研课题。更加精准的为客户推荐科研课题。

【技术实现步骤摘要】
面向海量科研资料的科研成果综合推荐方法及装置


[0001]本专利技术涉及机器学习领域,是一种面向海量科研资料的科研成果综合推荐方法及装置。

技术介绍

[0002]推荐系统是信息过载所采取的措施,面对海量的科研资料数据信息,从中快速的推荐出符合用户特点的科研课题数据;主要面向没有明确需求的人。主要解决了如何从大量信息中发现用户感兴趣的信息以及如何能够最大化的利用已有的科研成果数据,辅助服务于其他的科研工作。
[0003]本专利技术的应用需求意在基于海量科研资料的科研成果及科研要素综合推荐法,让用户更快更好的获取到自己需要的科研信息、让已有的科研成果更快、更好的推送到需要者的手中;主要的研究方法包括:基于用户统计学的推荐算法、基于科研成果内容的推荐算法以及基于协同过滤(包括基于科研课题成果的协同过滤以及基于用户的协同过滤)的推荐算法相结合的综合推荐方法,进一步支撑和辅助科研立项决策工作。

技术实现思路

[0004]针对上述需求,为了实现科研成果及科研要素综合推荐,本专利技术提供了一种面向海量科研资料的科研成果综合推荐方法及装置,形成基本推荐法,最终对多种方法的结果和特征进行融合,并且大幅提高算法在海量数据下的处理性能,最终形成实时性好、准确率高的科研成果及科研要素综合推荐法,本专利技术成果是对普通统计学方式的推荐方法(例如热点信息)的有力补充。
[0005]本专利技术的技术方案包括:
[0006]一种面向海量科研资料的科研成果综合推荐方法,其步骤包括:
[0007]基于用户的个人信息与科研资料的属性,分别提取个人信息特征与属性特征;
[0008]将个人信息特征与属性特征输入BP神经网络,得到第一推荐结果;
[0009]通过计算个人信息特征与属性特征的相似度,得到第二推荐结果;
[0010]依据第一推荐结果和/或第二推荐结果,得到综合推荐结果。
[0011]进一步地,个人信息包括:研究方向、从事领域、浏览记录和收藏信息。
[0012]进一步地,所述属性包括:绩效信息、需求信息、指南信息、项目库信息和成果效益信息。
[0013]进一步地,所述绩效信息包括:业务问题、年度目标和长期任务;所述需求信息包括:研究方向与核心目标;所述指南信息包括:指南编号和需求提出部门;所述项目库信息包括:课题编号、周期、密级、经费和审查信息;所述成果效益信息包括:关键技术、论文、专利、软著和应用效益。
[0014]进一步地,个人信息特征包括:用户对各科研成果的兴趣度。
[0015]进一步地,通过以下步骤计算所述相似度:
[0016]1)基于个人信息特征,得到若干<用户、科研成果、标签>三元组;
[0017]2)基于<用户、科研成果、标签>三元组,统计任一标签b的次数n
u,b
与科研成果i被打过标签b的次数n
b,i
,其中u表示用户;
[0018]3)根据次数n
u,b
与次数n
b,i
,计算所述兴趣度。
[0019]进一步地,通过以下步骤计算所述兴趣度:
[0020]1)获取所述用户的科研资料历史浏览记录,得到若干<用户、科研成果、标签>三元组;
[0021]2)将科研成果i的所有标签作为文档,计算每一标签的词频与逆向文件频率;
[0022]3)基于词频与逆向文件频率,计算用户对各科研成果的兴趣度。
[0023]进一步地,计算用户对各科研成果的兴趣度时,加入热门标签和热门科研成果的惩罚项。
[0024]进一步地,通过以下步骤得到所述属性特征:
[0025]1)对科研资料的属性进行分类,其中分类后的类别包括:数值型属性、时间型属性和统计型属性;
[0026]2)对数值型属性进行归一化处理;
[0027]针对时间型属性,对连续时间的时间型属性进行归一化处理,并对离散连续时间的时间型属性进行离散化处理;
[0028]针对统计型属性,包括:
[0029]对于项目收益的统计型属性,通过等步长方法与等频方法对科研经费进行离散化处理;
[0030]对于类别型的统计型属性,采用One

Hot编码/哑变量方式,将类别型的统计属性平行地展开;
[0031]对于次序性的统计型属性,基于次序性数据的次序计算;
[0032]对于比例类的统计型数据,基于比例类数据的比例计算。
[0033]3)根据数值型属性特征、时间型属性特征与统计型属性特征,得到所述属性特征。
[0034]进一步地,计算所述相似度的方法包括:余弦相似度方法。
[0035]一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述所述的方法。
[0036]一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机以执行上述所述的方法。
[0037]与现有技术相比,本专利技术具有如下优点:
[0038]本专利技术从海量科研课题文档中快速准确提取数十种课题相关属性特征,进行关键科研要素比对分析,通过几十种属性特征,建立了基于BP神经网络的精细化科研成果推荐模型,更加精准的为客户推荐科研课题。
附图说明
[0039]图1本专利技术的方法流程图。
[0040]图2基于BP神经网络的企业科研成果推荐方法结构图。
[0041]图3基于科研成果内容的推荐方法。
具体实施方式
[0042]为使本专利技术的上述特征和优点能更明显易懂,下文特举实施例,并配合说明书附图作详细说明如下。
[0043]本专利技术的流程如图1所示,主要包括基于BP神经网络的企业科研成果推荐方法和基于企业科研成果数据的科研成果内容推荐方法。
[0044]本专利技术从海量科研课题文档中准确提取数十种课题相关属性特征,包括绩效信息(业务问题、年度目标、长期任务等)、需求信息(研究方向、核心目标等)、指南信息(指南编号、需求提出部门等)、项目库信息(课题编号、周期、密级、经费、审查信息等)、成果效益信息(关键技术、论文、专利、软著、应用效益等)五大类数十种精细化属性信息,进行关键科研要素比对分析,结合用户个人信息包括研究方向、从事领域、浏览记录、收藏信息专利技术了基于BP神经网络的企业科研成果推荐方法和基于企业科研成果数据的科研成果内容推荐方法。
[0045]基于BP神经网络的企业科研成果推荐方法
[0046]BP神经网络实际上是多层感知器,它是一种能够根据训练结果自动调整参数的模型,能够拟合任意复杂的函数.神经网络的每一层都由多个神经元构成,层与层之间的连接方式为全连接,同一层的神经元之间无连接。神经网络在训练模型的过程中,样本首先通过初始的权重及激活值从输入层到达隐含层,然后再以相同的方式到达输出层,输出层的预测结果与实际结果本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向海量科研资料的科研成果综合推荐方法,其步骤包括:基于用户的个人信息与科研资料的属性,分别提取个人信息特征与属性特征;将个人信息特征与属性特征输入BP神经网络,得到第一推荐结果;通过计算个人信息特征与属性特征的相似度,得到第二推荐结果;依据第一推荐结果和/或第二推荐结果,得到综合推荐结果。2.如权利要求1所述的方法,其特征在于,所述属性包括:绩效信息、需求信息、指南信息、项目库信息和成果效益信息。3.如权利要求2所述的方法,其特征在于,所述绩效信息包括:业务问题、年度目标和长期任务;所述需求信息包括:研究方向与核心目标;所述指南信息包括:指南编号和需求提出部门;所述项目库信息包括:课题编号、周期、密级、经费和审查信息;所述成果效益信息包括:关键技术、论文、专利、软著和应用效益。4.如权利要求1所述的方法,其特征在于,个人信息包括:研究方向、从事领域、浏览记录和收藏信息;个人信息特征包括:用户对各科研成果的兴趣度。5.如权利要求4所述的方法,其特征在于,通过以下步骤计算所述相似度:1)基于个人信息特征,得到若干<用户、科研成果、标签>三元组;2)基于<用户、科研成果、标签>三元组,统计任一标签b的次数n
u,b
与科研成果i被打过标签b的次数n
b,i
,其中u表示用户;3)根据次数n
u,b
与次数n
b,i
,计算所述兴趣度。6.如权利要求4所述的方法,其特...

【专利技术属性】
技术研发人员:刘玮李超纪玉春王益静张永铮李书豪庹宇鹏常鹏王晗祁睿
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1