一种基于多模态信息学习的专家推荐方法技术

技术编号：33911885 阅读：51 留言：0更新日期：2022-06-25 19:36

本发明专利技术公开一种基于多模态信息学习的专家推荐方法，爬取网络专家信息数据和项目信息数据，并整理现有专家库中的专家信息数据；构建专家评审异构图和专家属性异构图；bert模型对专家的文本信息进行学习，图神经网络对专家的属性异构图进行学习，搭建自注意力推荐模型对专家历史评审序列进行学习，将学习到的嵌入输入融合层得到专家信息嵌入，得到预训练模型；用预训练模型提取专家信息嵌入，对项目信息编码获得项目信息嵌入，将获得的专家属性表示与项目信息表示输入多层感知机对模型训练，得到专家与项目的推荐分数。本发明专利技术将丰富的语义和属性信息充分融入到专家的嵌入和模型参数中，提升专家推荐的准确率。提升专家推荐的准确率。提升专家推荐的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态信息学习的专家推荐方法

[0001]本专利技术属于数据处理
，特别是涉及一种基于多模态信息学习的专家推荐方法。

技术介绍

[0002]随着科技的发展等方面大力推进理论创新，各类创新性的项目申请量大幅度增加，进而导致科技项目申请不断增多。其中,在科研项目立项、结项等阶段,存在一个关键步骤——评审专家推荐。评审专家推荐即根据科研项目文档,推荐相关领域的专家进行项目评审,以评估项目的实际意义、可行性及完成质量。这就要求审核专家掌握的技术、擅长的领域与申请书内容相匹配，才能得到较为准确的评审结果。因此，如何准确地检索遴选并推荐出与项目相匹配的评审专家，如何“选好专家、用好专家”变得十分重要和关键。
[0003]在科研项目申报过程中,当前多采用人工方式进行评审专家遴选,由于人工对领域知识的理解有限，且具有一定的主观性倾向,项目申报数量的增加,专家库信息量庞大，传统的关键词检索与推荐技术存在机械匹配字词、检索与推荐的查全率和查准率偏低的问题，从而造成许多专家所分配到的项目与自己的研究方向毫不相关的问题；同时，仅凭项目管理人员的主观意识判断推荐评审专家是否符合评审标准，导致管理人员的工作量庞大，并且极易导致专家与项目不匹配的情况发生。
[0004]现有的专家推荐系统，如基于项目研究内容和评审专家研究方向的算法，其通过提取关键词计算文本特征向量的相似度，从而忽略了相关其他信息。然而实际中科研项目与评审专家的选择往往涉及到其他因素，如专家的个人属性等。同时，当新的专家出现时，往往存在专家信息不全的问...

【技术保护点】

【技术特征摘要】
1.一种基于多模态信息学习的专家推荐方法，其特征在于，包括步骤：S10,爬取网络专家信息数据和项目信息数据，对数据进行预处理，并整理现有专家库中的专家信息数据；S20,根据专家属性构建专家属性异构图，根据专家担任评委信息构建专家历史评审项目序列；S30,用bert模型对专家的文本信息进行学习，用图神经网络模型对专家的属性异构图进行学习，搭建自注意力推荐模型对专家历史评审项目序列进行学习，将得到的嵌入输入融合层得到专家信息嵌入，得到预训练模型；S40,用预训练模型提取专家信息嵌入，同时对项目信息编码通过embedding层获得项目信息嵌入，将获得的专家属性表示与项目信息表示合并输入多层感知机对模型训练，学习得到专家对评审项目的匹配度得分。2.根据权利要求1所述的一种基于多模态信息学习的专家推荐方法，其特征在于，在所述步骤S10中，包括：爬取网络专家信息数据，包括专家文本信息；爬取网络中的项目信息数据；对爬取的数据进行预处理；整理现有专家库中的数据，包括专家的姓名、职位、研究领域、工作单位属性信息和评审活动信息。3.根据权利要求2所述的一种基于多模态信息学习的专家推荐方法，其特征在于，在所述步骤S20中，包括：以时间顺序对专家参与评审项目构建历史评审项目序列；以专家姓名、职位、研究领域和工作单位为节点，以节点间相关关系为边构建专家属性异构图。4.根据权利要求3所述的一种基于多模态信息学习的专家推荐方法，其特征在于，在所述步骤S30中，包括：将专家文本信息包括文章和个人简介输入bert模型，通过执行遮蔽语言预测任务，对bert模型进行预训练，获得专家文本嵌入；在专家属性异构图上，执行对比预训练任务，预训练用于学习专家属性的图神经网络，获得专家属性嵌入；将专家历史评审序列输入搭建的自注意力推荐模型，执行下一个项目预测任务，对专家历史评审项目序列进行学习，获得专家均值和协方差嵌入；将提取不同嵌入进行融合获得专家信息属性。5.根据权利要求4所述的一种基于多模态信息学习的评审专家推荐方法，其特征在于，将专家文本信息包括文章和个人简介输入bert模型，通过执行遮蔽语言预测任务，对bert模型进行训练，获得专家文本嵌入，包括步骤：S311，通过嵌入矩阵将文本信息中的字转化为词嵌入，为每个字添加相应的段嵌入和位置嵌入，作为bert模型的输入；S312，在遮蔽语言预测任务中，选择与专家研究领域相关的词进行屏蔽和重构；S313，遮蔽语言预测任务损失被定义为交叉熵损失。6.根据权利要求4所述的一种基于多模态信息学习的评审专家推荐方法，其特征在于，
在专家属性异构图上进行对比预训练任务，训练用于学习专家属性的图神经网络，获得专家属性嵌入，包括步骤：S321，执行关系级预训练任务，对于异构图中给定的正例三元组，为其构造不一致关系和不相关节点的负样例队列进行对比学习任务；S322，执行子图级预训练任务，在异构图上生成元图实例来构建正样本，同时生成排队的负样本，并通过对比学习区分正负样本。根据权利要求4所述的一种基于多模态信息学习的评审专家推荐方法，其特征在于，将专家历史评审序列输入搭建的自注意力推荐模型，执行下一个项目预测任务，对专家历史评审项...

【专利技术属性】
技术研发人员：王书海，彭浩，唐翊群，赵晓亮，王辉，胡畅霞，
申请(专利权)人：石家庄铁道大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人