【技术实现步骤摘要】
回答者推荐模型的训练方法、推荐方法及电子设备
本专利技术涉及数据挖掘
,具体涉及回答者推荐模型的训练方法、推荐方法及电子设备。
技术介绍
随着网络的高速发展,书本的知识难以满足人们日益增长的知识需求,问答社区成为了人们分享经验与获取知识的新平台。以海川化工论坛为例,其是国内最大的专业化工问答社区和化工类交流的专业平台,日均访客10万其中95%以上的访客均为从业人员,成员来自于国内各大设计院、生产制造企业、销售单位及各大高校。在海川化工论坛近十年的数据中,有超过400万用户和超过100万个问题,其中近三分之一的问题没有获得明确的答案,同时论坛每天都会产生大量的问题,需要有回答能力的用户来解决。一方面是有许多问题没有被有能力的回答者发现,导致问题长时间无人问津,社区内出现了大量无人回答的问题。另一方面是有能力回答问题的用户没有发现与自己专业、能力相匹配的问题,海量不相关的问题,导致用户回答问题的效率变低,用户对社区的兴趣度下降。为了解决上述问题,推荐成为了海川化工论坛的关键技术,推荐的目的是根据回答者的能力为用户提 ...
【技术保护点】
1.一种回答者推荐模型的训练方法,其特征在于,包括:/n获取样本评分矩阵以及未获得财富值的数据集;其中,所述未获得财富值的数据集包括回答者特征以及问题特征;/n利用所述未获得财富值的数据集对回答者推荐模型中的DeepFM模块进行训练,以填充所述样本评分矩阵;/n将填充后的所述样本评分矩阵输入所述回答者推荐模型中的矩阵分解模块分解所述样本评分矩阵,得到回答者矩阵以及问题矩阵;/n基于所述回答者矩阵与所述问题矩阵,预测所述问题对应的回答者;/n利用所述评分预测值与所述问题对应的目标评分值,对所述DeepFM模块以及所述矩阵分解模块的参数进行更新,确定所述回答者推荐模型。/n
【技术特征摘要】 【专利技术属性】
1.一种回答者推荐模型的训练方法,其特征在于,包括:
获取样本评分矩阵以及未获得财富值的数据集;其中,所述未获得财富值的数据集包括回答者特征以及问题特征;
利用所述未获得财富值的数据集对回答者推荐模型中的DeepFM模块进行训练,以填充所述样本评分矩阵;
将填充后的所述样本评分矩阵输入所述回答者推荐模型中的矩阵分解模块分解所述样本评分矩阵,得到回答者矩阵以及问题矩阵;
基于所述回答者矩阵与所述问题矩阵,预测所述问题对应的回答者;
利用所述评分预测值与所述问题对应的目标评分值,对所述DeepFM模块以及所述矩阵分解模块的参数进行更新,确定所述回答者推荐模型。
2.根据权利要求1所述的训练方法,其特征在于,所述基于所述回答者矩阵以及所述问题矩阵,预测所述问题对应的回答者,包括:
计算所述回答者矩阵与所述问题矩阵的乘积,确定所述问题对应的各个回答者的评分预测值。
3.根据权利要求2所述的训练方法,其特征在于,所述利用所述评分预测值与所述问题对应的目标评分值,对所述DeepFM模块以及所述矩阵分解模块的参数进行更新,确定所述回答者推荐模型,包括:
获取各个所述问题对应的实际财富值、回答获得的平均财富值、回答获得的最大财富值、回答获得的最小财富值;
基于各个所述问题对应的实际财富值、回答获得的平均财富值、回答获得的最大财富值、回答获得的最小财富值,计算各个所述问题回答获得的财富值;
利用各个所述问题回答获得的财富值、所述DeepFM模块的填充结果、所述样本评分矩阵以及填充后的所述样本评分矩阵,计算损失函数,以更新所述DeepFM模块的填充结果,确定所述回答者推荐模型。
4.根据权利要求3所述的训练方法,其特征在于,所述各个所述问题回答获得的财富值采用如下公式计算:
其中,为所述各个所述问题回答获得的财富值;x为所述实际财富值;μ为所述回答获得的平均财富值;xmax为回答获得的最大财富值;xmin为回答获得的最小财富值。
5.根据权利要求3所述的训练方法,其特征在于,所述损失函数采用如下公式计算:
技术研发人员:陈卓,袁玺明,杜军威,葛艳,李涵,姜伟豪,魏锐,
申请(专利权)人:青岛科技大学,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。