一种融合方面信息的习题可解释推荐评分预测方法技术

技术编号:21573318 阅读:20 留言:0更新日期:2019-07-10 15:52
本发明专利技术公开了一种融合方面信息的习题可解释推荐评分预测方法。针对习题可解释推荐中缺乏定量的细粒度的解释问题,通过从评论信息中挖掘用户和习题更加细粒度的方面信息,不仅可以提升评分预测的准确性而且可以为推荐提供可信度的推荐解释信息。本发明专利技术利用从用户对习题的评论文本提取的方面信息协同分解评分矩阵,从而达到提升习题评分预测的准确性和可解释性的目的。此外,本发明专利技术公开用户方面偏好和习题方面质量的度量指标,通过这两个指标可以为用户量化习题推荐的原因。

An Exercise Fusing Aspect Information Explains Recommended Score Prediction Method

【技术实现步骤摘要】
一种融合方面信息的习题可解释推荐评分预测方法
本专利技术属于在线推荐领域的习题推荐方法,具体是一种融合方面信息的习题可解释推荐评分预测方法。
技术介绍
随着电子商务的蓬勃发展,用户从海量的商品中挑选自己喜欢的商品变得愈发困难。同理,如何为学生推荐高质量的习题并具备可解释性也成为推荐系统领域的热点。此外,对推荐的习题做出解释可以增强推荐说服力,增加用户信任度,并帮助用户更加高效地做出决策,以此提升用户的做题体验和能力提升。近几年来,现有工作针对习题推荐提出了多种可解释推荐的方法。但是,它们存在着一些问题:其一,缺乏个性化,它们往往基于用户的相似性或习题间的相似性,并没有体现用户个性化的偏好和做题能力;其二,解释粒度不够细,现有的解释通常基于习题层级,没有对更细粒度的层级进行探索,因此缺乏说服力。本专利技术提出一种融合方面信息的习题可解释推荐评分预测方法。为了使得推荐的解释信息更具说服力,本专利技术对方面进行了量化评估。即使两个用户对某个习题的评分相同,但是他们在不同的方面偏好可能是具有差别的。例如,用户A和B都做了某道数学题,并且对习题的评分相同,但是用户A更关注该试题的难易程度,用户B更关注试题的知识覆盖面。因此本专利技术需要捕捉这种方面层次上的差异。此外,评论文本提供了额外的用户偏好信息,本专利技术将评论文本中提取的方面信息与矩阵分解技术相结合,从而提升评分预测的准确率。
技术实现思路
本专利技术的目的在于提供一种融合方面信息的习题可解释推荐评分预测方法。本专利技术利用统计学的方法获取用户的方面偏好和习题的方面质量,并作为约束融入到评分矩阵的协同分解中,最后在生成推荐结果的同时利用用户的方面偏好和习题的方面质量提供了推荐的可解释信息。本专利技术是一种融合方面信息的习题可解释推荐评分预测方法,包括以下步骤:步骤1:通过日志系统收集用户对习题的历史评分数据以及评论数据,并保存到数据库中。步骤2:基于评分数据构建用户-习题的评分矩阵R,基于用户的评论数据构建用户方面偏好矩阵P和习题方面质量矩阵Q。步骤3:通过协同地对评分矩阵进行矩阵分解,将步骤2中的用户方面偏好矩阵P分解为用户的潜因子矩阵U和方面的潜因子矩阵X,将习题方面质量矩阵Q分解为习题的潜因子矩阵V和方面的潜因子矩阵Y。步骤4:将用户方面偏好矩阵P和习题方面质量矩阵Q作为约束融合到评分矩阵R的协同分解中。步骤5:通过最小化损失函数学习得到模型的参数U、V、X、Y。步骤6:利用RMSE和MAE评价本方法的性能。步骤7:对用户和习题的潜因子向量进行内积运算,得到重构后的评分矩阵步骤8:利用重构后的矩阵为每个用户推荐预测评分最高的K个习题,同时基于用户方面偏好矩阵P和习题方面质量矩阵Q给出推荐结果的解释信息,并一同保存到内存服务器中。所述步骤2中的用户方面偏好矩阵P经过统计得到:其中,代表方面(难度、规范程度、能力提升度、知识涵盖面、创新性)在用户m所有的评论中被提到的次数,cm代表用户m的评论总数,P是一个的矩阵,其中M是用户数,L是方面数。P的第i行,第j列元素表示为Pi,j,1≤i≤M,1≤j≤L;习题方面质量矩阵Q经过统计得到:其中,是注意力因子,是情感因子;揭示了习题n关于方面的用户整体关注度:其中,是注意力因子,是情感因子;揭示了习题n关于方面的用户整体关注度:其中,是习题n的方面中相关词wj的情感评分,是习题n的方面中相关词wj的出现频率。所述步骤3中通过协同地对评分矩阵进行矩阵分解,将用户方面偏好矩阵P分解为用户的潜因子矩阵U和方面的潜因子矩阵X,将习题方面质量矩阵Q分解为习题的潜因子矩阵V和方面的潜因子矩阵Y。所述步骤4中将用户方面偏好矩阵P和习题方面质量矩阵Q作为约束融合到评分矩阵R的协同分解中。所述步骤5中通过最小化损失函数学习得到模型的参数U、V、X、Y:所述步骤6中利用RMSE和MAE评价本方法的性能:其中,yi是真实评分值,是预测评分值,n是测试集中的实例个数。所述步骤7中对用户和习题的潜因子向量进行内积运算,得到重构后的评分矩阵:其中是原始评分矩阵,是重构评分矩阵。是用户潜因子矩阵,K是潜因子的个数。所述步骤8中利用重构后的矩阵为每个用户推荐预测评分最高的K个习题,同时基于用户方面偏好矩阵P和习题方面质量矩阵Q给出推荐结果的解释信息,并一同保存到内存服务器中。附图说明图1为本专利技术的推荐流程图。图2为本专利技术的系统设计图。具体实施方式本专利技术是一种融合方面信息的习题可解释推荐评分预测方法,下面结合附图,详细描述本专利技术的技术方案:如图1所示,本专利技术的主要流程为:步骤1:通过日志系统收集用户对习题的历史评分数据以及评论数据,并保存到数据库中。步骤2:基于评分数据构建用户-习题的评分矩阵R,基于用户的评论数据构建用户方面偏好矩阵P和习题方面质量矩阵Q。步骤3:通过协同地对评分矩阵进行矩阵分解,将步骤2中的用户方面偏好矩阵P分解为用户的潜因子矩阵U和方面的潜因子矩阵X,将习题方面质量矩阵Q分解为习题的潜因子矩阵V和方面的潜因子矩阵Y。步骤4:将用户方面偏好矩阵P和习题方面质量矩阵Q作为约束融合到评分矩阵R的协同分解中。步骤5:通过最小化损失函数学习得到模型的参数U、V、X、Y。步骤6:利用RMSE和MAE评价本方法的性能。步骤7:对用户和习题的潜因子向量进行内积运算,得到重构后的评分矩阵步骤8:利用重构后的矩阵为每个用户推荐预测评分最高的K个习题,同时基于用户方面偏好矩阵P和习题方面质量矩阵Q给出推荐结果的解释信息,并一同保存到内存服务器中。所述步骤1通过日志系统采集的数据包括用户的唯一标识、习题的唯一标识、用户对习题的评分、用户对习题的评论文本,并保存于数据库中,具体为:四元组(u,i,rui,t)表示t时刻用户u对物品i的评分记录,四元组(u,i,cui,t)表示t时刻用户u对物品i的评论记录。所述步骤2中的用户方面偏好矩阵P经过统计得到:其中,代表方面(难度、规范程度、能力提升度、知识涵盖面、创新性)在用户m所有的评论中被提到的次数,cm代表用户m的评论总数,P是一个的矩阵,其中M是用户数,L是方面数。P的第i行,第j列元素表示为Pi,j,1≤i≤M,1≤j≤L;习题方面质量矩阵Q经过统计得到:其中,是注意力因子,是情感因子;揭示了习题n关于方面的用户整体关注度:其中,是习题n的所有评论中方面被提到的次数,cn是习题的评论总数;揭示了习题n关于方面的用户整体的情感:其中,是习题n的方面中相关词wj的情感评分,是习题n的方面中相关词wj的出现频率。所述步骤3中通过协同地对评分矩阵进行矩阵分解,将用户方面偏好矩阵P分解为用户的潜因子矩阵U和方面的潜因子矩阵X,将习题方面质量矩阵Q分解为习题的潜因子矩阵V和方面的潜因子矩阵Y。所述步骤4中将用户方面偏好矩阵P和习题方面质量矩阵Q作为约束融合到评分矩阵R的协同分解中。所述步骤5中通过最小化损失函数学习得到模型的参数U、V、X、Y:所述步骤6中利用RMSE和MAE评价本方法的性能:其中,yi是真实评分值,是预测评分值,n是测试集中的实例个数。所述步骤7中对用户和习题的潜因子向量进行内积运算,得到重构后的评分矩阵:其中是原始评分矩阵,是重构评分矩阵。是用户潜因子矩阵,K是潜因子的个数。所述步骤8中利用重构后的矩阵为每本文档来自技高网...

【技术保护点】
1.一种融合方面信息的习题可解释推荐评分预测方法,其特征在于包括以下步骤:步骤1:通过日志系统收集用户对习题的历史评分数据以及评论数据,并保存到数据库中;步骤2:基于评分数据构建用户‑习题的评分矩阵R,基于用户的评论数据构建用户方面偏好矩阵P和习题方面质量矩阵Q;步骤3:通过协同地对评分矩阵进行矩阵分解,将步骤2中的用户方面偏好矩阵P分解为用户的潜因子矩阵U和方面的潜因子矩阵X,将习题方面质量矩阵Q分解为习题的潜因子矩阵V和方面的潜因子矩阵Y;步骤4:将用户方面偏好矩阵P和习题方面质量矩阵Q作为约束融合到评分矩阵R的协同分解中;步骤5:通过最小化损失函数学习得到模型的参数U、V、X、Y;步骤6:利用RMSE和MAE评价该模型的性能;步骤7:对用户和习题的潜因子向量进行内积运算,得到重构后的评分矩阵

【技术特征摘要】
1.一种融合方面信息的习题可解释推荐评分预测方法,其特征在于包括以下步骤:步骤1:通过日志系统收集用户对习题的历史评分数据以及评论数据,并保存到数据库中;步骤2:基于评分数据构建用户-习题的评分矩阵R,基于用户的评论数据构建用户方面偏好矩阵P和习题方面质量矩阵Q;步骤3:通过协同地对评分矩阵进行矩阵分解,将步骤2中的用户方面偏好矩阵P分解为用户的潜因子矩阵U和方面的潜因子矩阵X,将习题方面质量矩阵Q分解为习题的潜因子矩阵V和方面的潜因子矩阵Y;步骤4:将用户方面偏好矩阵P和习题方面质量矩阵Q作为约束融合到评分矩阵R的协同分解中;步骤5:通过最小化损失函数学习得到模型的参数U、V、X、Y;步骤6:利用RMSE和MAE评价该模型的性能;步骤7:对用户和习题的潜因子向量进行内积运算,得到重构后的评分矩阵步骤8:利用重构后的矩阵为每个用户推荐预测评分最高的K个习题,同时基于用户方面偏好矩阵P和习题方面质量矩阵Q给出推荐结果的解释信息,并一同保存到内存服务器中。2.根据权利要求1所述的融合方面信息的习题可解释推荐评分预测方法,其特征在于:所述步骤1通过日志系统采集的数据包括用户的唯一标识、习题的唯一标识、用户对习题的评分、用户对习题的评论文本,并保存于数据库中,具体为:四元组(u,i,rui,t)表示t时刻用户u对物品i的评分记录,四元组(u,i,cui,t)表示t时刻用户u对物品i的评论记录。3.根据权利要求1所述的融合方面信息的习题可解释推荐评分预测方法,其特征在于:所述步骤2中的用户方面偏好矩阵P经过统计得到:其中,代表方面(难度、规范程度、能力提升度、知识涵盖面、创新性)在用户m所有的评论中被提到的次数,cm代表用户m的评论总数,P是一个的矩阵,其中M是用户数,L是方面数。P的第i行,第j列元素表示为Pi,j...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:中森云链成都科技有限责任公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1