一种试题推荐方法技术

技术编号:36945078 阅读:7 留言:0更新日期:2023-03-22 19:06
本发明专利技术公开了一种试题推荐方法,本发明专利技术通过从数据库中拉取学员做题记录,使用开源项目nd

【技术实现步骤摘要】
一种试题推荐方法


[0001]本专利技术涉及深度学习领域,提供了一种基于IRT理论和ALS的试题推荐方法。

技术介绍

[0002]试题推荐面临三个问题,其一:推荐符合学员能力的试题。其二,推荐学员偏好领域内的试题。其三,学员能力和偏好是动态的,试题推荐也要同步;无论是题目的难度还是学员的能力,都不容易进行量化,无法量化,则无法分级。本专利技术采用深度学习的方式,通过现象来推测本质规律,建立合适的数学模型,导入数据,不断拟合,即可得到相关参数,比如学员能力,试题难度等。
[0003]关于学员偏好,一般会采用余弦相似算法,将学员标签化,与试题标签比对,得到余弦相似值,但是学员

试题在稀疏场景下,无法匹配从而无法推荐。本专利技术采用协同过滤算法,得到用户对试题的偏好程度,为此我们提出一种试题推荐方法来解决现有技术中存在的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种试题推荐方法,推荐符合学员能力和偏好领域的试题,得到有效的测试结果,便于讲师与学员了解对知识点的真实掌握程度,并提升用户黏性,以解决上述
技术介绍
中提出现有技术中的问题。
[0005]为实现上述目的,本专利技术采用了如下技术方案:一种试题推荐方法,包括如下步骤:步骤S1、从数据库中拉取学员做题记录;步骤S2、使用开源项目nd

ball/py

irt,将做题记录数据导入,获取学员能力值和试题难度;步骤S3、从数据库拉取学员的浏览行为和做题记录,通过余弦算法获取部分用户对试题的偏好;再将此数据导入,使用spark进行计算,得到完整的用户

题目偏好矩阵;步骤S4、通过学员的能力值,获得对应难度且偏好度高的试题。
[0006]优选的,还包括学员能力和试题难度量化方法,包括如下步骤:假设学员的能力是存在且可测量的,用θ表示,随着学员能力水平的变化,学员答对某题目的概率也相应变化;描述学员能力与某题目作答结果之间的关系可以用一条项目特征曲线(ICC)表示,横轴表示学员的能力水平,纵轴表示答对某题目的概率,曲线走势除了受到学员能力影响外,还受到三个反映题目特征的参数α、β、C的影响,这三个参数决定了S形曲线的走向。
[0007]优选的,α参数被称为题目的区分度,它刻画了题目对学员水平区分能力的高低;在题目的ICC中,α值是曲线拐点处切线斜率的函数值;曲线在拐点处越陡峭,值则越大,同时意味着能力θ在拐点处稍有变化,则在题目上正确作答的概率差别较大,因此也就说明该试题起到了精细区分考生的作用。
[0008]优选的,β参数被称为题目难度,难度为β的题目,若排除C的影响,能力θ恰好等于β
的考生,TA在该题目上正确作答的概率为0.5;随着题目β值的升高,ICC在横轴方向上向右平移,这时只有潜在特质更高的学员才可能在新题目上获得相同的正确作答概率。
[0009]优选的,参数C被称为猜测参数,是指实际测验中考生纯凭猜测而作答成功的概率;直线C是ICC的下渐近线;若题目的猜测参数为C,则意味着θ为负无穷的考生在题上正确作答的概率也为C。
[0010]优选的,接着用一个公式来表示上述曲线,令θ参数表示第i位考生的能力,参数表示第j道题目的区分度,参数表示第j道题目的难度,参数表示第j道题目的猜测参数,事件表示学员i做对了题目j,那么:在第j道题参数为、、 ,第i位学员的能力为时,学员i做对题目j的概率为:公式中的D为常量,当D取值为1.702时,此函数的概率密度与正态肩型曲线的差异小于0.01,因此D一般取值为1.702;最后将收集到的学员真实答题记录导入,使用数学模型,让机器不断计算拟合,得到想要的学员能力值,题目难度,题目区分度。
[0011]优选的,还包括学员偏好获取方法,包括如下步骤;假定用两个n维向量A和B 表示学员和试题,A是 [, , ..., ] ,B是 [, , ..., ] ,则A与B的夹角的余弦等于:余弦值越接近1,就表明夹角越接近0
°
,即两个向量越相似,可以根据此公式计算出学员对试题的偏好度。
[0012]优选的,接着,把学员对试题的偏好度用一个矩阵(R)表示,表示用户和试题的偏好度,其中“问号”表示用户和试题无交集;矩阵用模型表示为:
其中:R为相似矩阵,其中m*n,m表示用户数,n表示物品个数;U表示学员对隐含特征的偏好矩阵(m*k);V表示试题对隐含特征的归属矩阵(n*K)。
[0013]优选的,因此只要知道了U和V,就可以近视地得到学员对试题的偏好度;固定V求解U,对公式进行求导化简,可得:固定U求解V,对公式进行求导化简,可得:得到了U和V,就可以得到学员对试题的偏好了。
[0014]推荐符合学员能力和偏好领域的试题,得到有效的测试结果,便于讲师与学员了解对知识点的真实掌握程度,并提升用户黏性。
[0015]本专利技术的技术效果和优点:本专利技术提出的一种试题推荐方法,与现有技术相比,具有以下优点:本专利技术通过从数据库中拉取学员做题记录;使用开源项目nd

ball/py

irt,将做题记录数据导入,获取学员能力值和试题难度;从数据库拉取学员的浏览行为和做题记录,通过余弦算法获取部分用户对试题的偏好;再将此数据导入,使用spark进行计算,得到完整的用户

题目偏好矩阵;通过学院的能力值,获得对应难度且偏好度高的试题,本专利技术的试题推荐方法包括还包括学员能力和试题难度量化方法和学员偏好获取方法;本专利技术通过推荐符合学员能力和偏好领域的试题,得到有效的测试结果,便于讲师与学员了解对知识点的真实掌握程度,并提升用户黏性。
[0016]本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书以及附图中所指出的结构来实现和获得。
附图说明
[0017]图1为本专利技术中学员的能力水平与答对某题目的概率的关系示意图;图2为本专利技术中受到三个反映题目特征的参数α、β、C的影响决定了S形曲线的走向的示意图;图3为本专利技术中学员和试题的偏好度或者无交集得的结果示意图;图4为本专利技术中试题推荐方法的方法流程图。
具体实施方式
[0018]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发
明保护的范围。
[0019]本专利技术提供了如图1

4所示的实施例:一种试题推荐方法,包括如下步骤:步骤S1、从数据库中拉取学员做题记录;步骤S2、使用开源项目nd

ball/py

irt,将做题记录数据导入,获取学员能力值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试题推荐方法,其特征在于,包括如下步骤:步骤S1、从数据库中拉取学员做题记录;步骤S2、使用开源项目nd

ball/py

irt,将做题记录数据导入,获取学员能力值和试题难度;步骤S3、从数据库拉取学员的浏览行为和做题记录,通过余弦算法获取部分用户对试题的偏好;再将此数据导入,使用spark进行计算,得到完整的用户-题目偏好矩阵;步骤S4、通过学员的能力值,获得对应难度且偏好度高的试题。2.根据权利要求1所述的一种试题推荐方法,其特征在于:还包括学员能力和试题难度量化方法,包括如下步骤:假设学员的能力是存在且可测量的,用θ表示,随着学员能力水平的变化,学员答对某题目的概率也相应变化;描述学员能力与某题目作答结果之间的关系可以用一条项目特征曲线(ICC)表示,横轴表示学员的能力水平,纵轴表示答对某题目的概率,曲线走势除了受到学员能力影响外,还受到三个反映题目特征的参数α、β、C的影响,这三个参数决定了S形曲线的走向。3.根据权利要求2所述的一种试题推荐方法,其特征在于:α参数被称为题目的区分度,它刻画了题目对学员水平区分能力的高低;在题目的ICC中,α值是曲线拐点处切线斜率的函数值;曲线在拐点处越陡峭,值则越大,同时意味着能力θ在拐点处稍有变化,则在题目上正确作答的概率差别较大,因此也就说明该试题起到了精细区分考生的作用。4.根据权利要求3所述的一种试题推荐方法,其特征在于:β参数被称为题目难度,难度为β的题目,若排除C的影响,能力θ恰好等于β的考生,TA在该题目上正确作答的概率为0.5;随着题目β值的升高,ICC在横轴方向上向右平移,这时只有潜在特质更高的学员才可能在新题目上获得相同的正确作答概率。5.根据权利要求4所述的一种试题推荐方法,其特征在于:参数C被称为猜测参数,是指实际测验中考生纯凭猜测而...

【专利技术属性】
技术研发人员:陈德勇江威尹家奇
申请(专利权)人:无忧创想武汉信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1