当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于答题统计特征的题目推荐系统技术方案

技术编号:26222685 阅读:21 留言:0更新日期:2020-11-04 10:53
本发明专利技术公开了一种基于答题统计特征的题目推荐系统,属于计算机辅助教学领域与数据挖掘领域,包括题目获取模块、预处理模块、查询特征配置模块、用户界面、特征处理模块、聚类计算模块和题目推荐模块。本推荐系统利用二次聚类的方式对从教学平台后台上任意给定的获取的题目集中高效筛选出与最能针对性解决用户需求的试题,采用多种评估方式相结合方法,基于答题统计特征能够较强的代表某一时间段内的用户对每一道题的掌握情况,且会随着掌握程度的提升以及教育质量的提升动态更新特征值的数值。在推荐中结合了聚类结果中类内信息及类间信息,保证了所推荐试题具有较强的代表性。弥补了辅助教学平台上相似题目过多,没有典型题目筛选机制的缺陷。

【技术实现步骤摘要】
一种基于答题统计特征的题目推荐系统
本专利技术涉及计算机辅助教学领域与数据挖掘领域,尤其涉及一种基于答题统计特征的题目推荐系统。
技术介绍
随着计算机和互联网技术的普及与流行,在线辅助教学平台的重要性与必要性日益显现。当今有许多平台,例如作业帮、拼题A、中国大学MOOC等,致力于研究数据驱动的数字教学个性化服务、个性化智能导学等,一般提供填空题、选择题、判断题等多种题型的自动判题功能。一些在线辅助教学平台经过长期的运营,拥有大量的原创题库和学生练习记录,累积了海量的结构化教学评测数据,这些评测数据蕴藏着不同层次的学习者在不同阶段的学习表现,也反映了全国各地上千位教师贡献的数万题的质量信息。然而,当前题库较大的在线教育平台大多存在着如下问题:(1)同一知识点大量题目内容相近。在共享开放平台中,每门课程的每个知识点下都有来自不同层次高校的众多教师贡献的题目,这些题目对知识点的考察角度不同,题目难易层次也有差别;但同一个知识点下存在许多题目,其内容间互相交叉,难易程度相近。这些题目的存在使得学习者要花费较多时间做相似的题,难以提高学习效率。(2)缺乏具有针对性题目的推送功能。现有的推送功能只是推送出一些与所属知识点相关的题目,而老师在考试或作业出题,学生在自主练习做题时都常常面临题目选择的问题,而选择一道题时不仅要考虑这道题包含的知识点和难度,还要考虑其在同类题目中的典型程度,这使得学习者无法快速找到高质量、有代表性的题目。现有技术中还存在一些通过决策树等方式进行个性化作业推送的报道,针对不同学生的薄弱知识点进行个性化题目推荐,通过强化作业训练提高学生对薄弱知识点的掌握程度,但其推荐的试题评价准则单一,忽略了同一知识点下不同试题之间的关系,同样存在所推荐试题缺乏代表性的缺陷。研究一种能够针对用户提出的需求对题目进行高效筛选和推送的系统,有助于学习者在制定个性化的训练方案时提高训练的针对性和效率,避免重复训练。
技术实现思路
为了解决当前辅助教学平台中大量题目内容相近,无法根据用户需求推荐更具有典型性的题目的缺陷,本专利技术提出了一种基于答题统计特征的题目推荐系统。利用二次聚类的方式对从教学平台后台获取的题目集中高效筛选出与最能针对性解决用户需求的试题,采用了多种评估方式相结合的方法,在特征选择上,基于答题统计特征能够较强的代表某一时间段内的用户对每一道题的掌握情况,且会随着掌握程度的提升以及教育质量的提升动态更新特征值的数值。在推荐标准上,结合了聚类结果中类内信息及类间信息,保证了所推荐试题具有较强的代表性。为了实现上述目的,本专利技术采用如下技术方案:一种基于答题统计特征的题目推荐系统,包括:题目获取模块:用于实时获取一段时间内的教学平台后台题目数据和用户练习记录数据,题目数据包括题目ID、总分、引用次数、用户ID、得分、提交时间和答题分布;同时建立题目ID、题目内容与所属知识点之间的题目ID-题目内容-知识点映射关系,所述题目内容包括试题和答案;预处理模块:用于将题目获取模块采集到的题目数据和用户练习记录数据进行数据清洗,将清洗后的题目数据生成题目知识库;查询特征配置模块:用于提取并配置题目知识库的题目查询特征q={xj},且j=1,2,…Q,Q为题目查询特征数量;所述的题目查询特征包括引用次数、平均提交次数、平均得分和题目难度;用户界面:供用户输入查询的关键内容,所述关键内容包括期望查询的知识点C、期望获得的题目数量M、以及允许用户为不同的题目查询特征设置特征权重w1,w2…wQ,其中wj为题目的第j个查询特征权重,默认为1;生成查询向量r={C,M,w1,w2…wQ};特征处理模块:读取用户界面获得的查询向量r,根据预先建立的题目ID-题目内容-知识点映射关系,选择题目知识库中位于用户查询知识点C下的所有题目ID,根据查询特征配置模块的配置结果生成题目查询特征矩阵I∈Rn×Q,n为查询知识点下的所有题目数量;对题目查询特征矩阵I进行标准化处理得到且i=1,2,…n;j=1,2,…Q,其中是标准化后的查询知识点C下第i个题目的第j个查询特征;根据查询向量r中的特征权重得到最终的查询特征矩阵聚类计算模块:包括第一聚类单元、第二聚类单元、判断单元;将查询特征矩阵作为第一聚类单元的输入,得到第一聚类结果;所述第一聚类结果包括类簇数K和初始类中心Θ0=[θ0,1,...,θ0,K]∈RQ×K;将查询特征矩阵作为第二聚类单元的输入,并将第一聚类单元输出的类簇数K和类中心Θ0=[θ0,1,...,θ0,K]∈RQ×K作为第二聚类单元的目标条件,输出最终类中心Θ=[θ1,...,θk]∈RQ×K;判断单元用于根据距离每一个题目最近的类中心判断每一个题目ID所属的类;题目推荐模块:用于计算每一个题目ID的推荐得分值,并将所有题目ID按照推荐得分值从高到低进行排序,将前M个题目ID作为筛选结果,根据题目ID-题目内容-知识点映射关系,将M个题目ID对应的试题及所属知识点推送给用户。本专利技术具备的有益效果是:(1)本专利技术对辅助教学平台上的题目进行了典型性的挖掘分析,在推荐系统中充分考虑了用户的需求,允许用户为不同的题目查询特征设置特征权重,包括用户关注的题目引用、得分、难度等,在满足客户需求的条件下推荐该知识点下最具代表性的题目。在推荐过程中对所属知识点下的所有题目的推荐得分进行了科学量化,结合了聚类结果中类内信息及类间信息,给出了更加科学的评分标准,能够得到每一道题目的推荐分数,该推荐分数不仅能够用于执行本专利技术中的典型性题目推荐任务,解决由于平台上相似题目过多、同一知识点下题目冗杂导致的用户学习训练低效的问题,还可以指导老师编写更具代表性的题目、以及引导训练系统的设计,优化题库,具备推广前景。(2)本专利技术建立了以答题统计特征为基础的特征池,包括引用次数、提交次数、平均得分和平均得分率等,将特征池中的指标进行组合、转换后生成用于配置题目知识库的题目查询特征,该题目查询特征能够较强的代表某一时间段内的用户对每一道题的掌握情况,且会随着掌握程度的提升、教育质量的提升、题库的优化等动态更新特征值的数值,并且引入了基于答题分布和平均得分率的难度值来动态表征试题难度,解决了题库内难度标注不准问题。因此,基于本专利技术提出的特征动态生成方法具备更准确的代表性。(3)在单一聚类算法的应用中,通常选择K-Means算法、均值漂移聚类等,但由于每一个知识点下的题目数量不同,往往难以确定类簇数,而不同预设参数的选择会对聚类结果产生较大的影响。本专利技术采用二次聚类的方式解决了类数难以确定、且传统聚类算法对类中心参数十分敏感导致的聚类结果不稳定的问题,首先随机挑选多个小规模数据集联合进行第一聚类单元的训练以调节参数,第一聚类单元选用无需设定类簇数参数的聚类算法,用于生成类簇数及初始类中心,如DBSCAN聚类算法,能够高效的给出第二聚类单元的初始参数,避免了人工对聚类算法参数的主观性调整,提高了聚类算法输出结果的本文档来自技高网
...

【技术保护点】
1.一种基于答题统计特征的题目推荐系统,其特征在于,包括:/n题目获取模块:用于实时获取一段时间内的教学平台后台题目数据和用户练习记录数据,题目数据包括题目ID、总分、引用次数、用户ID、得分、提交时间和答题分布;同时建立题目ID、题目内容与所属知识点之间的题目ID-题目内容-知识点映射关系,所述题目内容包括试题和答案;/n预处理模块:用于将题目获取模块采集到的题目数据和用户练习记录数据进行数据清洗,将清洗后的题目数据生成题目知识库;/n查询特征配置模块:用于提取并配置题目知识库的题目查询特征q={x

【技术特征摘要】
1.一种基于答题统计特征的题目推荐系统,其特征在于,包括:
题目获取模块:用于实时获取一段时间内的教学平台后台题目数据和用户练习记录数据,题目数据包括题目ID、总分、引用次数、用户ID、得分、提交时间和答题分布;同时建立题目ID、题目内容与所属知识点之间的题目ID-题目内容-知识点映射关系,所述题目内容包括试题和答案;
预处理模块:用于将题目获取模块采集到的题目数据和用户练习记录数据进行数据清洗,将清洗后的题目数据生成题目知识库;
查询特征配置模块:用于提取并配置题目知识库的题目查询特征q={xj},且j=1,2,...Q,Q为题目查询特征数量;所述的题目查询特征包括引用次数、平均提交次数、平均得分和题目难度;
用户界面:供用户输入查询的关键内容,所述关键内容包括期望查询的知识点C、期望获得的题目数量M、以及允许用户为不同的题目查询特征设置特征权重w1,w2...wQ,其中wj为题目的第j个查询特征权重,默认为1;生成查询向量r={C,M,w1,w2...wQ};
特征处理模块:读取用户界面获得的查询向量r,根据预先建立的题目ID-题目内容-知识点映射关系,选择题目知识库中位于用户查询知识点C下的所有题目ID,根据查询特征配置模块的配置结果生成题目查询特征矩阵I∈Rn×Q,n为查询知识点下的所有题目数量;对题目查询特征矩阵I进行标准化处理得到且i=1,2,...n;j=1,2,...Q,其中是标准化后的查询知识点C下第i个题目的第j个查询特征;根据查询向量r中的特征权重得到最终的查询特征矩阵
聚类计算模块:包括第一聚类单元、第二聚类单元、判断单元;
将查询特征矩阵作为第一聚类单元的输入,得到第一聚类结果;所述第一聚类结果包括类簇数K和初始类中心Θ0=[θ0,1,...,θ0,K]∈RQ×K;
将查询特征矩阵作为第二聚类单元的输入,并将第一聚类单元输出的类簇数K和类中心Θ0=[θ0,1,...,θ0,K]∈RQ×K作为第二聚类单元的目标条件,输出最终类中心Θ=[θ1,...,θk]∈RQ×K;
判断单元用于根据距离每一个题目最近的类中心判断每一个题目ID所属的类;
题目推荐模块:用于计算每一个题目ID的推荐得分值,并将所有题目ID按照推荐得分值从高到低进行排序,将前M个题目ID作为筛选结果,根据题目ID-题目内容-知识点映射关系,将M个题目ID对应的试题及所属知识点推送给用户。


2.根据权利要求1所述的一种基于答题统计特征的题目推荐系统,其特征在于,所述第一聚类单元选用DBSCAN聚类算法。


3.根据权利要求1所述的一种基于答题统计特征的题目推荐系统,其特征在于,所述第二聚类单元的计算步骤为:
步骤1:初设聚类参数s0<0,μ>1;
步骤2:计算权重:



其中,i=1,...,n;j=1,...,K...

【专利技术属性】
技术研发人员:陈建海马万腾沈睿周瑞祺余林恩何钦铭
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1