一种基于答题统计特征的题目推荐系统技术方案

技术编号：26222685 阅读：21 留言：0更新日期：2020-11-04 10:53

本发明专利技术公开了一种基于答题统计特征的题目推荐系统，属于计算机辅助教学领域与数据挖掘领域，包括题目获取模块、预处理模块、查询特征配置模块、用户界面、特征处理模块、聚类计算模块和题目推荐模块。本推荐系统利用二次聚类的方式对从教学平台后台上任意给定的获取的题目集中高效筛选出与最能针对性解决用户需求的试题，采用多种评估方式相结合方法，基于答题统计特征能够较强的代表某一时间段内的用户对每一道题的掌握情况，且会随着掌握程度的提升以及教育质量的提升动态更新特征值的数值。在推荐中结合了聚类结果中类内信息及类间信息，保证了所推荐试题具有较强的代表性。弥补了辅助教学平台上相似题目过多，没有典型题目筛选机制的缺陷。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于答题统计特征的题目推荐系统
本专利技术涉及计算机辅助教学领域与数据挖掘领域，尤其涉及一种基于答题统计特征的题目推荐系统。
技术介绍
随着计算机和互联网技术的普及与流行，在线辅助教学平台的重要性与必要性日益显现。当今有许多平台，例如作业帮、拼题A、中国大学MOOC等，致力于研究数据驱动的数字教学个性化服务、个性化智能导学等，一般提供填空题、选择题、判断题等多种题型的自动判题功能。一些在线辅助教学平台经过长期的运营，拥有大量的原创题库和学生练习记录，累积了海量的结构化教学评测数据，这些评测数据蕴藏着不同层次的学习者在不同阶段的学习表现，也反映了全国各地上千位教师贡献的数万题的质量信息。然而，当前题库较大的在线教育平台大多存在着如下问题：(1)同一知识点大量题目内容相近。在共享开放平台中，每门课程的每个知识点下都有来自不同层次高校的众多教师贡献的题目，这些题目对知识点的考察角度不同，题目难易层次也有差别；但同一个知识点下存在许多题目，其内容间互相交叉，难易程度相近。这些题目的存在使得学习者要花费较多时间做相似的题，难以提高学习效率。(2)缺乏具有针对性题目的推送功能。现有的推送功能只是推送出一些与所属知识点相关的题目，而老师在考试或作业出题，学生在自主练习做题时都常常面临题目选择的问题，而选择一道题时不仅要考虑这道题包含的知识点和难度，还要考虑其在同类题目中的典型程度，这使得学习者无法快速找到高质量、有代表性的题目。现有技术中还存在一些通过决策树等方式进行个性化作业推...

【技术保护点】
1.一种基于答题统计特征的题目推荐系统，其特征在于，包括：/n题目获取模块：用于实时获取一段时间内的教学平台后台题目数据和用户练习记录数据，题目数据包括题目ID、总分、引用次数、用户ID、得分、提交时间和答题分布；同时建立题目ID、题目内容与所属知识点之间的题目ID-题目内容-知识点映射关系，所述题目内容包括试题和答案；/n预处理模块：用于将题目获取模块采集到的题目数据和用户练习记录数据进行数据清洗，将清洗后的题目数据生成题目知识库；/n查询特征配置模块：用于提取并配置题目知识库的题目查询特征q＝{x

【技术特征摘要】
1.一种基于答题统计特征的题目推荐系统，其特征在于，包括：
题目获取模块：用于实时获取一段时间内的教学平台后台题目数据和用户练习记录数据，题目数据包括题目ID、总分、引用次数、用户ID、得分、提交时间和答题分布；同时建立题目ID、题目内容与所属知识点之间的题目ID-题目内容-知识点映射关系，所述题目内容包括试题和答案；
预处理模块：用于将题目获取模块采集到的题目数据和用户练习记录数据进行数据清洗，将清洗后的题目数据生成题目知识库；
查询特征配置模块：用于提取并配置题目知识库的题目查询特征q＝{xj}，且j＝1，2，...Q，Q为题目查询特征数量；所述的题目查询特征包括引用次数、平均提交次数、平均得分和题目难度；
用户界面：供用户输入查询的关键内容，所述关键内容包括期望查询的知识点C、期望获得的题目数量M、以及允许用户为不同的题目查询特征设置特征权重w1，w2...wQ，其中wj为题目的第j个查询特征权重，默认为1；生成查询向量r＝{C，M，w1，w2...wQ}；
特征处理模块：读取用户界面获得的查询向量r，根据预先建立的题目ID-题目内容-知识点映射关系，选择题目知识库中位于用户查询知识点C下的所有题目ID，根据查询特征配置模块的配置结果生成题目查询特征矩阵I∈Rn×Q，n为查询知识点下的所有题目数量；对题目查询特征矩阵I进行标准化处理得到且i＝1，2，...n；j＝1，2，...Q，其中是标准化后的查询知识点C下第i个题目的第j个查询特征；根据查询向量r中的特征权重得到最终的查询特征矩阵
聚类计算模块：包括第一聚类单元、第二聚类单元、判断单元；
将查询特征矩阵作为第一聚类单元的输入，得到第一聚类结果；所述第一聚类结果包括类簇数K和初始类中心Θ0＝[θ0，1，...，θ0，K]∈RQ×K；
将查询特征矩阵作为第二聚类单元的输入，并将第一聚类单元输出的类簇数K和类中心Θ0＝[θ0，1，...，θ0，K]∈RQ×K作为第二聚类单元的目标条件，输出最终类中心Θ＝[θ1，...，θk]∈RQ×K；
判断单元用于根据距离每一个题目最近的类中心判断每一个题目ID所属的类；
题目推荐模块：用于计算每一个题目ID的推荐得分值，并将所有题目ID按照推荐得分值从高到低进行排序，将前M个题目ID作为筛选结果，根据题目ID-题目内容-知识点映射关系，将M个题目ID对应的试题及所属知识点推送给用户。

2.根据权利要求1所述的一种基于答题统计特征的题目推荐系统，其特征在于，所述第一聚类单元选用DBSCAN聚类算法。

3.根据权利要求1所述的一种基于答题统计特征的题目推荐系统，其特征在于，所述第二聚类单元的计算步骤为：
步骤1：初设聚类参数s0＜0，μ＞1；
步骤2：计算权重：

其中，i＝1，...，n；j＝1，...，K...

【专利技术属性】
技术研发人员：陈建海，马万腾，沈睿，周瑞祺，余林恩，何钦铭，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人