一种基于知识图谱的智能组卷方法技术

技术编号:36455315 阅读:17 留言:0更新日期:2023-01-25 22:53
本发明专利技术涉及一种基于知识图谱的智能组卷方法,包括:S1.根据用户输入的出题信息,在知识图谱中提取知识点,构建知识点子图;S2.计算知识点的维度重要度和图结构重要度,获取候选知识点;S3.基于候选知识点和测试目标,构建题目子图;S4.计算题目的结构相似度和题目间关系,去除重复度较高的题目,完成组卷。本发明专利技术能够基于知识图谱的数据进行知识点分析选取,进而选取合适的题目完成自动智能组卷。而选取合适的题目完成自动智能组卷。而选取合适的题目完成自动智能组卷。

【技术实现步骤摘要】
一种基于知识图谱的智能组卷方法


[0001]本专利技术属于计算机
,尤其涉及一种基于知识图谱的智能组卷系统及方法。

技术介绍

[0002]在教育领域中,考试是整个教学过程中最为重要的环节,通过考试,可以对学生的学习能力及对知识的掌握程度有一个准确的评估,有助于家长及老师及时掌握学生的学习状态,并对其进行指导,加强对薄弱环节的训练。
[0003]然而,如何基于已有的题目信息,生成一套合格的试卷,满足用户的实际需求,是十分困难的。在教学实践中,组卷的工作主要依赖组卷人员的教学经验,通过预先设置的约束条件如各题型在试卷中的比例及试卷考察的知识点等在题库中选取合适的题目进行组卷,这种方法往往受限于组卷人员的能力及主观性,而且效率较低,需要耗费较多人力物力。特别是随着试题数量以及组卷约束条件的增多,使得根据给定的组卷目标从海量试题中组合出一套满足需求的试卷的难度大大增加。
[0004]当前也有一些辅助方法用于自动组卷,比如随机抽题法、优先权策略法、回溯试探法、遗传算法、粒子群算法等,这些算法将题库组卷问题转换为解空间搜索问题,提高了自动组卷的多样性及效率,但是这些算法在题库规模较大和组卷约束条件复杂时,计算复杂度较大组卷速度较慢,且由于没有充分考虑题目所属知识点间的关系,因此组卷的质量往往较差,无法达到满意的效果,同时这些方法适应性能较差且鲁棒性不强,比如遗传算法和粒子群算法容易陷入局部最优解等。此外,已有的依据知识图谱组卷的方法中,大多数的考量指标为试卷的难度、区分度、知识点的比例、题型的比例等指标,较少考虑知识点间关系、题目间关系等信息。
[0005]基于以上问题,因此亟需一种可以更好考虑题目间关系的智能组卷的方法,使得最终组卷结果具有科学性和合理性。
[0006]知识图谱是一种以图的形式表达客观世界中的概念、实体以及实体间关系的知识库,是语义搜索、智能问答等服务的基础技术之一,也用于对当前领域热点和发展趋势进行探索和研究。在教育领域中,构建知识图谱可以将零散的知识点形成具有网络化、模块化、体系化的结构,便于对知识点间的关系进行进一步挖掘探索。然而,知识图谱的标准结构与内容并未达到统一,早期的知识图谱可描述为以学科知识为核心,建立各个学科的知识点概念建立层级关系,知识点与知识点之间的关联关系,不同知识点之间的前后序关系,构成学科知识图谱;后来演变为面向教与学全过程,将所有的教学信息建立关联,扩展教育属性描述,具有教育学的语义信息。

技术实现思路

[0007]针对以上问题,本专利技术提出一种基于知识图谱的智能组卷系统和方法,能够基于知识点的重要程度进行智能筛选组卷,降低了人工操作所需要的人力物力的损耗。
[0008]本专利技术提出的一种基于知识图谱的智能组卷方法,包括:
[0009]S1、根据用户输入的出题信息,在知识图谱中提取知识点,构建知识点子图;
[0010]S2、计算知识点的维度重要度和图结构重要度,获取候选知识点;
[0011]S3、基于候选知识点和测试目标,构建题目子图;
[0012]S4、计算题目的结构相似度和题目间关系,去除重复度较高的题目,完成组卷。
[0013]进一步地,在步骤S1中,所述知识图谱具有5层,分别为年级、章节、知识点、题目和测试目标,年级之间具有有向边,为前驱后继关系;同一年级下的章节之间具有有向边,为递进关系;同一章节下的知识点之间具有有向边,为前驱后继、包含关系;题目之间没有关系,即没有边;测试目标之间没有边;上级节点到下级节点具有有向边,所述测试目标包括但不限于对应学科素养、对应能力目标、对应题型、对应易错点。
[0014]进一步地,在步骤S1中,所述构建知识点子图的方法包括:将知识点作为节点,将知识图谱中知识点之间关系作为关系,构建知识点子图。
[0015]进一步地,所述关系包括但不限于前驱关系和包含关系。
[0016]进一步地,步骤S2包括:
[0017]S21、计算知识点的维度重要度,公式为:
[0018]G
i
=w1t
i
+w2h
i
+w3a
i
[0019]其中,i表示第几个知识点,G
i
为第i个知识点的维度重要度,t
i
表示知识点是否属于必测点,h
i
表示知识点是否为重要知识点,a
i
表示知识点权重信息,w
i
表示权重;
[0020]S22、计算所有知识点的图结构重要度,公式为:
[0021]H
i
=w4p
i
+w5c
i
[0022]其中,i表示第几个知识点,H
i
为第i个知识点的图结构重要度,p
i
为节点的PageRank值,表示图节点重要度,c
i
为节点覆盖度;
[0023]S23、知识点的最终重要度为维度重要度和图结构重要度之和;
[0024]S24、对于每个知识点最终重要度按从大到小排序,选取前K个知识点作为候选知识点,其中,K为用户输入的知识点数量。
[0025]进一步地,所述步骤S22中,节点覆盖度采用图网络的介数中心度进行评估,公式为:
[0026][0027]其中,i表示第几个知识点,I表示所有知识点,C
i
表示节点i的覆盖度,σ
st
表示节点s和t之间的最短路径的数量,而σ
st(i)
是最短路径中经过节点i的数量。
[0028]优选的,w1=0.4,w2=0.3,w3=0.3,w4=0.4,w5=0.6。
[0029]进一步地,在所述步骤S3中,根据候选知识点和测试目标,在知识图谱中获取题目子图,其中,题目子图的节点为题目节点、测试目标节点和题目节点对应的知识点节点;题目子图中关系包括题目与测试目标间的关系和题目与知识点间关系,而题目之间无关系。
[0030]进一步地,步骤S4包括:
[0031]S41、将题目子图中的题目作为候选组卷题集;
[0032]S42、若候选组卷题集数量大于预先设置的组卷所需题目总数,则执行步骤S43;否则程序停止;
[0033]S43、遍历子图中任意两个题目节点q
i
和q
j
,其中,i与j不相同,计算q
i
和q
j
之间的结构相似度s
ij
,若s
ij
大于预先设置的结构相似度阈值,则将q
i
和q
j
加入待比较集中;
[0034]S44、从待比较集中选取结构相似度最高的一对题目p1和p2,比较p1和p2节点的测试目标节点,若p1和p2的测试目标节点完全相同,则题目关系为并列关系;若测试目标节点超过半数以上相同,则题目关系为相似关系;对于这两种情况,从候选组卷题集中随机删除p1或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的智能组卷方法,其特征在于,所述方法包括:S1、根据用户输入的出题信息,在知识图谱中提取知识点,构建知识点子图;S2、计算知识点的维度重要度和图结构重要度,获取候选知识点;S3、基于候选知识点和测试目标,构建题目子图;S4、计算题目的结构相似度和题目间关系,去除重复度较高的题目,完成组卷。2.根据权利要求1所述的智能组卷方法,其特征在于,在步骤S1中,所述知识图谱具有5层,分别为年级、章节、知识点、题目和测试目标,年级之间具有有向边,为前驱后继关系;同一年级下的章节之间具有有向边,为递进关系;同一章节下的知识点之间具有有向边,为前驱后继、包含关系;题目之间没有关系,即没有边;测试目标之间没有边;上级节点到下级节点具有有向边,所述测试目标包括但不限于对应学科素养、对应能力目标、对应题型、对应易错点。3.根据权利要求1所述的智能组卷方法,其特征在于,在步骤S1中,所述构建知识点子图的方法包括:将知识点作为节点,将知识图谱中知识点之间关系作为关系,构建知识点子图。4.根据权利要求3所述的智能组卷方法,其特征在于,所述关系包括但不限于前驱后继关系、包含关系。5.根据权利要求1所述的智能组卷方法,其特征在于,步骤S2包括:S21、计算知识点的维度重要度,公式为:G
i
=w1t
i
+w2h
i
+w3a
i
其中,i表示第几个知识点,G
i
为第i个知识点的维度重要度,t
i
表示知识点是否属于必测点,h
i
表示知识点是否为重要知识点,a
i
表示知识点权重信息,w
i
表示权重;S22、计算所有知识点的图结构重要度,公式为:H
i
=w4p
i
+w5c
i
其中,i表示第几个知识点,H
i
为第i个知识点的图结构重要度,p
i
为节点的PageRank值,表示图节点重要度,c
i
为节点覆盖度;S23、知识点的最终重要度为维度重要度和图结构重要度之和;S24、对于每个知识点最终重要度按从大到小排序,选取前K个知识点作为候选知识点,其中,K为用户输入的知识点数量。6.根据权利要求5所述的智能组卷方法,其特征在于,所述步骤S22中,节点覆盖度采用图网络的...

【专利技术属性】
技术研发人员:陈鹏鹤余胜泉卢宇夏雪莹
申请(专利权)人:北京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1