当前位置: 首页 > 专利查询>扬州大学专利>正文

一种提取教学知识点关联的挖掘方法技术

技术编号:26504828 阅读:31 留言:0更新日期:2020-11-27 15:32
本发明专利技术公开了教育技术领域内的一种提取教学知识点关联的挖掘方法,包括以下步骤:(1)存储若干试题、试题对应的解析内容、相应科目知识点纲要合集;(2)根据知识点纲要合集,对试题及解析进行知识点识别,分析每道题目考察所涉及的知识点,形成每题对应的知识点集合,存入数据库一;(3)对不同题目的知识点集合进行关联分析,挖掘出所有频繁项集,存入数据二;(4)根据频繁项集,挖掘得到频繁关联规则;(5)将经常一起考察的的知识点群及其关联规则作为结果导出;使用本发明专利技术可提高提取知识点及其关联关系的效率。

【技术实现步骤摘要】
一种提取教学知识点关联的挖掘方法
本专利技术属于教育
,特别涉及一种提取教学知识点关联的挖掘方法。
技术介绍
现在的教学方式再也不是按部就班,而是需要教师充分发挥教育机智,不断创新进取,挖掘多样的教学方法。知识点虽然纷繁复杂,但其内部有着千丝万缕的联系,教师在教学过程中也有意地注意知识点间的逻辑关系、难易程度,由浅及深、多方拓展地设计教学,以便更好地促进学生迁移,提高学生的学习效率,然而人工筛查和梳理具有费时费力且容易有所遗漏的缺陷,效率低。
技术实现思路
本专利技术的目的在于,克服现有技术中的不足之处,提供一种提取教学知识点关联的挖掘方法,解决了现有技术中提取知识点关联关系效率低的技术难题,使用本专利技术可提高提取知识点及其关联关系的效率。本专利技术的目的是这样实现的:一种提取教学知识点关联的挖掘方法,包括以下步骤:(1)存储若干试题、试题对应的解析内容、相应科目知识点纲要合集;(2)根据知识点纲要合集,对试题及解析进行知识点识别,分析每道题目考察所涉及的知识点,形成每题对应的知识点集合,存入数据库一;(3)对不同题目的知识点集合进行关联分析,挖掘出所有频繁项集,存入数据二;(4)根据频繁项集,挖掘得到频繁关联规则;(5)将经常一起考察的知识点群及其关联规则作为结果导出。为了对试题进行知识点识别,所述步骤(2)中,知识点匹配的过程为,(201)去除每道题目解析中的无用词汇;(202)将知识点纲要合集中的知识点依次与每道题目解析进行匹配,找到每道题目所考察的知识点;(203)将知识点纲要合集中与题目解析匹配的知识点存入每道题对应考察的知识点集合中。为了进一步实现题目与知识点的匹配,所述步骤(202)中,题目与知识点进行匹配的步骤如下,(202a)题目与知识点进行匹配的步骤如下,(202a)将题目解析中的有用信息作为主串S,知识点纲要合集中的知识点作为模式串T,分别设置起始下标i=0,j=0,另外设置一个数组next,并令特殊值next[0]=0;(202b)如果S[i]=T[j],转至步骤(202c);若S[i]≠T[j],转至步骤(202d);(202c)将i加1,j加1,若i<n1且j<n2,返回步骤(202b),否则匹配结束,结束时,若j=n2-1且S[i]=T[j],则模式串T与S匹配成功,知识点T是S对应题目所考察的知识点;反之不是;(202d)若j=0,则i加1,j=next[j],返回步骤(202b);否则转步骤(202e);(202e)j=next[j],返回步骤(202b);其中,步骤(202c)中,next[j]为模式串T与主串S已匹配的前j个字符中找出其长度最长的相同前后缀的长度,前缀指除了最后一个字符以外,一个字符串的全部头部组合;后缀是指除了第一个字符以外,一个字符串的全部尾部组合;此设计中,字符串的长度为k,那么next[j]的值就为k,步骤(202b)中,模式串T回溯到T[k]再与S[i]比较,n1为主串的字符个数,n2为模式串的字符个数,这样避免模式串从头比较,提高匹配效率。为了对不同题目的知识点集合进行关联分析,挖掘出经常一起出现考察的知识点组合,所述步骤(3)中,挖掘频繁项集的方法具体包括以下步骤,(301)设置合适的最小支持度阈值min_sup,扫描数据库一,找出候选频繁1-项集,分别计算各个候选频繁1-项集的支持度support,利用最小支持度min_sup进行筛选,得出频繁1-项集L1;(302)采用递推方式,挖掘出频繁k’-项集Lk’(k’>1且为整数);(303)合并所有的频繁k”-项集;其中,步骤(301)中,support(A)=num(A)/num(I),支持度support(A)表示A在总项集里出现的概率,A表示数据库一中所有出现过的知识点,题库题号称为事务号,每个事务号对应一个数据库一中的知识点集合,称为项集,事务号与项集合称一个事务,I为数据库中所有事务的集合,称为总事务集,num(I)表示总事务集中事务的个数,num(A)表示含有A的事务集中总事务集中含有A的事务的个数,只有支持度support不小于最小支持度的候选频繁1-项集才能入选频繁1-项集,k”≥1且为整数。为了进一步分析频繁组合考察知识点间的前后关联,给教师教学顺序、难度的设计提供更多参考价值,所述步骤(302)中,具体的递推步骤为,(302a)生成候选频繁k’-项集Ck’(k>1);(302b)剪切掉Ck’中有一个(k’-1)子集不在Lk’-1中的数据项集;(302c)产生频繁k’-项集后,扫描数据库一,统计Ck’的支持度support(X→Y),支持度support(X→Y)不小于最小支持度阈值min_sup的加入最终的频繁k’-项集Lk’;(302d)重复上述3步,直至找不到新增的最终的频繁k’-项集;即support(X→Y)=num(XUY)/num(I),num(X∪Y)表示含有{X,Y}的事务的个数,一个题目(题库题号及对应知识点集)称为一个事务,num(I)表示总事务的个数,支持度support(X→Y)指的是在数据库一中同时包含X和Y这两个特征的事务数量占所有事务总数的百分比,X和Y分别是不同知识点。为了帮助挖掘者选择合适的最小支持度以提高挖掘效率,所述步骤(301)中,设置最小支持度min_sup的步骤如下,先随机抽取题库中的n套题,若题库总数量sum不大于10,则n=sum;否则,令n=10,抽取组数g,g=len(str(sum))-1,随机抽取g组,每组10套题库;接着设max_s=80%和min_s=10%,分别按最小支持度为max_s、min_s、med_s=(max_s+min_s)/2对样本题库解析进行频繁项集挖掘,若最小支持度为med_s时得到的频繁项集L总数量(当题库总数量sum大于10时,计算k组题库样本的L均值)大于挖掘者期望值,则将新的min_s值变为med_s,max_s不变,反之若小于期望值则将新max_s值变为med_s,min_s不变,继续挖掘最小支持度为med_s=(max_s+min_s)/2时的频繁项集,按上述步骤迭代直至得出符合挖掘者期望的最小支持度min_sup;其中,len为计算长度,str为将数值转换为字符串;此设计中,关于最小支持度min_sup的选择,有一定主观因素,不同最小支持度挖掘结果不同,若无一定挖掘经验盲目设置会导致系统负载严重,耗时低效,通过以上步骤帮助挖掘者选择合适的最小支持度以提高挖掘效率。为了进一步得到频繁关联规则,所述步骤(4)中,得到频繁关联规则的步骤如下,(401)设置合适的最小置信度min_conf,取合并后的频繁项集中的每个元素fq,分别产生fq的所有非空真子集按此方法,对数据库二中的频繁项集挖掘得到所有的知识点关联规则(402)计算每条关联规本文档来自技高网...

【技术保护点】
1.一种提取教学知识点关联的挖掘方法,其特征在于,包括以下步骤:/n(1)存储若干试题、试题对应的解析内容、相应科目知识点纲要合集;/n(2)根据知识点纲要合集,对试题及解析进行知识点识别,分析每道题目考察所涉及的知识点,形成每题对应的知识点集合,存入数据库一;/n(3)对不同题目的知识点集合进行关联分析,挖掘出所有频繁项集,存入数据二;/n(4)根据频繁项集,挖掘得到频繁关联规则;/n(5)将经常一起考察的知识点群及其关联规则作为结果导出。/n

【技术特征摘要】
1.一种提取教学知识点关联的挖掘方法,其特征在于,包括以下步骤:
(1)存储若干试题、试题对应的解析内容、相应科目知识点纲要合集;
(2)根据知识点纲要合集,对试题及解析进行知识点识别,分析每道题目考察所涉及的知识点,形成每题对应的知识点集合,存入数据库一;
(3)对不同题目的知识点集合进行关联分析,挖掘出所有频繁项集,存入数据二;
(4)根据频繁项集,挖掘得到频繁关联规则;
(5)将经常一起考察的知识点群及其关联规则作为结果导出。


2.根据权利要求1所述的一种提取教学知识点关联的挖掘方法,其特征在于,所述步骤(2)中,知识点匹配的过程为,
(201)去除每道题目解析中的无用词汇;
(202)将知识点纲要合集中的知识点依次与每道题目解析进行匹配,找到每道题目所考察的知识点;
(203)将知识点纲要合集中与题目解析匹配的知识点存入每道题对应考察的知识点集合中。


3.根据权利要求2所述的一种提取教学知识点关联的挖掘方法,其特征在于,所述步骤(202)中,题目与知识点进行匹配的步骤如下,
(202a)将题目解析中的有用信息作为主串S,知识点纲要合集中的知识点作为模式串T,分别设置起始下标i=0,j=0,另外设置一个数组next,并令特殊值next[0]=0;
(202b)如果S[i]=T[j],转至步骤(202c);若S[i]≠T[j],转至步骤(202d);
(202c)将i加1,j加1,若i<n1且j<n2,返回步骤(202b),否则匹配结束,结束时,若j=n2-1且S[i]=T[j],则模式串T与S匹配成功,知识点T是S对应题目所考察的知识点;反之不是;
(202d)若j=0,则i加1,j=next[j],返回步骤(202b);否则转步骤(202e);
(202e)j=next[j],返回步骤(202b);
其中,步骤(202c)中,next[j]为模式串T与主串S已匹配的前j个字符中找出其长度最长的相同前后缀的长度,前缀指除了最后一个字符以外,一个字符串的全部头部组合;后缀是指除了第一个字符以外,一个字符串的全部尾部组合。


4.根据权利要求1所述的一种提取教学知识点关联的挖掘方法,其特征在于,所述步骤(3)中,挖掘频繁项集的方法具体包括以下步骤,
(301)设置合适的最小支持度阈值min_sup,扫描数据库一,找出候选频繁1-项集,分别计算各个候选频繁1-项集的支持度support,利用最小支持度min_sup进行筛选,得出频繁1-项集L1;
(302)采用递推方式,挖掘出频繁k’-项集Lk’(k’>1且为整数);
(303)合并所有的频繁k”-项集;
其中,步骤(301)中,support(A)=num(A)/num(I),支持度support(A)表示A在总项集里出现的概率,A表示数据库一中所有出现过的知识点,题库题号称为事务号,每个事务号对应一个数据库一中的知识点集合,称为项集,事务号与项集合称一个事务,I为数据库中所有事务的集合,称为总事务集,num(I)表示总事务集的个数,num(A)表示总事务集中含有A的事务的个数,只有支持度support不小于最小支持度的候选频繁1-项集才能入选频繁1-项集,k”≥1且为整数。


5.根据权利要求4所述的一种提取教学知识点关联的挖掘方法,其特征在于,所述步骤(302)中,具体的递推步骤为,
(302a)生成候选频繁k’-项集Ck’(k>1);
(302b)剪切掉Ck’中有一个(k’-1)子集不在Lk’-1中的数据项集;
(302c)产生频繁k’-项集后,扫描数据库一,统计Ck’的支持度support(X→Y),支持度support(X→Y)不小于最小支持度阈值min_sup的加入最终的频繁k’-项集Lk’;
(302d)重复上述...

【专利技术属性】
技术研发人员:张竞佳赵耀刘子荷冷雨
申请(专利权)人:扬州大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1