当前位置: 首页 > 专利查询>中南大学专利>正文

基于数据挖掘的在校学生成绩预警方法技术

技术编号:15501110 阅读:113 留言:0更新日期:2017-06-03 22:38
本发明专利技术公开了一种基于数据挖掘的在线学生成绩预警方法,包括获取学校已毕业学生的成绩数据并分等;采用Apriori算法挖掘成绩数据中所有符合最小支持度计数值的频繁项集;利用频繁项集得到所有强关联规则;对在校学生的所有成绩运用强关联规则进行数据运算,得到成绩的预测和预警结果。本发明专利技术通过获取往届学生的学习成绩数据,并对获取的成绩数据进行数据挖掘和关联分析,从而得到各科成绩之间的强关联规则,并根据获得的各科成绩之间的强关联规则对在校学生的成绩进行预测和预警,因此本发明专利技术方法从客观的数据出发,能够及时和实时的对学生的成绩进行预测和预警,而且客观,合理,科学,计算速度快,精度高。

A method of early warning for students' achievement based on Data Mining

The invention discloses a data mining online early warning method based on student achievement, including the results of data acquisition and classification of school graduate students have been using the Apriori algorithm; data mining results all meet the minimum support count of frequent itemsets; using frequent itemsets to all strong association rules; students in all grades the use of strong association rules for data processing, get the results of forecasting and early warning results. The present invention through learning data acquisition and graduates, and data mining and association analysis to the results of data acquisition, so as to obtain the strong association rules between subjects, and according to the strong association rules between the subjects of college students performance prediction and warning, so the method starting from the objective data. That can forecast and early warning, timely and real-time on student achievement and objective, scientific, reasonable, fast calculation speed and high precision.

【技术实现步骤摘要】
基于数据挖掘的在校学生成绩预警方法
本专利技术具体涉及一种基于数据挖掘的在线学生成绩预警方法。
技术介绍
随着经济技术的发展和人们生活水平的提高,教育已经成为了人们最为关注的领域之一,国家对于教育的投入也在逐年增长。因此,越来越多的人们走入青青校园,开始了学生生涯。毫无疑问的,在校学生的首要任务便是学习。但是现在发达的科技使得人们的娱乐方式越来越多,各类娱乐设备层出不穷,娱乐方式也日新月异,从而使得许多在校学生丢下学业沉迷其中。目前对于学生在校学习状态的反馈,一般都是老师通过学生的学习状态、外在表现等进行人为判断和反馈,其整个过程充满了主观性和不确定性。很多时候,老师由于教学事务繁忙而无法及时获取或忽视了学生的学习状态,而在学生考试失败或者学习成绩失败后才想起进行干预,这无疑事倍功半。
技术实现思路
本专利技术的目的在于提供一种基于历史数据的、能够客观和及时为学生的学习成绩提供预警的基于数据挖掘的在线学生成绩预警方法。本专利技术提供的这种基于数据挖掘的在线学生成绩预警方法,包括如下步骤:S1.获取学校已毕业学生的所有m个科目的成绩数据,将成绩数据划分为n个等级,并建立相应的数据库;所述m和n均为自然数;S2.针对步骤S1得到的成绩数据,采用Apriori算法挖掘成绩数据中所有符合最小支持度计数值的频繁项集;S3.利用步骤S2得到的频繁项集构建所有潜在的规则,计算构建的所有规则的条件概率,并与最小置信度值进行比较得到满足条件的所有强关联规则;S4.对在校学生的所有成绩运用步骤S3得到的所有强关联规则进行数据运算,得到在校学生的课程成绩的预测结果,并对课程成绩预测结果不合格的学生进行成绩预警。步骤S1所述的获取学校已毕业学生的成绩数据,具体为以学院为单位进行成绩数据的获取。步骤S1所述的将成绩数据划分为n个等级,具体为按照如下规则进行等级划分:若成绩数据是分数制,则90~100分划分为等级“优良”,75~89分划分为等级“中等”,0~74分划分为等级“差”;若成绩数据是等级制,则等级A划分为等级“优良”,等级B划分为等级“中等”,等级C及以下划分为等级“差”。步骤S2所述的采用Apriori算法挖掘成绩数据中所有符合最小支持度计数值的频繁项集,具体为采用改进型Apriori算法进行频繁项集的挖掘,具体包括如下步骤:A.设置Apriori算法的最小支持度;B.扫描步骤S1建立的数据库,根据数据库的记录数设定编码长度,然后对每条记录进行扫描,将出现记录的位置置为1,未出现记录的位置置为0,从而得到该项的一个编码位串;C.在步骤B得到的编码位串中,对每个编码位串中“1”出现的次数进行统计得到第一统计数值,并将第一统计数值与最小支持度计数值进行比较,并保留第一统计数值大于或等于最小支持度的编码位串和对应的项,得到频繁项集L1;D.对步骤C中得到的频繁项集L1中的所有项进行两两连接形成候选项集C2,同时对两两连接的项的编码位串之间进行与运算从而生成新的编码位串;E.对步骤D中生成的新的编码位串中的“1”再次进行统计得到第二统计数值,并保留第二统计数值大于或等于最小支持度计数值的编码位串和对应的项,得到频繁项集L2;F.重复步骤D~步骤E,在由频繁项集Lk相互连接构建候选项集Ck+1前,统计频繁项集Lk中各单项出现在频繁项集Lk中的次数,得到第三统计数值;若Lk中某个单项的第三统计数值小于k,则将频繁项集Lk中包含此单项的项剔除,从而得到修建后的频繁项集L’k;所述k为不小于2的自然数;G.将频繁项集L’k中的各个项进行连接操作,并在连接过程中进行相连接的两个项的编码位串进行与运算,然后对生成的候选项集的Ck+1编码位串中的“1”进行计数操作得到第k+1统计数值,并保留第k+1统计数值大于或等于最小支持度计数值的编码位串和对应的项,得到频繁项集Lk+1;H.重复上述步骤F~步骤G,直至最终得到的频繁项集为空集。步骤S3所述的利用得到的频繁项集计算得到所有强关联规则,具体为采用如下步骤进行计算得到所有强关联规则:a.设置最小置信度;b.在获取的频繁项集中,对每一个频繁项集Li进行循环遍历,并取其中的第1~第i项作为条件,以剩余的项作为结论构件条件概率;所述的条件概率为取出的项的支持度数值与剩下的项的支持度数值的比值;c.将步骤b中得到的条件概率与最小置信度进行比较,保留条件概率值大于等于最小置信度的所有关联规则;所保留的关联规则即为强关联规则。本专利技术提供的这种基于数据挖掘的在线学生成绩预警方法,通过获取往届学生的学习成绩数据,并对获取的成绩数据进行数据挖掘和关联分析,从而得到各科成绩之间的强关联规则,并根据获得的各科成绩之间的强关联规则对在校学生的成绩进行预测和预警,因此本专利技术方法从客观的数据出发,能够及时和实时的对学生的成绩进行预测和预警,而且本专利技术方法客观,合理,科学,计算速度快,精度高。附图说明图1为本专利技术方法的整体流程示意图。图2为本专利技术方法的方法流程图。具体实施方式如图1所示为本专利技术方法的整体流程示意图,图2为本专利技术方法的方法流程图:本专利技术提供的这种基于数据挖掘的在线学生成绩预警方法,包括如下步骤:S1.获取学校已毕业学生的所有m个科目的成绩数据,将成绩数据划分为n个等级,并建立相应的数据库;所述m和n均为自然数;对于大学生,以学院为单位进行成绩数据的获取;将成绩数据划分为n个等级,具体为按照如下规则进行等级划分:若成绩数据是分数制,则90~100分划分为等级“优良”,75~89分划分为等级“中等”,0~74分划分为等级“差”;若成绩数据是等级制,则等级A划分为等级“优良”,等级B划分为等级“中等”,等级C及以下划分为等级“差”;S2.针对步骤S1得到的成绩数据,采用Apriori算法挖掘成绩数据中所有符合最小支持度计数值的频繁项集,具体包括如下步骤:A.设置Apriori算法的最小支持度;B.扫描步骤S1建立的数据库,根据数据库的记录数设定编码长度,比如一个学生的各科成绩为一条记录,数据库若包含n个学生的课程成绩,那么,编码的长度即为n。例如:数据库中有5个学生的记录,那么编码长度就为5;然后对每条记录进行扫描,将出现记录的位置置为1,未出现记录的位置置为0,从而得到该项的一个编码位串;首先明确“项”的概念:项就是在对成绩进行分等后,对某门课程及成绩的一个标识,例如我们将大学物理转换为S00,S01,S02,这就属于三个项,前两位标识某一课程,最后一位是根据成绩映射而来,0表示差,1表示中等,2表示优良。根据总记录数为5,我们设置编码长度为5。根据具体实施例中的表2,S00出现在第一和第四条记录中,那么其编码为“10010”;同理,S01出现在第二三条记录中,其编码为“01100”,S02为“00001”。对所有的项进行扫描编码即得到了表3C.在步骤B得到的编码位串中,对每个编码位串中“1”出现的次数进行统计得到第一统计数值,并将第一统计数值与最小支持度计数值进行比较,并保留第一统计数值大于或等于最小支持度计数值的编码位串和对应的项,得到频繁项集L1;D.对步骤C中得到的频繁项集L1中的所有项进行两两连接形成候选项集C2,同时对两两连接的项的编码位串之间进行与运算从而生成新的编码位串;举个例子,如果项A和项B本文档来自技高网...
基于数据挖掘的在校学生成绩预警方法

【技术保护点】
一种基于数据挖掘的在线学生成绩预警方法,包括如下步骤:S1.获取学校已毕业学生的所有m个科目的成绩数据,将成绩数据划分为n个等级,并建立相应的数据库;所述m和n均为自然数;S2.针对步骤S1得到的成绩数据,采用Apriori算法挖掘成绩数据中所有符合最小支持度计数值的频繁项集;S3.利用步骤S2得到的频繁项集构建所有潜在的规则,计算构建的所有规则的条件概率,并与最小置信度值进行比较得到满足条件的所有强关联规则;S4.对在校学生的所有成绩运用步骤S3得到的所有强关联规则进行数据运算,得到在校学生的课程成绩的预测结果,并对课程成绩预测结果不合格的学生进行成绩预警。

【技术特征摘要】
1.一种基于数据挖掘的在线学生成绩预警方法,包括如下步骤:S1.获取学校已毕业学生的所有m个科目的成绩数据,将成绩数据划分为n个等级,并建立相应的数据库;所述m和n均为自然数;S2.针对步骤S1得到的成绩数据,采用Apriori算法挖掘成绩数据中所有符合最小支持度计数值的频繁项集;S3.利用步骤S2得到的频繁项集构建所有潜在的规则,计算构建的所有规则的条件概率,并与最小置信度值进行比较得到满足条件的所有强关联规则;S4.对在校学生的所有成绩运用步骤S3得到的所有强关联规则进行数据运算,得到在校学生的课程成绩的预测结果,并对课程成绩预测结果不合格的学生进行成绩预警。2.根据权利要求1所述的基于数据挖掘的在线学生成绩预警方法,其特征在于步骤S1所述的获取学校已毕业学生的成绩数据,具体为以学院为单位进行成绩数据的获取。3.根据权利要求1所述的基于数据挖掘的在线学生成绩预警方法,其特征在于步骤S1所述的将成绩数据划分为n个等级,具体为按照如下规则进行等级划分:若成绩数据是分数制,则90~100分划分为等级“优良”,75~89分划分为等级“中等”,0~74分划分为等级“差”;若成绩数据是等级制,则等级A划分为等级“优良”,等级B划分为等级“中等”,等级C及以下划分为等级“差”。4.根据权利要求1~3之一所述的基于数据挖掘的在线学生成绩预警方法,其特征在于步骤S2所述的采用Apriori算法挖掘成绩数据中所有符合最小支持度计数值的频繁项集,具体为采用改进型Apriori算法进行频繁项集的挖掘,具体包括如下步骤:A.设置Apriori算法的最小支持度;B.扫描步骤S1建立的数据库,根据数据库的记录数设定编码长度,然后对每条记录进行扫描,将出现记录的位置置为1,未出现记录的位置置为0,从而得到该项的一个编码位串;C.在步骤B得到的编码位串中,对每个编码位串中“...

【专利技术属性】
技术研发人员:邓晓衡陈琳杰龙芳黄戎陈凌驰郑静益
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1