一种信息素养数据挖掘方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24331126 阅读:52 留言:0更新日期:2020-05-29 19:38
本发明专利技术公开了一种信息素养数据挖掘方法、装置、电子设备及存储介质。该方法包括:采集被测试者的信息素养测试数据,将所述测试数据存储为成绩矩阵表;采集专家对指标的重要度评价数据,将所述重要度评价数据存储为组比较矩阵;构建数据挖掘模型,所述数据挖掘模型用于接收所述成绩矩阵表和所述组比较矩阵,根据所述成绩矩阵表运用熵值法获得第一指标权重,根据所述组比较矩阵运用层次分析法获得第二指标权重,根据所述第一指标权重和第二指标权重获得综合权重,根据所述综合权重输出被测试者的信息素养等级数据。本发明专利技术实现了对采集数据的自动化处理,能够有效提高数据挖掘的可信度,从而对被测试者的信息素养水平进行科学可靠的评估。

An information literacy data mining method, device, electronic equipment and storage medium

【技术实现步骤摘要】
一种信息素养数据挖掘方法、装置、电子设备及存储介质
本专利技术属于教育信息化评价
,更具体地,涉及一种信息素养数据挖掘方法、装置、电子设备及存储介质。
技术介绍
在信息化高速发展的浪潮下,教育领域也已经与科技充分结合并演变出丰富多彩的形式。如何利用计算机来设计、开发一套可用于测量我国学生信息素养水平的评估工具、充分从测试数据中挖掘信息,对学生的信息素养水平进行科学可靠的评估、提高评估的可信度是十分必要的。
技术实现思路
针对现有技术的至少一个缺陷或改进需求,本专利技术提供了一种信息素养数据挖掘方法、装置、电子设备及存储介质。为实现上述目的,按照本专利技术的一个方面,提供了一种信息素养数据挖掘方法,包括:采集被测试者的信息素养测试数据,将所述测试数据存储为成绩矩阵表;采集专家对指标的重要度评价数据,将所述重要度评价数据存储为组比较矩阵;构建数据挖掘模型,所述数据挖掘模型用于接收所述成绩矩阵表和所述组比较矩阵,根据所述成绩矩阵表运用熵值法获得第一指标权重,根据所述组比较矩阵运用层次分析法获得第二指标权重,根据所述第一指标权重和第二指标权重获得综合权重,根据所述综合权重输出被测试者的信息素养等级数据。优选地,所述将所述测试数据存储为成绩矩阵表包括:信息素养测试数据中每题记为一分,将正确结果为得1分,错误记为0分,汇总结果,储存为一个n×m的成绩表T,n为被测试者数目,m为题目数,表的每行代表一个被测试者的所有题目成绩,表的每列代表某题所有被测试者的作答情况;将同一最低指标中的题目分数相加得到指标原始分数,转换为一个n×k的原始分数表T_org,n为被测试者数目,k为最低层级指标数,表的每行代表一个被测试者的所有维度原始成绩,表的每列代表某维度所有被测试者的原始成绩。优选地,所述根据所述成绩矩阵表运用熵值法获得第一指标权重包括:步骤(21):对每个指标标准化处理将n×k的原始分数表T_org转换为n×k的标准分数表T_std,标准化处理方法是:将k个指标记为X1,X2,..Xk,每个指标有n个元素,指标Xi=xi1,xi2,...,xin标准化后的指标X′i的元素x′ij可表示为:x′ij=(xij-min{xi1,…,xin})/(max{xi1,…,xin}-min{xi1,…,xin})步骤(22):根据标准分数表T_std运用熵值法计算第一指标权重,具体是:根据信息熵的定义,标准分数表T_std中指标X′i的信息熵ei为:其中,pij为第j项指标下第i个样本值占该指标的比重,各指标的权重可表示为:结果储存为长度为k的最低级指标的第一指标权重,将高级指标对应的低级指标第一指标权重相加便可得到高级指标的第一指标权重。优选地,所述将所述重要度评价数据存储为组比较矩阵包括:建立层次结构模型,将决策目标、考虑因素和决策对象绘出层次结构图,构造判断矩阵,根据所述重要度评价数据得到专家e的个体判断矩阵Ae:判断矩阵Ae中各元素aij为i行指标相对j列指标进行重要性两两比较的值,p为同一层次内指标数量,将Ae储存为p×p二维数组;再将个人判断矩阵合成为组比较矩阵A:将A储存为p×p二维数组。优选地,根据所述判断矩阵运用层次分析法获得第二指标权重包括:步骤(31):将比较矩阵A的各行向量进行几何平均,然后归一化,得到的行向量就是所述第二指标权重,具体计算方法如下:将A的最大特征根记为λmax,其相应的第二指标权重为W,则有AW=λmaxW,1)判断矩阵每一行元素的乘积Mi可表示为:其中i=1,2,...,p。结果储存为长度为p的向量M,2)计算Mi的p次方根可表示为:结果储存为长度为p的向量W_sqrt,3)对指标权重ω进行归一化处理:结果储存为长度为p的向量W_level,4)计算判断矩阵的最大特征根λmax:步骤(32):计算一致性指标CI,结合一致性系数RI计算得到一致性比率CR:当CR<0.1时,比较矩阵A的不一致性程度在容许范围内,步骤(33):先对最高级指标进行分析,再对同一指标内的次级指标进行逐层分析,指标的第二指标权重是步骤3)中计算得到的权重ωi和其上级指标在步骤3)中计算得到的权重ωi的乘积,最后,最低级指标的权重存为长度为k的第二指标权重。优选地,根据所述第一指标权重和第二指标权重获得综合权重包括:将所述第一指标权重记为x1,x2,…,xk,将所述第二指标权重记为y1,y2,…,yk,k为最低级指标数,组合权重可表示为z1,z2,…,zk,最后得出综合权重为:结果储存为长度为k的综合指标权重向量Wc。优选地,根据所述综合权重输出被测试者的信息素养等级数据包括:将所述成绩矩阵表与所述综合权重按指标对应相乘并乘以100,得到各指标对应分数表T_index,再将分数表T_index各指标分数逐层汇总相加,得到最终信息素养总分,最后输出添加了汇总分数列的信息素养分数表T_IL。根据本专利技术的第二方面,提供了一种信息素养数据挖掘装置,包括:信息素养测试数据采集转换模块,用于采集被测试者的信息素养测试数据,将所述测试数据存储为成绩矩阵表;重要度评价数据采集转换模块,用于采集专家对指标的重要度评价数据,将所述重要度评价数据存储为组比较矩阵;数据挖掘模型构建模块,用于构建数据挖掘模型,所述数据挖掘模型用于接收所述成绩矩阵表和所述组比较矩阵,根据所述成绩矩阵表运用熵值法获得第一指标权重,根据所述组比较矩阵运用层次分析法获得第二指标权重,根据所述第一指标权重和第二指标权重获得综合权重,根据所述综合权重输出被测试者的信息素养等级数据。根据本专利技术的第三方面,提供了一种电子设备,包括处理器和存储器,其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现上述任一方法。根据本专利技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,具有有益效果:能够利用计算机来设计、开发一套可用于测量我国学生信息素养水平的评估工具,通过构建数据挖掘模型来获取第一指标权重、第二指标权重、综合权重以及输出信息素养等级数据,实现了对采集数据的自动化处理,能够有效提高数据挖掘的可信度,能够充分从测试数据中挖掘信息,对被测试者的信息素养水平进行科学可靠的评估,从而提高评估的可信度。附图说明图1是本专利技术实施例提供的一种信息素养数据挖掘方法的流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清本文档来自技高网...

【技术保护点】
1.一种信息素养数据挖掘方法,其特征在于,包括:/n采集被测试者的信息素养测试数据,将所述测试数据存储为成绩矩阵表;/n采集专家对指标的重要度评价数据,将所述重要度评价数据存储为组比较矩阵;/n构建数据挖掘模型,所述数据挖掘模型用于接收所述成绩矩阵表和所述组比较矩阵,根据所述成绩矩阵表运用熵值法获得第一指标权重,根据所述组比较矩阵运用层次分析法获得第二指标权重,根据所述第一指标权重和第二指标权重获得综合权重,根据所述综合权重输出被测试者的信息素养等级数据。/n

【技术特征摘要】
1.一种信息素养数据挖掘方法,其特征在于,包括:
采集被测试者的信息素养测试数据,将所述测试数据存储为成绩矩阵表;
采集专家对指标的重要度评价数据,将所述重要度评价数据存储为组比较矩阵;
构建数据挖掘模型,所述数据挖掘模型用于接收所述成绩矩阵表和所述组比较矩阵,根据所述成绩矩阵表运用熵值法获得第一指标权重,根据所述组比较矩阵运用层次分析法获得第二指标权重,根据所述第一指标权重和第二指标权重获得综合权重,根据所述综合权重输出被测试者的信息素养等级数据。


2.如权利要求1所述的一种信息素养数据挖掘方法,其特征在于,所述将所述测试数据存储为成绩矩阵表包括:
信息素养测试数据中每题记为一分,将正确结果为得1分,错误记为0分,汇总结果,储存为一个n×m的成绩表T,n为被测试者数目,m为题目数,表的每行代表一个被测试者的所有题目成绩,表的每列代表某题所有被测试者的作答情况;
将同一最低指标中的题目分数相加得到指标原始分数,转换为一个n×k的原始分数表T_org,n为被测试者数目,k为最低层级指标数,表的每行代表一个被测试者的所有维度原始成绩,表的每列代表某维度所有被测试者的原始成绩。


3.如权利要求2所述的一种信息素养数据挖掘方法,其特征在于,所述根据所述成绩矩阵表运用熵值法获得第一指标权重包括:
步骤(21):对每个指标标准化处理将n×k的原始分数表T_org转换为n×k的标准分数表T_std,标准化处理方法是:
将k个指标记为X1,X2,..Xk,每个指标有n个元素,指标Xi=xi1,xi2,...,xin标准化后的指标X′i的元素x′ij可表示为:
x′ij=(xij-min{xi1,…,xin})/(max{xi1,…,xin}-min{xi1,…,xin})
步骤(22):根据标准分数表T_std运用熵值法计算第一指标权重,具体是:
根据信息熵的定义,标准分数表T_std中指标X′i的信息熵ei为:






其中,pij为第j项指标下第i个样本值占该指标的比重,
各指标的权重可表示为:



结果储存为长度为k的最低级指标的第一指标权重,将高级指标对应的低级指标第一指标权重相加便可得到高级指标的第一指标权重。


4.如权利要求1所述的一种信息素养数据挖掘方法,其特征在于,所述将所述重要度评价数据存储为组比较矩阵包括:
建立层次结构模型,将决策目标、考虑因素和决策对象绘出层次结构图,构造判断矩阵,根据所述重要度评价数据得到专家e的个体判断矩阵Ae:



判断矩阵Ae中各元素aij为i行指标相对j列指标进行重要性两两比较的值,p为同一层次内指标数量,将Ae储存为p×p二维数组;
再将个人判断矩阵合成为组比较矩阵A:



将A储存为p×p二维数组。


5.如权利要求4所述的一种信息素养数据挖掘方法,其特征在于,根据所述判断矩阵运用层次分析法获得第二指标权重包括:
步骤(31):将比较矩阵A的各行向量进行几何...

【专利技术属性】
技术研发人员:吴砥朱莎徐建
申请(专利权)人:华中师范大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1