一种基于数据分析的机器打分系统及方法技术方案

技术编号:24497680 阅读:27 留言:0更新日期:2020-06-13 03:41
本发明专利技术属于数据分析技术领域,具体涉及一种基于数据分析的机器打分系统,包括:数据录入装置,用于录入学生的成绩数据;所述数据录入装置具有若干个,分配给不同的教师,教师分别通过专属的数据录入装置,录入学生的成绩信息;数据分析装置,用于对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密。数据安全性高,能够保证数据的私密性,保护学生隐私和数据安全,同时本发明专利技术的数据分析结果能够更加准确分析出学生成绩,更为客观展现学生成绩。

A machine scoring system and method based on data analysis

【技术实现步骤摘要】
一种基于数据分析的机器打分系统及方法
本专利技术属于数据分析
,具体涉及一种基于数据分析的机器打分系统及方法。
技术介绍
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。国际标准化组织(ISO)对计算机系统安全的定义是:为数据处理系统建立和采用的技术和管理的安全保护,保护计算机硬件、软件和数据不因偶然和恶意的原因遭到破坏、更改和泄露。由此计算机网络的安全可以理解为:通过采用各种技术和管理措施,使网络系统正常运行,从而确保网络数据的可用性、完整性和保密性。所以,建立网络安全保护措施的目的是确保经过网络传输和交换的数据不会发生增加、修改、丢失和泄露等。信息安全或数据安全有对立的两方面的含义:一是数据本身的安全,主要是指采用现代密码算法对数据进行主动保护,如数据保密、数据完整性、双向强身份认证等,二是数据防护的安全,主要是采用现代信息存储手段对数据进行主动防护,如通过磁盘阵列、数据备份、异地容灾等手段保证数据的安全,数据安全是一种主动的包含措施,数据本身的安全必须基于可靠的加密算法与安全体系,主要是有对称算法与公开密钥密码体系两种。数据处理的安全是指如何有效的防止数据在录入、处理、统计或打印中由于硬件故障、断电、死机、人为的误操作、程序缺陷、病毒或黑客等造成的数据库损坏或数据丢失现象,某些敏感或保密的数据可能不具备资格的人员或操作员阅读,而造成数据泄密等后果。
技术实现思路
本专利技术的主要目的在于提供一种基于数据分析的机器打分系统及方法,数据安全性高,能够保证数据的私密性,保护学生隐私和数据安全,同时本专利技术的数据分析结果能够更加准确分析出学生成绩,更为客观展现学生成绩。为达到上述目的,本专利技术的技术方案是这样实现的:一种基于数据分析的机器打分系统,包括:数据录入装置,用于录入学生的成绩数据;所述数据录入装置具有若干个,分配给不同的教师,教师分别通过专属的数据录入装置,录入学生的成绩信息;数据分析装置,用于对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密;其特征在于,所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密的方法执行以下步骤:步骤1:设定第一加密密钥函数,用Si表示,将每个输入变量与相对应的权重函数进行卷积运算,得到第一加密密钥的中间结果;步骤2:设定第二加密密钥函数,所述函数为明函数:设定随机判定阈值为:P;将第一加密密钥函数和第二加密密钥函数以及随机判定阈值进行卷积运算,得到加密的结果为:步骤3:分析计算前向加密结果的误差;设定训练的输出变量EI为实际值,但模型训练后会产生一个预测值为Oi,故得出误差函数为:其中m代表输入本次建模样本的数量,i表示第i个变量;步骤4:反向传播更新权重w直到误差函数算出的值再设定的阈值范围内,将得到的最终结果作为加密后的结果进行存储。进一步的,所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩的方法执行以下步骤:对采集的原始数据进行清洗和集成;对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集作为测试集,利用得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对分析结果的准确性进行评估。进一步的,所述数据分析装置,对采集的成绩信息进行清洗和集成的方法执行以下步骤:在坐标轴中设置四个象限的数据过滤集合分别采用如下公式进行表示:其中,x为成绩信息,为实数集合,p为第一参数,取值范围为:(1~10);q为第一参数,取值范围为:(11~100);将成绩信息落入数据过滤集合以外的数据进行剔除,完成数据的清洗和集成。进一步的,所述对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集的方法执行以下步骤:将数据清理和集成后的数据通过范式矩阵进行分离,将连续的数据进行离散化,简化后续计算的运算量;所述通过范式矩阵进行分离的方法使用如下公式进行分离:其中,||为进行范数运算,X为系数矩阵,其行列数与进行离散化的数据的种类一致,A为进行离散化的数据排列成的矩阵,G为调整系数,设置的范围为:(0.2~0.7)。进一步的,所述构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型的方法执行以下步骤:基于训练集使用如下的转换函数,对数据进行线性变换,进行逻辑回归模型的的参数进行求解:其中,x*为求解得到的参数;x为训练集;min为进行数据中的最小值计算;max为进行数据中的最大值计算;进行数据建模,得到分析模型;进行效果分析,包括:当模型训练结束后,采用如下公式,计算分析模型的分析结果与预测结果进行精准度计算,即得到R2得分,得分越高,表示分析准确率越高;其中y代表预测结果;代表分析结果;nsamples代表进入模型的样本量大小。一种基于数据分析的机器打分方法,所述方法执行以下步骤:数据录入装置,录入学生的成绩数据;数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密。进一步的,所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密的方法执行以下步骤:步骤1:设定第一加密密钥函数,用Si表示,将每个输入变量与相对应的权重函数进行卷积运算,得到第一加密密钥的中间结果;步骤2:设定第二加密密钥函数,所述函数为明函数:设定随机判定阈值为:P;将第一加密密钥函数和第二加密密钥函数以及随机判定阈值进行卷积运算,得到加密的结果为:步骤3:分析计算前向加密结果的误差;设定训练的输出变量EI为实际值,但模型训练后会产生一个预测值为Oi,故得出误差函数为:其中m代表输入本次建模样本的数量,i表示第i个变量;步骤4:反向传播更新权重w直到误差函数算出的值再设定的阈值范围内,将得到的最终结果作为加密后的结果进行存储。进一步的,所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩的方法执行以下步骤:对采集的原始数据进行清洗和集成;对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集作为测试集,利用得到的最终的分析模型进行测本文档来自技高网
...

【技术保护点】
1.一种基于数据分析的机器打分系统,包括:数据录入装置,用于录入学生的成绩数据;所述数据录入装置具有若干个,分配给不同的教师,教师分别通过专属的数据录入装置,录入学生的成绩信息;数据分析装置,用于对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密;其特征在于,所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密的方法执行以下步骤:步骤1:设定第一加密密钥函数,用S

【技术特征摘要】
1.一种基于数据分析的机器打分系统,包括:数据录入装置,用于录入学生的成绩数据;所述数据录入装置具有若干个,分配给不同的教师,教师分别通过专属的数据录入装置,录入学生的成绩信息;数据分析装置,用于对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密;其特征在于,所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩,以及对录入的成绩信息进行加密的方法执行以下步骤:步骤1:设定第一加密密钥函数,用Si表示,将每个输入变量与相对应的权重函数进行卷积运算,得到第一加密密钥的中间结果;步骤2:设定第二加密密钥函数,所述函数为明函数:

设定随机判定阈值为:P;将第一加密密钥函数和第二加密密钥函数以及随机判定阈值进行卷积运算,得到加密的结果为:步骤3:分析计算前向加密结果的误差;设定训练的输出变量EI为实际值,但模型训练后会产生一个预测值为Oi,故得出误差函数为:其中m代表输入本次建模样本的数量,i表示第i个变量;步骤4:反向传播更新权重w直到误差函数算出的值再设定的阈值范围内,将得到的最终结果作为加密后的结果进行存储。


2.如权利要求1所述的系统,其特征在于,所述数据分析装置,对录入的成绩信息进行数据分析,得出学生的综合成绩的方法执行以下步骤:对采集的原始数据进行清洗和集成;对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集;构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型;将样本集中的另一份数据集作为测试集,利用得到的最终的分析模型进行测试,以得到分析结果;采用多种评估度量对分析结果的准确性进行评估。


3.如权利要求2所述的系统,其特征在于,所述数据分析装置,对采集的成绩信息进行清洗和集成的方法执行以下步骤:在坐标轴中设置四个象限的数据过滤集合分别采用如下公式进行表示:










其中,x为成绩信息,为实数集合,p为第一参数,取值范围为:(1~10);q为第一参数,取值范围为:(11~100);将成绩信息落入数据过滤集合以外的数据进行剔除,完成数据的清洗和集成。


4.如权利要求3所述的系统,其特征在于,所述对经预处理后的数据利用熵进行离散化处理,以得到为标称型数据的样本集的方法执行以下步骤:将数据清理和集成后的数据通过范式矩阵进行分离,将连续的数据进行离散化,简化后续计算的运算量;所述通过范式矩阵进行分离的方法使用如下公式进行分离:其中,
||为进行范数运算,X为系数矩阵,其行列数与进行离散化的数据的种类一致,A为进行离散化的数据排列成的矩阵,G为调整系数,设置的范围为:(0.2~0.7)。


5.如权利要求4所述的系统,其特征在于,所述构建用于训练的逻辑回归模型,从经数据转换的样本集中随机抽取一份数据集作为训练集,并基于该训练集对构建的逻辑回归模型的参数进行求解,以得到最终的分析模型的方法执行以下步骤:基于训练集使用如下的转换函数,对数据进行线性变换,进行逻辑回归模型的的参数进行求解:

其中,x*为求解得到的参数;x为训练集;min为...

【专利技术属性】
技术研发人员:陈红光张福秋
申请(专利权)人:温州市中鼎网络科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1