一种基于自编码器聚类算法的高校教师评价方法技术

技术编号:39420208 阅读:11 留言:0更新日期:2023-11-19 16:09
本发明专利技术涉及教育评价领域,具体涉及一种基于自编码器聚类算法的高校教师评价方法。包括以下步骤:训练一个用于去噪的生成器;得到去噪后的评分数据集X',通过DEC算法构造编码器网络与解码器网络,计算重构损失,聚类损失;得到数据的低维特征H;使用LOF算法,计算低维特征H每个点的局部离群因子;计算去噪损失:将局部离群因子大于1的点都减去1,并累加,作为去噪损失;进行迭代训练,每次训练用去噪损失更新生成器,用聚类损失与重构损失更新编码器网络;达到训练结束条件后,输出聚类结果。本算法在现有的自编码聚类算法的基础上,预训练了一个去噪网络,同时用LOF算法对其进行微调,提高了在教育评价时的效果。了在教育评价时的效果。了在教育评价时的效果。

【技术实现步骤摘要】
一种基于自编码器聚类算法的高校教师评价方法


[0001]本专利技术涉及教育评价领域,具体涉及一种基于自编码器聚类算法的高校教师评价方法。

技术介绍

[0002]高校教育的发展对于推动社会进步有着有着重要作用,而高校教师的评价在一定程度上决定了高校教育的发展。但由于高校教师“五唯”评价的负面效果愈演愈烈,教师评价导向出现偏差,传统的高校教师评价方法已经很难客观地对高校教师进行评分,这时迫切需要一种可以客观评价高校教师各方面能力的方法。而聚类是一种无监督学习算法,它通过将数据集中相似的数据点划分到同一类别中,形成有意义的簇,从而帮助理解数据集中的潜在结构和模式。评价则是对对象进行质量评估的过程。通过将聚类应用于评价问题中,可以根据聚类结果来评估对象的质量。
[0003]针对现有的深度自编码器聚类方法,很多学者做了深入的研究。例如Guo X等学者(Guo X,Gao L,Liu X,et al.Improved deep embedded clustering with local structure preservation[C]//Ijcai.2017:1753

1759.)提出了一种改进的深度自编码器聚类,在损失函数中加入了重构损失,以减小聚类损失对于表示空间的破坏程度。Ghasedi DizajiK等学者(Ghasedi Dizaji K,Herandi A,Deng C,et al.Deep clustering via joint convolutional autoencoder embedding and relative entropy minimization[C]//Proceedings of the IEEE international conference on computer vision.2017:5736

5745.)提出了DEPICT算法,融合了子空间的思想,并提出了净前馈自编码器的概念。Guo X等学者(Guo X,Liu X,Zhu E,et al.Deep clustering with convolutional autoencoders[C]//Neural Information Processing:24th International Conference,ICONIP 2017,Guangzhou,China,November 14

18,2017,Proceedings,Part II 24.Springer International Publishing,2017:373

382.)还提出了一种基于跨步卷积层的深度自编码器聚类,以跨步卷积层替代了全连接层,增强了对于高级语义特征的提取能力。Mrabah N等学者(Mrabah N,Khan N M,Ksantini R,et al.Deep clustering with a dynamic autoencoder:From reconstruction towards centroids construction[J].Neural Networks,2020,130:206

228.)提出了DynAE算法,通过提取特征的置信度分别采取重建或者聚类的方式更好地平衡了重构损失和聚类损失。Wickramasinghe C S等学者(Wickramasinghe C S,Marino D L,Manic M.ResNet autoencoders for unsupervised feature learning from high

dimensional data:Deep models resistant to performance degradation[J].IEEE Access,2021,9:40511

40520.)将残差块的思想融入了深度自编码器聚类,一定程度上解决了加深深度导致的学习到无用特征和网络退化等问题,使得编码器层数的加深成为可能。Cai J等学者(Cai J,Wang S,Guo W.Unsupervised embedded feature learning for deep clustering with stacked sparse auto

encoder[J].Expert Systems with Applications,2021,186:
115729.)将稀疏自编码器应用到深度自编码器聚类中,使得聚类提取出的特征能够更强烈地反映出各个维度的重要程度。
[0004]但这些现有的深度聚类算法直接应用在教育评价领域效果不好,主要原因在于教育评价的指标中,评分含有主观性,对真实评分会进行随机偏移,同时高校教师评分数据存在各维度重要性不同的特点。

技术实现思路

[0005]为了解决上述技术问题,本专利技术提出了一种基于自编码器聚类算法的高校教师评价方法,包括以下步骤:
[0006]S1:输入教师各项评分数据集X,并随机生成噪声向量;以教师各项评分数据集X和噪声向量为输入,以生成器的输出与教师各项评分数据集X的差异构成损失函数进行训练,得到一个用于去噪的生成器;
[0007]S2:将教师各项评分数据集X输入生成器,得到去噪后的评分数据集X';
[0008]S3:以去噪后的评分数据集X'为输入,通过DEC算法构造编码器网络与解码器网络,计算重构损失,聚类损失;使用重构损失,训练编码器网络与解码器网络,得到数据的低维特征H;
[0009]S4:使用LOF算法,计算低维特征H每个点的局部离群因子;
[0010]S5:计算去噪损失:将局部离群因子大于1的点都减去1,并累加,作为去噪损失;
[0011]S6:进行迭代训练,每次训练用去噪损失更新生成器,用聚类损失与重构损失更新编码器网络;
[0012]S7:达到训练结束条件后,输出聚类结果。
[0013]进一步的,对S4所述的LOF算法进行进一步的改进,改进的LOF算法称为DNGLOF算法;改进之处在于用K()函数,代替LOF算法中的第k距离邻域函数N
k
(),在原始的LOF算法中N
k
(p)指点p的第k距离内的所有点的集合:
[0014]使用W

作为K()函数的常数,具体的K()函数的定义如下:
[0015]若数据点O1满足W

O1∈N
k
(W

p)则O1∈K(p);
[0016]若数据点O2满足则
[0017]其中W

为维度重要性权重,具体计算方法如下:
[0018]根据编码器网络的各层权重W计算低维特征H的原始维度重要性Z,其中,z
i
为原始维度重要性Z中第i个元素,具体的,z
i
的计算公式f
odiw本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自编码器聚类算法的高校教师评价方法,其特征在于包括以下步骤:S1:输入教师各项评分数据集X,并随机生成噪声向量;以教师各项评分数据集X和噪声向量为输入,以生成器的输出与教师各项评分数据集X的差异构成损失函数进行训练,得到一个用于去噪的生成器;S2:将教师各项评分数据集X输入生成器,得到去噪后的评分数据集X';S3:以去噪后的评分数据集X'为输入,通过DEC算法构造编码器网络与解码器网络,计算重构损失,聚类损失;使用重构损失,训练编码器网络与解码器网络,得到数据的低维特征H;S4:使用LOF算法,计算低维特征H每个点的局部离群因子;S5:计算去噪损失:将局部离群因子大于1的点都减去1,并累加,作为去噪损失;S6:进行迭代训练,每次训练用去噪损失更新生成器,用聚类损失与重构损失更新编码器网络;S7:达到训练结束条件后,输出聚类结果。2.根据权利要求1所述的一种基于自编码器聚类算法的高校教师评价方法,其特征在于对S4所述的LOF算法进行进一步的改进,改进的LOF算法称为DNGLOF算法;改进之处在于用K()函数,代替LOF算法中的第k距离邻域函数M
k
(),在原始的LOF算法中N
k
(p)指点p的第k距离内的所有点的集合:使用W

作为K()函数的常数,具体的K()函数的定义如下:若数据点O1满足W

O1∈N
k
(W

p)则O1∈K(p);若数据点O2满足则其中W

为维度重要性权重,具体计算方法如下:根据编码器网络的各层权重W计算低维特征H的原始维度重要性Z,其中,z
i
为原始维度重...

【专利技术属性】
技术研发人员:洪蕾冯奕钧朱皖宁
申请(专利权)人:金陵科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1