一种基于多标签分类卷积神经网络的题目推荐方法技术

技术编号：22330146 阅读：40 留言：0更新日期：2019-10-19 12:17

本发明专利技术涉及教育领域，更具体的，涉及一种基于多标签分类卷积神经网络的题目推荐方法，本发明专利技术突出训练集中的高相关标签间的相关性，将相关性高于一定阈值的标签对都视为高相关标签对，能够调整每个标签的不平衡率以及让模型更好的学习高相关性以提高分类的准确度，并且本发明专利技术的卷积神经网络可以自动提取题目关键词的特征，能够更好的帮助卷积神经网络对考点特征标签的分类，此外，本发明专利技术在卷积神经网络中的第一层全连接层中加入标签间的相关性信息，让模型在训练中考虑标签间的相关性，以提高效率、网络识别分类的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多标签分类卷积神经网络的题目推荐方法
本专利技术涉及教育领域，更具体地，涉及一种基于多标签分类卷积神经网络的题目推荐方法。
技术介绍
随着计算机技术快速的发展，科技在教育领域中也得到了非常广泛的应用。其中，通过一道题目能够拓展找到另外一些类似的题目就显得尤其方便，例如，对于学生来说，对某种类型或某个考点的题目掌握不好，则他需要查找更多相似的题目来巩固、加强掌握这些题目；对于教师来说，试卷出题也是类似，考点固定，但题目是变化的，通过一道题目找到其它相同考点的题目，对于出卷老师来说是非常方便的事情。那么如何找到一道题目的其它类似题目，重点就在于，对一道题目进行考点信息的提取，考点提取就是指从题目信息中发现、识别最后提取出蕴含在信息中的概念、重点、规则关系的过程，从而改变传统的知识点考点的组织和管理方式。目前，考点抽取的模型支撑有粗糙集、遗传算法、神经网络、多标签分类、潜在语义标引等。在过去的研究中，多标签学习已经得到了广泛的关注并取得了一系列的进展，其中，如何学习和利用多个标签之前的依赖关系是目前被普遍认可和关注的一个关键问题，有效学习和利用这些依赖关系是提高多标签分类模型性能的关键，而目前的多标签学习方法中，但仍存在着效率以及准确率底下的不足。
技术实现思路
为了解决现有技术中多标签学习方法效率以及准确率底下的不足，本专利技术提供了一种基于多标签分类卷积神经网络的题目推荐方法。为解决上述技术问题，本专利技术的技术方案如下：一种基于多标签分类卷积神经网络的题目推荐方法，包括以下步骤：步骤S1：获取若干题目以及考点集合作为样本实例，对每个题目的考点标签进行标...

【技术保护点】
1.一种基于多标签分类卷积神经网络的题目推荐方法，其特征在于，包括以下步骤：步骤S1：获取若干题目以及考点集合作为样本实例，对每个题目的考点标签进行标注，将标注好的题目保存作为题库；步骤S2：获取题库中各个题目的一组关键词，训练出所有关键词的词向量；步骤S3：计算关于标签的局部相关性矩阵求得标签间的局部相关性，根据标签间的局部相关性，用寻找与匹配高相关标签对的方法增加训练集；步骤S4：构建一维卷积神经网络，一维卷积神经网络的输入层为一道题目的关键词的词向量，一维卷积神经网络的输出层为考点标签的预测值，将标签间的局部先关矩阵的有效元素作为神经元加入至一维卷积神经网络中的第一个全连接层，对一维卷积神经网络进行训练并选出最优模型；步骤S5：将新题目输入到最优模型的一维卷积神经网络中，输入考点标签的预测值，根据考点特征用聚类方法将所有题目进行分类，获得与该题目考点相似的其他题目，将其作为推荐题目。

【技术特征摘要】
1.一种基于多标签分类卷积神经网络的题目推荐方法，其特征在于，包括以下步骤：步骤S1：获取若干题目以及考点集合作为样本实例，对每个题目的考点标签进行标注，将标注好的题目保存作为题库；步骤S2：获取题库中各个题目的一组关键词，训练出所有关键词的词向量；步骤S3：计算关于标签的局部相关性矩阵求得标签间的局部相关性，根据标签间的局部相关性，用寻找与匹配高相关标签对的方法增加训练集；步骤S4：构建一维卷积神经网络，一维卷积神经网络的输入层为一道题目的关键词的词向量，一维卷积神经网络的输出层为考点标签的预测值，将标签间的局部先关矩阵的有效元素作为神经元加入至一维卷积神经网络中的第一个全连接层，对一维卷积神经网络进行训练并选出最优模型；步骤S5：将新题目输入到最优模型的一维卷积神经网络中，输入考点标签的预测值，根据考点特征用聚类方法将所有题目进行分类，获得与该题目考点相似的其他题目，将其作为推荐题目。2.根据权利要求1所述的一种基于多标签分类卷积神经网络的题目推荐方法，其特征在于，在步骤S1中，若一道题目包含某一考点，则将该样本实例对应的考点标签值设为1，否则设为0。3.根据权利要求2所述的一种基于多标签分类卷积神经网络的题目推荐方法，其特征在于，在步骤S2中，需要过滤题目的图片、停用词、标点符号，保留特殊符号、专业词汇，获得题目的一组关键词，把各个样本的长度增加到题目集中最多的关键词个数，空白位置用指定的字符填充，使样本的输入维度一致，并对每个关键词训练出其词向量。4.根据权利要求3所述的一种基于多标签分类卷积神经网络的题目推荐方法，其特征在于，在步骤S3中，令lt和lz为任意两个考点标签，将lt和lz的局部相关性定义为：其中，n(lt∩lz)表示该两个标签都为1的题目个数，n(lt∪lz)表示两个标签中至少有一个值为1的题目个数，求出所有每两个标签的局部相关性，得到一个对角元素为1的对称矩阵C，标签与其自身的相关性是1，基于矩阵C再用寻找与匹配高相关标签对的方法增加训练集。5.根据权利要求4所述的一种基于多标签分类卷积神经网络的题目推荐方法，其特征在于，寻找高相关标签对的方法包括以下步骤：设置一个局部相关性阈值g，对于每一个样本实例，列出标签...

【专利技术属性】
技术研发人员：袁锦杰，蔡瑞初，郝志峰，温雯，王丽娟，陈炳丰，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人