一种识别问卷批改得分的方法技术

技术编号：17913118 阅读：36 留言：0更新日期：2018-05-10 18:40

本发明专利技术公开了一种自动识别问卷批改得分的方法，包括：1.基于设计的双框识别框模式建立问卷批改得分数据集；2.针对问卷批改得分数据集进行数据清洗和数据增强，以使模型能够解决教师手写习惯差异，不同学校的复印扫描质量不一实际问题；3.构建问卷批改得分提升模型以解决小数量实际样本不满足模型容量问题及应用中的样本不均衡问题；4.构建预测模型，根据所构建的数据集训练模型并优化得到最终预测模型，部署应用于识别问卷批改得分，得到识别结果；5.根据实际应用的反馈数据再次通过提升模型不断提升模型预测的准确率。本发明专利技术应用于问卷批改得分的系统中，能够针对复杂多变的问卷批改得分进行高准确率的识别，具有较强的实用价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种识别问卷批改得分的方法
本专利技术涉及教育信息化领域，具体是一种自动识别问卷批改得分的方法。
技术介绍
随着技术的不断发展，互联网在微观领域已经渗透到日常生活的各个方面，而在宏观领域，更是引发了技术产业创新。借助于互联网平台和信息技术的发展，教育行业也面临着巨大的改革和挑战。电子化教学作为互联网和信息技术在教育行业的一个切入点，近年来发生着巨大的变化。电子化教学包括教学资源的数字信息化和教学工具的信息化，教学资源的数字信息化包括网络课程，声像资料，电子教案，数字化素材库等。而教学工具的信息化则是帮助学校和老师提供信息化的平台，更加简单方便的管理学生。本专利技术应用于教学工具信息化的一个环节，旨在帮助老师从试卷批改结果的记录中解放出来，能够自动识别教师在试卷中的批改得分，从而实现学生成绩的自动化管理。当前，问卷批改结果的电子化处理，主要是对纸张问卷(学生答题结果和教师批改后)进行扫描，并对教师的批改结果(如分数)进行电子化识别。其中批改分数的自动识别，是问卷批改结果的电子化识别中最重要的一点。常用的批改结果得分的识别，主要有两种方式。模式1：得分条方式。如下图所示，专用的得分纸张，一个水平条格中列出某题目所有得分的可能选项，教师通过在对应格子选项上进行标注(通过竖线或其他符号标记)代表对应得分，后续扫描图像后，识别程序识别对应位置被标注，从而映射生成其代表的得分。该模式在现有业务中大量使用，但问题也较多。首先需要设定另外的得分记录区，且所有得分选项必须列出来，实际难免无法覆盖所有得分情况(如0.5分差往往很难记录)。同时，操作体验也差，如果批改人误标错了...
一种识别问卷批改得分的方法

【技术保护点】
一种识别问卷批改得分的方法，其特征在于，包括以下步骤：1)设计一种双线识别框，并根据所设计的双线识别框，建立问卷批改得分数据集，其来源包括实际扫描生成的数据集和机器模拟合成的数据集；2)对上一步建立的数据集做简单数据清洗，剔除不可用数据，对自己建立的数据集做数据加强，包括对图片进行膨化处理，液化处理，二值化处理，仿射变换，加入随机噪声等；数据加强操作可以使模型更加适应实际中各学校复印扫描质量的差异，教师批改问卷得分时笔触的差异，教师手写习惯不一的问题；3)构建提升模型，采用基于深度学习的生成模型解决前期构建模型时，小数量训练集在模型上的过拟合问题，根据小数量的实际样本，利用生成模型生成与实际样本同分布的其他样本共同构成训练集，用于训练模型；同时实际应用中，采集到的实际样本往往会存在样本的不平衡问题，此时提升模型可以用于解决上述问题；4)构建预测模型，确定所采用模型的基本结构，包括模型的深度，宽度，卷积层，pooling层，batch normalization层，dropout层的堆叠结构，区别于其他模型，本专利技术首先从上述数据集中采样小数量数据集，用于模型校验，通过对模型损失，梯度...

【技术特征摘要】
1.一种识别问卷批改得分的方法，其特征在于，包括以下步骤：1)设计一种双线识别框，并根据所设计的双线识别框，建立问卷批改得分数据集，其来源包括实际扫描生成的数据集和机器模拟合成的数据集；2)对上一步建立的数据集做简单数据清洗，剔除不可用数据，对自己建立的数据集做数据加强，包括对图片进行膨化处理，液化处理，二值化处理，仿射变换，加入随机噪声等；数据加强操作可以使模型更加适应实际中各学校复印扫描质量的差异，教师批改问卷得分时笔触的差异，教师手写习惯不一的问题；3)构建提升模型，采用基于深度学习的生成模型解决前期构建模型时，小数量训练集在模型上的过拟合问题，根据小数量的实际样本，利用生成模型生成与实际样本同分布的其他样本共同构成训练集，用于训练模型；同时实际应用中，采集到的实际样本往往会存在样本的不平衡问题，此时提升模型可以用于解决上述问题；4)构建预测模型，确定所采用模型的基本结构，包括模型的深度，宽度，卷积层，pooling层，batchnormalization层，dropout层的堆叠结构，区别于其他模型，本发明首先从上述数据集中采样小数量数据集，用于模型校验，通过对模型损失，梯度和对小数量数据集的拟合程度，判断模型结构的正确性，之后将上述数据集分割为训练集和测试集，预测模型对训练集进行训练，采用测试集进行验证，利用交...

【专利技术属性】
技术研发人员：宿玲玲，马亮，
申请(专利权)人：北京慧辰资道资讯股份有限公司，江苏飚众教育科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人