一种智能纸质试卷总分识别方法及系统技术方案

技术编号:22532396 阅读:36 留言:0更新日期:2019-11-13 09:33
本发明专利技术公开了一种智能纸质试卷总分识别方法及系统,为教师改卷领域提供提高效率的应用,通过分割算法准确分割数字,将分数区域图片中对应题号的分数的个位数与十位数分割并标记得到标记分数区域图片,并还原真实数字;该方法用于教师改卷的特定领域,对应题号分数提取方式;为了帮助教师群体在改卷上提高速度,从而减轻其负担与压力,在改好每一题分数的前提下,通过手写数字识别神经网络识别分数计算栏的相应题号分数并相加得到总分。通过快速识别以及快速计算得到总分计算结果,大大提高改卷速度,从而避免二次操作。

An intelligent recognition method and system for the total score of paper test paper

The invention discloses an intelligent paper test paper total score recognition method and system, which provides an application for improving the efficiency in the field of teacher changing test paper. Through the segmentation algorithm, the number is accurately segmented, the single digit and ten digit of the score corresponding to the question number in the picture of the score area are segmented and marked to get the picture of the mark score area, and the real number is restored. The method is used in the specific field of teacher changing test paper, In order to help the teachers improve the speed of changing the paper and reduce the burden and pressure, on the premise of improving the scores of each question, the corresponding question number scores of the score calculation column are recognized by handwritten numeral recognition neural network and the total scores are added. Through fast identification and fast calculation, the total score calculation result is obtained, which greatly improves the rewinding speed and avoids the secondary operation.

【技术实现步骤摘要】
一种智能纸质试卷总分识别方法及系统
本公开涉及计算机图像处理、计算机视觉领域,具体涉及一种智能纸质试卷总分识别方法及系统。
技术介绍
在学校的学习生活中,考试是不可或缺的,无论中小学、大学,它是为了让学生通过一个标准来判断自己的不足,但伴随着考试,改试卷是不可缺少的一个环节,对于学生来说,分数是自己实力的证明,而对于老师来说,认真改好试卷是对学生的负责,然而改完之后,最后一步就是统计总分,而这个是影响改试卷高效率的一大障碍。如今,许多学校由于资金等问题,很少学校能做到每次改卷使用机改,而大部分教师改卷都是手改,本身手改试卷就有者许多影响效率的动作,比如翻试卷,写分数等操作。而影响最大的就是统计分数。无论是一人改卷还是多人分工改卷,最后的统计分数是改完一张试卷花费时间最多的。而计算分数也是最容易算错的,这容易导致二次改卷,影响改卷质量。同时教师与学生的正常比例为一边倒,导致平均每一个教师改试卷数量庞大,以及规定完成时间紧迫,这大大给教师造成许多压力与健康上的威胁。现有的爱作业,小猿搜题等应用没有应用到老师改卷的领域上,没能提供提高老师改卷效率的方法。爱作业app实现方法为:1、通过在周边学校收集、积累作业数据;打造自己的数据集用于训练自己的神经网络;2、通过多次训练达到较高的准确率;3、再用类似OCR的图像和文字识别技术,对识别到的区域进行功能完善的图像预处理并识别;4、实现自动纠错、打分和批改等功能。并且大多使用集成的OCR(OpticalCharacterRecognition)技术对文本层面上的识别,对手写数字识别准确率不高,可见OCR技术在此方面效果没有理想中的好,还有大多利用标识符对数字与数字之间的分割,不能很好的还原真实分数,更难用于算术运算了。上述现有的方法主要有以下缺陷:1.没有为教师改卷领域提供提高效率的应用。2.大多通过OCR技术进行识别,对于手写和相邻数字没能提供好的识别效果。3.同时未能完整还原真实数字。例如“1(空格)10”,OCR技术在距离不大的情况下会识别为110,不会识别为1和10。
技术实现思路
本公开提供一种智能纸质试卷总分识别方法及系统,为教师改卷领域提供提高效率的应用,通过分割算法准确分割数字,将分数区域图片中对应题号的分数的个位数与十位数分割并标记得到标记分数区域图片,并还原真实数字;该方法用于教师改卷的特定领域,各步骤的图像预处理详细步骤的顺序,对应题号分数提取方式,分割方法以及分割方法包括但不限于使用opencv相关函数进行实现。对应题号分数的分割方法与标记方法;用于识别的神经网络模型包括但不限于Xception、VGG16、VGG19、ResNet50、InceptionV3中任意一种的开源网络模型,判断是否已写出总分数的方法。为了实现上述目的,根据本公开的一方面,提供一种智能纸质试卷总分识别方法,所述方法包括以下步骤:步骤1,在纸质试卷图像上固定的打分区域从左到右分别提取对应题号的分数区域图片;步骤2,将分数区域图片中对应题号的分数的个位数与十位数分割并标记得到标记分数区域图片;步骤3,通过训练好的卷积神经网络模型对标记分数区域图片进行分数识别得到分数预测值;步骤4,对分数预测值进行还原得到对应题号的分数;步骤5,迭代执行步骤2到步骤4,直至对应各题号的分数全部得出;步骤6,判断是否已写出总分数,对已写出的总分提供预测值对比,否则将所有对应题号的分数相加得到总分。进一步地,在步骤1中,在纸质试卷图像上固定的分数栏区域从左到右分别提取对应题号的分数区域图片的方法为:纸质试卷图像通过图像采集设备(包括但不限于摄像头、照相机)进行获取,纸质试卷图像上的分数栏区域处于图像中的固定的坐标位置,该坐标位置为人工设置,可调整;分数区域图片的固定的打分区域结构特性为矩形,分数区域图片中对应题号(在本公开中以“左”、“右”表示打分区域的题号顺序的位置关系),题号为打分区域从左到右的编号。对分数栏区域提取对应题号的分数区域图片,提取方法包括但不限于使用开源python库opencv相关函数对分数栏区域图像进行分数提取与图像预处理,处理方法如下:步骤1.1,在分数栏区域图像中色彩层面的平滑滤波,平滑色彩细节;步骤1.2,将分数栏区域图像的BGR类型图片转换为HSV图片(HSV颜色模型);步骤1.3,对HSV图片的HSV色彩空间红色字体进行提取,得到红色数字的二值图片;步骤1.4,将分数栏区域图像多次膨胀的形态学处理,以便得到各分数栏区域图像中对应各题号分数的具体区域图片;步骤1.5,在具体区域图片寻找对应题号分数的轮廓,通过用矩形框识别的形式从左到右提取题号的轮廓中包含分数区域图片,并记录包含分数区域图片的数量;所述从左到右提取分数区域图片包括但不限于使用快速排序方法,通过矩形框的起始像素点排序;所述从左到右提取分数区域图片包括但不限于使用快速排序方法实现,具体步骤如下:步骤1.5.1,获取每张对应题号分数区域图片(以下简称图片)四个角的像素点位置;步骤1.5.2,通过图片四个角的像素点位置计算除图片中心点;步骤1.5.3,每一张图片中心点的x值越小,则越靠左,每一张图片中心点的x值越大,则越靠右;步骤1.5.4,利用快速排序算法按照每张对应题号将分数区域图片进行排序;提取对应题号的分数区域图片有利于更加准确地识别出分数值。进一步地,在步骤2中,将分数区域图片中对应题号的分数的个位数与十位数分割并标记得到标记分数区域图片的方法为:步骤2.1,对分数区域图片进行预处理;步骤2.2,将分数区域图片中对应题号的分数的个位数与十位数分割得到各个分割子图;步骤2.3,标记各个分割子图得到标记分数区域图片。进一步地,在步骤2.1中,对分数区域图片进行预处理的步骤如下:步骤2.1.1,在色彩层面进行平滑滤波,中和色彩分布相近的颜色,并平滑色彩细节,从而侵蚀掉面积较小的颜色区域;步骤2.1.2,通过对步骤2.1.1平滑滤波后的图片进行自适应二值化,膨胀得到清晰完整轮廓分明的数字二值图片,用于下一步数字分割。进一步地,在步骤2.2中,将分数区域图片中对应题号的分数的个位数与十位数分割得到各个分割子图的方法有通过基于距离变换的分水岭算法和滴水算法:基于距离变换的分水岭算法为:将distanceTransform()方法用于计算分数区域图片中的所选二值图片中每一个非零点与自己最近的零点的距离,distanceTransform()得到的参数保存了每一个点与离自己最近的零点的距离信息,通过一系列计算,从而达到细化分割对象的轮廓像素值,结合分水岭算法,在分割的过程中,由距离变换得到细化分割对象的轮廓,将图片区域上相邻并且灰度值大致相同的像素点联通起来,从而形成一个封闭的轮廓,从而达到分割效果。此算法对数字连起来的情况效果显著。滴水算法为:是非常强大的分割算法,能够准确分割数字,用于完全粘起来(粘起来即相邻的两个分数的像素区域的像素点连续)的十位以上数字。具体步骤:通过预处理好的分数区域图片的二值图片,寻找合适的起始分割点。对每一个分割点的右边、右下角、正下方、左下角和左边的像素点进行判断,制定6个寻找下一个分割点的规则(由优先级排序):1.若其5个方位像素点全为背景或为笔迹时,则下一个分割点本文档来自技高网
...

【技术保护点】
1.一种智能纸质试卷总分识别方法,其特征在于,所述方法包括以下步骤:步骤1,在纸质试卷图像上固定的打分区域从左到右分别提取对应题号的分数区域图片;步骤2,将分数区域图片中对应题号的分数的个位数与十位数分割并标记得到标记分数区域图片;步骤3,通过训练好的卷积神经网络模型对标记分数区域图片进行分数识别得到分数预测值;步骤4,对分数预测值进行还原得到对应题号的分数;步骤5,迭代执行步骤2到步骤4,直至对应各题号的分数全部得出;步骤6,判断是否已写出总分数,对已写出的总分提供预测值对比,否则将所有对应题号的分数相加得到总分。

【技术特征摘要】
1.一种智能纸质试卷总分识别方法,其特征在于,所述方法包括以下步骤:步骤1,在纸质试卷图像上固定的打分区域从左到右分别提取对应题号的分数区域图片;步骤2,将分数区域图片中对应题号的分数的个位数与十位数分割并标记得到标记分数区域图片;步骤3,通过训练好的卷积神经网络模型对标记分数区域图片进行分数识别得到分数预测值;步骤4,对分数预测值进行还原得到对应题号的分数;步骤5,迭代执行步骤2到步骤4,直至对应各题号的分数全部得出;步骤6,判断是否已写出总分数,对已写出的总分提供预测值对比,否则将所有对应题号的分数相加得到总分。2.根据权利要求1所述的一种智能纸质试卷总分识别方法,其特征在于,在步骤1中,在纸质试卷图像上固定的分数栏区域从左到右分别提取对应题号的分数区域图片的方法为:纸质试卷图像通过图像采集设备进行获取,纸质试卷图像上的分数栏区域处于图像中的固定的坐标位置;对分数栏区域提取对应题号的分数区域图片,对分数栏区域图像进行分数提取与图像预处理,处理方法如下:步骤1.1,在分数栏区域图像中色彩层面的平滑滤波,平滑色彩细节;步骤1.2,将分数栏区域图像的BGR类型图片转换为HSV图片;步骤1.3,对HSV图片的HSV色彩空间红色字体进行提取,得到红色数字的二值图片;步骤1.4,将分数栏区域图像多次膨胀的形态学处理,以便得到各分数栏区域图像中对应各题号分数的具体区域图片;步骤1.5,在具体区域图片寻找对应题号分数的轮廓,通过用矩形框识别的形式从左到右提取题号的轮廓中包含分数区域图片,并记录包含分数区域图片的数量;所述从左到右提取分数区域图片包括但不限于使用快速排序方法,通过矩形框的起始像素点排序;所述从左到右提取分数区域图片包括但不限于使用快速排序方法实现,具体步骤如下:步骤1.5.1,获取每张对应题号分数区域图片四个角的像素点位置;步骤1.5.2,通过图片四个角的像素点位置计算除图片中心点;步骤1.5.3,每一张图片中心点的x值越小,则越靠左,每一张图片中心点的x值越大,则越靠右;步骤1.5.4,利用快速排序算法按照每张对应题号将分数区域图片进行排序。3.根据权利要求2所述的一种智能纸质试卷总分识别方法,其特征在于,在步骤2中,将分数区域图片中对应题号的分数的个位数与十位数分割并标记得到标记分数区域图片的方法为:通过开源python库opencv相关函数实现,步骤2.1,对分数区域图片进行预处理;步骤2.2,将分数区域图片中对应题号的分数的个位数与十位数分割得到各个分割子图;步骤2.3,标记各个分割子图得到标记分数区域图片。4.根据权利要求3所述的一种智能纸质试卷总分识别方法,其特征在于,在步骤2.1中,对分数区域图片进行预处理的步骤如下:步骤2.1.1,在色彩层面进行平滑滤波;步骤2.1.2,对步骤平滑滤波后的图片进行自适应二值化,膨胀得到数字二值图片。5.根据权利要求4所述的一种智能纸质试卷总分识别方法,其特征在于,在步骤2.2中,将分数区域图片中对应题号的分数的个位数与十位数分割得到各个分割子图的方法有通过基于距离变换的分水岭算法和滴水算法。6.根据权利要求5所述的一种智能纸质试卷总分识别方法,其特征在于,在步骤2.2中,将分数区域图片中对应题号的分数的个位数与十位数分割得到各个分割子图方法为:通过判断框出的数字图片的中心点在原图片水平方向上的像素点位置确定个位数标记为0和十位数标记为1,以此类推;为了更好的实现字符分割,需对预处理图片进行垂直方向上的投影,得到垂直方向上构成数字的像素点的分布情况,并搜素其宽度中心的三分之一宽度区域,在区域中选取最低点作为起始分割点的水平位置,由于该水平位置的纵方向构成数字的像素点少,更能代表两个数字连接的地方,分割会更准确;添加记录像素点遍历情况,即遍历过的像素点不再参与算法执行,同时通过滴水算法得到的连续分割点,用于分辨个位数与十位数的位...

【专利技术属性】
技术研发人员:黎旭民冼华溢苏俊健何志敏
申请(专利权)人:佛山科学技术学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1