一种提高学生信息识别准确率的方法技术

技术编号:38196329 阅读:19 留言:0更新日期:2023-07-21 16:33
本发明专利技术公开了一种提高学生信息识别准确率的方法,包括对页面进行矫正;获得整块包含学生信息的截图;字符序列切割;识别单字符图片;输出识别结果,当没有识别到涂改划错痕迹时,直接输出结果;当某一个字符位置识别到涂改划错痕迹时,往上和往下同时扫描一个字符的位置,发现手写痕迹后,和已有的涂改划错痕迹合并处理图像,和已有的涂改划错痕迹合并处理图像进入一个专门的涂改划错数字模式识别模型当中,重新识别后输出结果。本方案,可以在学生进行涂改划错时,进行有效的识别,提高学生信息识别的准确率。信息识别的准确率。信息识别的准确率。

【技术实现步骤摘要】
一种提高学生信息识别准确率的方法


[0001]本专利技术涉及试卷批改
,具体而言,涉及一种提高学生信息识别准确率的方法。

技术介绍

[0002]现有技术中,识别手写的串联字符有以下难题:手写字符识别准确率不能让人满意,影响识别准确率的因素有:风格多样,对于印刷体一种字体我们可以把它看作是一种风格,印刷体的字体种类是有限的,但是对于手写体,一个人的字体就可以看作是一种风格,所以这里字体的种类是无限的;笔画连接、字体连接干扰,印刷体由于是机器创造的非常的有规则整齐,然而手写的字体存在很多由人为造成的不确定成分。
[0003]中国专利公开了一种提高识别试卷学生信息准确率的方法,公开号:CN114241486A,其进行单字符识别,但是在实际答题过程中,会存在写错后在上下部位写入正确信息的情况,这就会导致上述的方法难以应对修改信息案的答题识别情况,导致识别的准确率降低。

技术实现思路

[0004]本专利技术的主要目的在于提供一种提高学生信息识别准确率的方法,以改善相关技术中, 存在写错后在上下部位写入正确信息的情况,这就会导致上述的方法难以应对修改信息案的答题识别情况,导致识别的准确率降低的问题。
[0005]为了实现上述目的,本专利技术提供了一种提高学生信息识别准确率的方法,包括对页面进行矫正:在页面上的不同位置设置若干个标识符,通过对标识符的矫正,即可将页面进行矫正;获得整块包含学生信息的截图:截取矫正后图片上的固定区域获得整块包含学生信息的图片;字符序列切割;通过图像处理技术,将包含字符序列的图分割成多个包含单字符的图片,并且记录输出图片的顺序信息;识别单字符图片:将单字符图片输入模式识别模块即可得到图片中包含的字符;输出识别结果:将单字符图片的识别结果进行组合拼接,能够得到完整的学生学号信息;当没有识别到涂改划错痕迹时,直接输出结果;当某一个字符位置识别到涂改划错痕迹时,往上和往下同时扫描一个字符的位置,发现手写痕迹后,和已有的涂改划错痕迹合并处理图像,和已有的涂改划错痕迹合并处理图像进入一个专门的涂改划错数字模式识别模型当中,重新识别后输出结果。
[0006]在本专利技术的一种实施例中,在页面的四个角放置四个正方形标识符,其中左上、右上、左下角的标识符都是黑色实心的,右下角的标识符是空心。
[0007]在本专利技术的一种实施例中,对页面的矫正算法如下:
步骤一,计算关键常量,先利用计算公式s1 =获得s1,其中w为矫正图片的宽度,再利用公式s2=s1*获得s2;步骤二,将图片灰度处理、自适应的二值化,利用opencv的findContours函数来做轮廓检测,利用opencv的contourArea函数计算每一个轮廓的面积s,我们利用s2<s<s1这个条件来过滤轮廓;步骤三,计算所有符合面积要求的轮廓的中心点,并且两点组合计算他们之间的欧式距离,按照两点之间的距离我们从大到小排序,设计的四个标识符坐标就在第一名和第二名这两组点对中;步骤四,把右下角标识符设计为空心的,所以在第一组和第二组的四个点中,一定会存在唯一顶点的对应的像素值是白色的,此时就确定了右下角,再根据右下角和其他顶点的距离关系确定剩下三个顶点的坐标,最后利用opencv的getPerspectiveTransform函数获得完成透视变化所需要的矩阵,完成透视变换后,图片的矫正完成。
[0008]在本专利技术的一种实施例中,在字符序列切割过程中,利用opencv图像处理库,以“灰度模式”读取图片,然后使用自适应阈值化的方法获得白背景黑笔迹的二值化图片。
[0009]在本专利技术的一种实施例中,在字符序列切割过程中,需要识别并消除下划线,步骤如下:找出下划线:首先获得水平投影,水平投影的视觉意义是每行的黑色像素总数,如果某一行的黑色像素值大于图片的宽度一半,则认为这行就是设计的多段下划线;对相交处进行补偿:检测位置坐标的下一行是不是白色像素,如果不是白色而是黑色的像素,那么这意味着字符笔画与下划线相交,那么这一行的对应的位置就要保留原图片的像素,而不能置为白色像素。
[0010]在本专利技术的一种实施例中,在识别和消除下划线时,对黑色像素进行排列,检测是否呈现严格的一次函数,即是否完全为直线排列,对于黑色像素数量达到预定长度的直线排列的黑色像素,则认为这就是设计的多段下滑线,可进行消除。
[0011]在本专利技术的一种实施例中,在字符序列切割的过程中,将字符序列切割成单个字符的方法如下:通过垂直投影获得了在垂直方向上,每一列有多少黑色像素,认为如果连续的两个及其以上像素的黑色像素个数为0,那么这段连续的0就是对应白色间隔的位置,通过间隔的位置信息就可以将单个字符切割出来。
[0012]在本专利技术的一种实施例中,在识别单字符图片时,利用深度学习的技术,利用深度学习框架pytorch进行深度学习,深度学习的方法如下:S1、选择深度学习模型:为了保证模型的推理速度要尽可能的快,选择模型参数量少推理速递快的shufflenetv2作为主干网路;S2、建立数据集:为了实现了数字0

9的识别,建立训练用的数据集;S3、对图片预处理:使用自适应二值化,将图片变化为黑色背景白色笔迹的二值化图片,在训练时使用数据增强技术可以极大的增加训练数据的数量,训练时使用到的数据增强技术有水平和垂直方向的随机填充和平移、添加高斯噪声、添加高斯模糊;S4、得到训练结果:使用shufflenetv2经过20个epoch的训练,得到训练结果。
[0013]在本专利技术的一种实施例中,在选择深度学习模型时,利用空间注意力机制来提高模型的健壮性和泛化能力,空间注意力机制将输入的图片进行仿射、透视、薄板样条变换,通过不断地训练,空间注意力机制会将输入的原图片变化成主干模型“喜欢”的形式。
[0014]在本专利技术的一种实施例中,涂改划错数字模式识别模型,处理划斜线、划叉号、涂黑、划单条横线和划多条横线的涂改划错情况。
[0015]与现有技术相比,本专利技术的有益效果是:可以在学生进行涂改划错时,进行有效的识别,提高学生信息识别的准确率;将字符序列识别任务转化为多个单字符识别问题,为数字化教育流程中捕获学生个人信息场景提供了新的解决思路,降低了完成场景任务的难度,从而保障了捕获学生个人信息的准确性和健壮性;通过将字符序列识别问题转化成为了多个单字符的识别问题,这种设计不仅降低了识别难度,也避免了手写字体连接问题,还最大限度的保留了学生填写个人信息的习惯。
附图说明
[0016]图1为根据本申请实施例提供的提高学生信息识别准确率的方法的流程框图;图2为根据本申请实施例提供的提高学生信息识别准确率的方法的页面矫正的流程框图;图3为根据本申请实施例提供的提高学生信息识别准确率的方法的深度学习的流程框图;图4为根据本申请实施例提供的提高学生信息识别准确率的方法的设计表的流程框图;图5为根据本申请实施例提供的提高学生信息识别准确率的方法的整块包含学生信息的图片;图6为根据本申请实施例提供的提高学生信息识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提高学生信息识别准确率的方法,其特征在于,包括:对页面进行矫正:在页面上的不同位置设置若干个标识符,通过对标识符的矫正,即可将页面进行矫正;获得整块包含学生信息的截图:截取矫正后图片上的固定区域获得整块包含学生信息的图片;字符序列切割;通过图像处理技术,将包含字符序列的图分割成多个包含单字符的图片,并且记录输出图片的顺序信息;识别单字符图片:将单字符图片输入模式识别模块即可得到图片中包含的字符;输出识别结果:将单字符图片的识别结果进行组合拼接,能够得到完整的学生学号信息;当没有识别到涂改划错痕迹时,直接输出结果;当某一个字符位置识别到涂改划错痕迹时,往上和往下同时扫描一个字符的位置,发现手写痕迹后,和已有的涂改划错痕迹合并处理图像,和已有的涂改划错痕迹合并处理图像进入一个专门的涂改划错数字模式识别模型当中,重新识别后输出结果。2.如权利要求1所述的一种提高学生信息识别准确率的方法,其特征在于,在页面的四个角放置四个正方形标识符,其中左上、右上、左下角的标识符都是黑色实心的,右下角的标识符是空心。3.如权利要求2所述的一种提高学生信息识别准确率的方法,其特征在于,对页面的矫正算法如下:步骤一,计算关键常量,先利用计算公式s1 =获得s1,其中w为矫正图片的宽度,再利用公式s2=s1*获得s2;步骤二,将图片灰度处理、自适应的二值化,利用opencv的findContours函数来做轮廓检测,利用opencv的contourArea函数计算每一个轮廓的面积s,我们利用s2<s<s1这个条件来过滤轮廓;步骤三,计算所有符合面积要求的轮廓的中心点,并且两点组合计算他们之间的欧式距离,按照两点之间的距离我们从大到小排序,设计的四个标识符坐标就在第一名和第二名这两组点对中;步骤四,把右下角标识符设计为空心的,所以在第一组和第二组的四个点中,一定会存在唯一顶点的对应的像素值是白色的,此时就确定了右下角,再根据右下角和其他顶点的距离关系确定剩下三个顶点的坐标,最后利用opencv的getPerspectiveTransform函数获得完成透视变化所需要的矩阵,完成透视变换后,图片的矫正完成。4.如权利要求1所述的一种提高学生信息识别准确率的方法,其特征在于,在字符序列切割过程中,利用opencv图像处理库,以“灰度模式”读取图片,然后使用自适应阈值化的方法获得白背景黑笔迹的二值化图片。5.如权利要求1所述的一种提高学生信息识别准确率的方法,其特征在于,...

【专利技术属性】
技术研发人员:李栋良王钰钱锟
申请(专利权)人:中教云智数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1