答题卡字符串识别方法、装置、终端和计算机存储介质制造方法及图纸

技术编号:27686600 阅读:30 留言:0更新日期:2021-03-17 04:01
本发明专利技术提供了一种答题卡字符串识别方法、装置、终端和计算机可读存储介质,其中,答题卡字符串识别方法包括:对答题卡图像进行文本识别,获取文本内容信息以及文本位置信息;根据文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域;基于深度学习模型对字符串所处的区域进行识别,以获取字符串。通过本发明专利技术的技术方案,利用文本识别技术,获取答题卡中目标字符串的位置信息,而不需要定位块进行定位,能够兼容各种形式的答题卡,对存在目标字符串的图像区域进行水平投影和垂直投影,获取每个字符串中每个字符的位置从而进行精确识别,抗干扰能力强,识别率高。

【技术实现步骤摘要】
答题卡字符串识别方法、装置、终端和计算机存储介质
本专利技术涉及图像处理领域,具体而言,涉及一种答题卡字符串识别方法、一种答题卡字符串识别装置、一种终端和一种计算机可读存储介质。
技术介绍
随着计算机和人工智能的高速发展,其逐渐应用到工作和生活的多个领域。在教育教学过程中,考试是对教学成果的一种有效的评价方式,一个考试完成后教师会对大量的学生试卷进行批阅并对批阅后的所有的学生情况进行汇总分析,传统阅卷和分析工作会占用教师大量的时间,甚至压缩的教师的备课时间,所以出现了计算机智能阅卷的相关技术,通过这种阅卷方式能够大大节省教师的阅卷时间。目前现有的阅卷系统仅能够对自身系统定义的答题卡板式进行制模(制作答题卡模板)和阅卷,而无法兼容其他厂商的答题卡,如需使用第三方试卷答题卡进行考试时,原答题卡无法使用,则需要使用繁琐的操作重新制作答题卡,重新印刷答题卡也增加了成本。现有的网阅系统虽然能够支撑第三方卷卡的批阅,但是不能支持第三方卷卡的手批。另外,现有技术中的阅卷系统不能支持对教师手批试卷进行统分。像高考、中考、大型联考及期中期末考试一般会采用网络阅卷的方式,而大型考试毕竟在所有考试中占少数,学生教学过程中存在更多的日常考试、测验或测试,在日常的考试场景中,教师使用手写分数进行判分的方式比较常见,导致现有技术中网络阅卷系统的广泛应用受到一定限制。目前对答题卡考号(或特定字符串)进行识别,主要还是采用基于传统图像处理的模式,现有方法主要有以下几方面的缺陷:1、当通过条码或二维码识别,获取考生信息,现有的识别方法主要识别固定位置且清晰度较高的二维码。如果二维码模糊、定位点被覆盖或周围有笔画干扰时,则较难识别;2、依据识别定位点判断考号位置的方式效率低下且易受到噪声干扰,影响识别准确性。当前各教育科技类公司普遍采用图像处理及模式识别方法进行答题卡识别,并开发出了许多答题卡识别系统,但依旧采用传统的识别方法,无法从根本上突破图像处理方法的瓶颈,只能做到自动化处理而无法实现完全的智能化识别;3、考号识别通过填涂考号数字区域,在通过定位块来确定对应的数字,在不同的区域不同的学校考号位数不一样,这样会导致答题卡制作不通用。另外,整个说明书对
技术介绍
的任何讨论,并不代表该
技术介绍
一定是所属领域技术人员所知晓的现有技术,整个说明书中的对现有技术的任何讨论并不代表该现有技术一定是广泛公知的或一定构成本领域的公知常识。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。为此,本专利技术的一个目的在于提出了一种答题卡字符串识别方法。本专利技术的另一个目的在于提出了一种答题卡字符串识别装置。本专利技术的又一个目的在于提出了一种终端。本专利技术的又一个目的在于提出了一种计算机可读存储介质。在本专利技术的第一方面的技术方案中,提出了一种答题卡字符串识别方法,包括:对答题卡图像进行文本识别,获取文本内容信息以及文本位置信息;根据文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域;基于深度学习模型对字符串所处的区域进行识别,以获取字符串。在该技术方案中,依靠文本识别技术,在获取文本内容的同时记录文本位置信息,该位置信息被用于定位待识别的字符串,一旦确定了待识别的字符串(目标字符串)的位置区域,就能够进一步处理该区域的图像对该区域进行定向识别,即根据字符串的特点建立比较高效的深度学习模型进行字符串的精确识别,对于手写字符串以及答题卡中存在较多干扰笔画的情况,也能够保持较高的识别率。例如,目标字符串的特点为手写的数字,则建立数字识别模型并利用手写数字图片进行训练,从而对手写数字串达到精确识别。其中,深度学习模型的本质是一种基于深度学习算法的目标识别模型,用于对字符串所在的区域进行信息提取。例如,本申请的一个目标是对答题卡图像中的字符串进行识别,那么深度学习模型就是一种基于深度学习算法的字符串识别模型,若字符串中只包含数字,那么该深度学习模型即为基于深度学习算法的数字识别模型。深度学习模型能够学习样本数据(训练集)的内在规律和表示层次,在学习过程中获得的信息对字符、图像和声音等数据的解释有很大帮助,最终目标是让机器具备一定的分析学习能力,从而能够识别字符、图像和声音等数据。在该技术方案中能够实现字符串(数字)识别的深度学习模型包括:DenseNet(全称“DenselyConnectedConvolutionalNetworks”,密集连接卷积网络),DenseNet是一种具有密集连接的卷积神经网络,在该网络中,任何两层之间都有直接的连接,也即网络每一层的输入都是前面所有层输出的并集,该层所学习的特征图也会被直接传给其后所有的层,作为输入。此外,深度学习模型也可以使用类似的CNN模型搭建,比如ResNet、GoogLeNet、VGG-Nets、AlexNet、LeNet等。其中,CNN(ConvolutionalNeuralNetworks,卷积神经网络),ResNet(残差网络),GoogLeNet(是ChristianSzegedy提出的一种深度学习结构),VGG(全称VGGNet,是牛津大学计算机视觉组和GoogleDeepmind公司一起研发的深度卷积神经网络),AlexNet(是由Hinton和AlexKrizhenvsky提出的一种神经网络),LeNet(是由YanLeCun提出的一种用于手写字符识别与分类的神经网络)。随着计算机处理能力的提升、识别算法的改进以及神经网络模型的完善,文本识别技术(例如,OpticalCharacterRecognition,光学字符识别)也随之进步,能够准确获取图像中的文本的位置信息,进一步提升识别率。现有技术中的答题卡特定字符串识别方法,通常对答题卡有特殊要求,如答题卡必须为含铅铜版纸进行彩色印刷,且对答题卡裁切精度有严格要求,这样经济成本、环境成本高,而且受限于光电头安装位置和排列密度相对固定,对于不同格式的答题卡调整难度很大。而基于本申请的技术方案,通过文本识别方法确定目标字符串的所在区域,不需要答题卡具有特定的格式,不需要定位块,面对答题卡排版改变,答题卡纸张大小改变,答题卡中存在涂写干扰等情况,都不会对其区域确定产生影响,使其识别效率有了较大地提升。另外,根据本专利技术上述实施例的答题卡字符串识别方法,还可以具有如下附加的技术特征:在上述任一技术方案中,可选地,根据文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域,具体包括:利用文本模版与文本内容信息进行匹配,根据匹配到的文本内容信息所对应的文本位置信息确定字符串所处的区域的坐标。在该技术方案中,文本模版与字符串具有逻辑上的对应关系,例如,待识别的字符串为考号数字串,在考号填写处存在“考号”等提示性文字,那么可以选用“考号”作为文本模版,若待识别的字符串为身份证号数字串,则在身份证号填写处必然会出现“身份证号”等提示性标注,那么可以选用“身份证号”作为文本模版。利用文本模版与识别本文档来自技高网
...

【技术保护点】
1.一种答题卡字符串识别方法,其特征在于,包括:/n对答题卡图像进行文本识别,获取文本内容信息以及文本位置信息;/n根据所述文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域;/n基于深度学习模型对所述字符串所处的区域进行识别,以获取所述字符串。/n

【技术特征摘要】
1.一种答题卡字符串识别方法,其特征在于,包括:
对答题卡图像进行文本识别,获取文本内容信息以及文本位置信息;
根据所述文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域;
基于深度学习模型对所述字符串所处的区域进行识别,以获取所述字符串。


2.根据权利要求1所述的答题卡字符串识别方法,其特征在于,所述根据所述文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域,具体包括:
利用文本模版与所述文本内容信息进行匹配,根据匹配到的文本内容信息所对应的文本位置信息确定字符串所处的区域的坐标。


3.根据权利要求1所述的答题卡字符串识别方法,其特征在于,所述基于深度学习模型对所述字符串所处的区域进行识别,以获取所述字符串,具体包括:
根据所述字符串所处的区域的坐标,在已填涂的答题卡的图像中截取相应的区域图像;
对所述区域图像进行水平投影和垂直投影,根据投影结果确定所述字符串中字符的坐标;
根据所述字符的坐标,在所述区域图像中截取相应的字符图像;
根据基于深度学习的识别模型,识别所述字符图像;
合并识别结果以获取所述字符串。


4.根据权利要求3所述的答题卡字符串识别方法,其特征在于,所述对所述区域图像进行水平投影和垂直投影,根据投影结果确定所述字符串中字符的坐标,具体包括:
对所述区域图像进行二值化处理,得到二值图;
对所述二值图进行水平投影和垂直投影,生成水平投影数据和垂直投影数据;
根据水平投影数据确定限制字符填写位置的框线在水平方向上的坐标区域,根据垂直投影数据确定限制字符填写位置的框线在垂直方向上的坐标区域...

【专利技术属性】
技术研发人员:曾志辉邢军华欧阳一村许文龙贺涛
申请(专利权)人:深圳中兴网信科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1