一种试卷图像信息提取方法技术

技术编号:37521855 阅读:312 留言:0更新日期:2023-05-12 15:44
本发明专利技术涉及一种试卷图像信息提取方法,包括如下步骤:获取试卷图像,对试卷图像进行预处理;对试卷图像中的试卷元素进行检测识别,获得试卷元素的坐标信息和文本信息;基于试卷元素构建图网络模型并训练;根据图网络模型进行试卷信息提取。本发明专利技术实现了一个通用的自动化试卷图像信息提取方法,通过对任意电子设备获取的试卷图像进行预处理,然后自动提取出答题人信息、答题区域等试卷信息,为后续手写答题识别与自动评分任务做准备;有效提高试卷信息提取的准确度,同时优化现有系统的一些缺陷,提高对试卷的处理效率,适用于教育活动中课堂测验、作业批改等场景,具有较高的应用推广价值。广价值。广价值。

【技术实现步骤摘要】
一种试卷图像信息提取方法


[0001]本专利技术涉及图像处理
,尤其涉及一种试卷图像信息提取方法。

技术介绍

[0002]随着科技的不断发展,教学方式的不断更新,智能教育理念逐渐进入教学平台,对于学生的测试也有了不同的模式,各种线上教育平台、在线考试系统也逐渐开始应用在教学活动中,而这些考试系统也从教师人工阅卷逐渐向系统自动阅卷变化,这意味着平时的课堂测验甚至可以由学生自查自检,节省教师大量时间和精力。
[0003]现有系统主要采用两种模式,一种是无纸化,考生直接在线上进行测试;另一种是纸质试卷,将试卷图像上传系统进行批阅。前者实时性高,但需要考生拥有一定的硬件设备,且系统建设、维护成本高。对于后者,普通的扫描仪采集的图像质量较高,但不够便捷;拍照方式方便,但影响因素较多,采集的图像质量较低,所以需要图像处理技术增强试卷图像质量。因此针对第二种模式,在系统对试卷图像的处理阶段需要加以改善。
[0004]而对于试卷中版面、内容千变万化的情况,需要一种更智能的方式进行处理。目前主要采用模板匹配的方法提取试卷上的信息,但是试卷分为不同科目,不同科目的试卷版式结构不同,所要提取的信息不同,导致试卷的版式和结构存在较大差异,并且试卷在图像采集过程中存在尺度的多样性和采集条件的差异性,导致现有的试卷信息提取方法无法适用于所有的试卷结构和采集条件,使得试卷信息提取的效率较低。

技术实现思路

[0005]本专利技术所要解决的技术问题是克服现有技术中存在的不足,提供一种通用的自动化试卷图像信息提取方法,提高试卷信息提取的准确度,从而进一步提高试卷批阅的效率和实用性。
[0006]本专利技术是通过以下技术方案予以实现:
[0007]一种试卷图像信息提取方法,包括如下步骤:
[0008]S1.获取试卷图像,对所述试卷图像进行预处理;
[0009]S2.对所述试卷图像中的试卷元素进行检测识别,获得试卷元素的坐标信息和文本信息;
[0010]S3.基于所述试卷元素构建图网络模型,并训练所述图网络模型;
[0011]S4.根据图网络模型进行试卷信息提取。
[0012]根据上述技术方案,优选地,步骤S1中,通过电子设备拍摄,或通过扫描仪扫描,获得试卷图像。
[0013]根据上述技术方案,优选地,步骤S1包括:将获取的拍摄图像或扫描图像上传到系统,成为试卷原始图像;以空白试卷作为模版图像,对所述试卷原始图像通过关键点与特征描述符进行图像配准;按照图像配准后的所述试卷原始图像和模版图像的匹配点,计算出所述试卷原始图像和模版图像的对应关系,进行图像矫正变换。
[0014]根据上述技术方案,优选地,步骤S1还包括:对图像矫正变换后的试卷图像进行二值化处理,增强图像信息。
[0015]根据上述技术方案,优选地,步骤S1中“图像配准”包括:将所述试卷原始图像与模版图像分别放入神经网络中,分别检测出特征点和特征描述符;分别对检测出的所述特征点和特征描述符进行整合,得到特征点的匹配描述符,通过计算找到图像间的最佳匹配,实现图像配准。
[0016]根据上述技术方案,优选地,步骤S2包括:对所述试卷图像进行检测,得到各所述试卷元素的检测框并获得坐标信息;根据所述检测框的坐标信息,将各试卷元素的图像从整张试卷中截取出来,分别输入到文字识别模型中;通过所述文字识别模型,对试卷元素的图像进行识别,得到相应的文本信息。
[0017]根据上述技术方案,优选地,步骤S3包括:基于所述试卷元素的视觉和语义关系构造图网络模型;对所述试卷图像中的各试卷元素进行标注,并对各试卷元素进行特征提取,获得图网络模型训练数据;训练所述图网络模型。
[0018]根据上述技术方案,优选地,步骤S4包括:利用经过训练的图网络模型,实现各试卷元素中多模态信息的特征融合,使试卷元素间生成语义上相关联的深层信息;对各试卷元素的类型标记进行分类预测;根据分类预测得出的类型标记,可分析提取出试卷信息。
[0019]本专利技术的有益效果是:
[0020]本专利技术实现了一个通用的自动化试卷图像信息提取方法,通过对任意电子设备获取的试卷图像进行预处理,然后自动提取出答题人信息、答题区域等试卷信息,为后续手写答题识别与自动评分任务做准备;有效提高试卷信息提取的准确度,同时优化现有系统的一些缺陷,提高对试卷的处理效率,适用于教育活动中课堂测验、作业批改等场景,具有较高的应用推广价值。
附图说明
[0021]图1为本专利技术实施例1的总体流程图。
[0022]图2为本专利技术的试卷图像预处理工作流程图。
[0023]图3为本专利技术实施例2的系统工作流程图。
[0024]图4为本专利技术中试卷原始图像示意图。
[0025]图5为本专利技术中模版图像示意图。
[0026]图6为本专利技术经过图像矫正的试卷图像示意图。
[0027]图7为本专利技术经过图像增强的试卷图像示意图。
[0028]图8为本专利技术中试卷信息提取效果图。
具体实施方式
[0029]为了使本
的技术人员更好地理解本专利技术的技术方案,下面结合附图和最佳实施例对本专利技术作进一步的详细说明。基于专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于专利技术保护的范围。
[0030]实施例1:如图1、2所示,本专利技术包括如下步骤:
[0031]S1.获取试卷图像,对所述试卷图像进行预处理。具体包括:
[0032]S11.将获取的拍摄图像或扫描图像上传到系统,成为试卷原始图像;
[0033]S12.将带有不同歪曲程度或不同大小的原始图像,以空白试卷作为模版图像,通过关键点与特征描述符进行图像配准;
[0034]S13.按照图像配准后的所述试卷原始图像和模版图像的匹配点,计算出试卷原始图像和模版图像的对应关系,进行图像矫正变换,使试卷图像上的试卷元素与模板图像在位置、角度和尺度上进行对齐;
[0035]S14.对图像矫正变换后的试卷图像进行二值化处理,增强图像信息,改善图像质量,提高试卷图像的视觉效果,使之后对于图像的检测与标记更为精准,进而提升提取答卷信息的精度。
[0036]本例中以考生答卷图像作为原始图像,参照图4,以空白答卷电子版图像为模板图像,参照图5。对于答卷类型不存在限制,可以是高考专用答题卡,也可以是课堂测试使用的不标准的答题卷。对于试卷的卷头信息位置,同样不做限制。可以使用任意电子设备获取,具有拍摄功能的设备都是允许的,比如手机、相机等,也可以使用扫描仪等仪器进行扫描。原始图像上传系统后根据模板图像进行矫正变换,对于矫正后的图像进行二值化,从而在后续自动提取答卷信息的任务中,体现出更好地性能。
[0037]此外,在步骤S12中,“图像配准”具体包括:将所述试卷原始图像与模版图像分别放入神经网络中,分别检测出特征点和特征描述符;分别对检测出的所述特征点和特征描述符进行整合,得到特征点的匹配描述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试卷图像信息提取方法,其特征在于,包括如下步骤:S1.获取试卷图像,对所述试卷图像进行预处理;S2.对所述试卷图像中的试卷元素进行检测识别,获得试卷元素的坐标信息和文本信息;S3.基于所述试卷元素构建图网络模型,并训练所述图网络模型;S4.根据图网络模型进行试卷信息提取。2.根据权利要求1所述一种试卷图像信息提取方法,其特征在于,步骤S1中,通过电子设备拍摄,或通过扫描仪扫描,获得试卷图像。3.根据权利要求1所述一种试卷图像信息提取方法,其特征在于,步骤S1包括:将获取的拍摄图像或扫描图像上传到系统,成为试卷原始图像;以空白试卷作为模版图像,对所述试卷原始图像通过关键点与特征描述符进行图像配准;按照图像配准后的所述试卷原始图像和模版图像的匹配点,计算出所述试卷原始图像和模版图像的对应关系,进行图像矫正变换。4.根据权利要求3所述一种试卷图像信息提取方法,其特征在于,步骤S1还包括:对图像矫正变换后的试卷图像进行二值化处理,增强图像信息。5.根据权利要求3或4所述一种试卷图像信息提取方法,其特征在于,步骤S1中“图像配准”包括:将所述试卷原始图像与模版图像分别放入神...

【专利技术属性】
技术研发人员:朱远平周迎李胜楠
申请(专利权)人:天津师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1