一种试卷图像提取方法、装置及终端设备制造方法及图纸

技术编号:39441944 阅读:47 留言:0更新日期:2023-11-19 16:24
本发明专利技术公开了一种试卷图像提取方法、装置及终端设备,采集待提取试卷的试卷图像;根据预先构建的试卷模板提取所述试卷图像中的手写特征区域图像;提取并解析所述试卷图像中的身份数据信息;将所述手写特征区域图像与所述身份数据信息对应匹配,得到所述待提取试卷的试卷样本和学生手写数字训练样本。本申请能够高精度、高准确率地实现试卷图像提取,并且能有效利用作答完成的试卷,高效提取出学生身份信息中的手写数字作为训练样本,为学生手写数字识别模型提供良好的训练数据基础。字识别模型提供良好的训练数据基础。字识别模型提供良好的训练数据基础。

【技术实现步骤摘要】
一种试卷图像提取方法、装置及终端设备


[0001]本专利技术涉及图像处理
,尤其涉及一种试卷图像提取方法、装置及终端设备。

技术介绍

[0002]随着科技的不断发展,教学方式的不断更新,智能教育理念逐渐进入教学平台,对于学生的测试也有了不同的模式,各种线上教育平台、在线考试系统也逐渐开始应用在教学活动中,而这些考试系统也从教师人工阅卷逐渐向系统自动阅卷变化,这意味着平时的课堂测验甚至可以由学生自查自检,节省教师大量时间和精力。
[0003]当前教育信息化发展迅速,智慧阅卷已经广泛运用到学校当中,通过将试卷图像上传系统进行批阅,辅助老师提高教学效率。但是试卷图像提取面临的问题包括对于学生答题内容与身份信息的匹配,以及学生手写身份信息的识别,普通的扫描仪采集的图像质量较低,从而影响试卷图像提取准确率。另一方面,在人工智能发展上,手写数字识别是非常重要的一环,可用于识别考号或学号,但是学生的手写数字样本数据难以采集,从而很难保证准确率,因此如果能有效利用作答完成的试卷,高效提取出手写数字做为训练样本,为学生手写数字识别模型可提供良好的数据基础,从而保障模型的准确性。

技术实现思路

[0004]为解决上述技术问题,本专利技术提供一种试卷图像提取方法、装置及终端设备,能够高精度、高准确率地实现试卷图像提取,高效提取出学生身份信息中的手写数字作为训练样本。
[0005]本专利技术实施例提供一种试卷图像提取方法,所述方法包括:采集待提取试卷的试卷图像;根据预先构建的试卷模板提取所述试卷图像中的手写特征区域图像;提取并解析所述试卷图像中的身份数据信息;将所述手写特征区域图像与所述身份数据信息对应匹配,得到所述待提取试卷的试卷样本和学生手写数字训练样本。
[0006]优选地,所述试卷模板构建过程包括:确定标准试卷的定位点坐标信息;根据所述定位点坐标信息确定不同区域的标注数据;将不同区域的标注数据和该区域对应的特征区域属性进行关联映射,得到所述试卷模板;其中,所述定位点坐标信息包括左上角坐标、左下角坐标、右上角坐标以及右下角坐标;所述标注数据包括该区域的参考原点坐标、特征区宽以及特征区高。
[0007]作为一种优选方案,在采集待提取试卷的试卷图像之后,所述方法还包括:通过透射变换对所述试卷图像进行矩形矫正;
通过识别所述待提取试卷中预设的若干不对称的辅助定位点,得到倒置识别结果,并根据识别结果对所述试卷图像进行倒置矫正;采用预设的矫正算法将所述试卷图像与预存的标准试卷进行特征对齐矫正。
[0008]优选地,所述根据预先构建的试卷模板提取所述试卷图像中的手写特征区域图像,包括:获取所述试卷图像上的定位点坐标信息;根据所述试卷模板中的标注数据以及所述试卷图像上的定位点坐标信息计算不同特征区域的区域信息;根据不同特征区域的区域信息提取手写特征区域图像。
[0009]进一步地,所述区域信息包括宽度、高度、参考原点横坐标以及参考原点纵坐标;其中,所述试卷图像中第j个特征区域的宽度;所述试卷图像中第j个特征区域的高度;所述试卷图像中第j个特征区域的左上角横坐标;所述试卷图像中第j个特征区域的左上角纵坐标;所述试卷模板与所述试卷图像在水平方向上的宽度比例;所述试卷模板与所述试卷图像在垂直方向上的高度比例;Dx1和Dx2分别为标准试卷左上角横坐标和右上角横坐标;TPx1和TPx2分别为所述试卷图像左上角横坐标和右上角横坐标;Dy4和Dy1分别为所述标准试卷右下角纵坐标和左上角纵坐标;TPy4和TPy1分别为所述试卷图像右下角纵坐标和左上角纵坐标;Twidthj和Thightj为所述标注数据中第j个特征区域的特征区宽以及特征区高;Txj和Tyj分别为所述标注数据中第j个特征区域的参考原点横坐标以及纵坐标。
[0010]优选地,在根据预先构建的试卷模板提取所述试卷图像中的手写特征区域图像之后,所述方法还包括:通过预设的目标检测模型计算所述手写特征区域图像的分割置信度;若计算的分割置信度高于预设的置信度阈值,则判定区域特征标记正确;若计算的分割置信度不高于所述置信度阈值,则判定区域特征标记不正确。
[0011]作为一种优选方案,所述提取并解析所述试卷图像中的身份数据信息,具体包括:提取所述试卷图像中的身份区域图像;识别所述身份区域图像中的二维码或条形码,获取所述身份数据信息;所述身份数据信息包括考场号、座位号、准考证号、证件号中的至少一个。
[0012]进一步地,所述学生手写数字训练样本获取过程具体包括:提取包括学生数字身份信息的手写特征区域图像;将所述身份数据信息与包括学生数字身份信息的手写特征区域图像进行关联绑定,获得学生手写数字训练样本。
[0013]本专利技术实施例还提供一种试卷图像提取装置,所述装置包括:图像获取模块,用于采集待提取试卷的试卷图像;
区域提取模块,用于根据预先构建的试卷模板提取所述试卷图像中的手写特征区域图像;身份提取模块,用于提取并解析所述试卷图像中的身份数据信息;样本构建模块,用于将所述手写特征区域图像与所述身份数据信息对应匹配,得到所述待提取试卷的试卷样本和学生手写数字训练样本。
[0014]优选地,所述区域提取模块构建试卷模板的过程包括:确定标准试卷的定位点坐标信息;根据所述定位点坐标信息确定不同区域的标注数据;将不同区域的标注数据和该区域对应的特征区域属性进行关联映射,得到所述试卷模板;其中,所述定位点坐标信息包括左上角坐标、左下角坐标、右上角坐标以及右下角坐标;所述标注数据包括该区域的参考原点坐标、特征区宽以及特征区高。
[0015]优选的,所述装置还包括矫正模块,用于:在采集待提取试卷的试卷图像之后,通过透射变换对所述试卷图像进行矩形矫正;通过识别所述待提取试卷中预设的若干不对称的辅助定位点,得到倒置识别结果,并根据识别结果对所述试卷图像进行倒置矫正;采用预设的矫正算法将所述试卷图像与预存的标准试卷进行特征对齐矫正。
[0016]优选地,所述区域提取模块用于:获取所述试卷图像上的定位点坐标信息;根据所述试卷模板中的标注数据以及所述试卷图像上的定位点坐标信息计算不同特征区域的区域信息;根据不同特征区域的区域信息提取手写特征区域图像。
[0017]进一步地,所述区域信息包括宽度、高度、参考原点横坐标以及参考原点纵坐标;其中,所述试卷图像中第j个特征区域的宽度;所述试卷图像中第j个特征区域的高度;所述试卷图像中第j个特征区域的左上角横坐标;所述试卷图像中第j个特征区域的左上角纵坐标;所述试卷模板与所述试卷图像在水平方向上的宽度比例;所述试卷模板与所述试卷图像在垂直方向上的高度比例;Dx1和Dx2分别为标准试卷左上角横坐标和右上角横坐标;TPx1和TPx2分别为所述试卷图像左上角横坐标和右上角横坐标;Dy4和Dy1分别为所述标准试卷右下角纵坐标和左上角纵坐标;TPy4和TPy1分别为所述试卷图像右下角纵坐标和左上角纵坐标;Twidthj和Thightj为所述标注数据中第j个特征区域的特征区宽以及特征区高;Txj和Tyj分别为所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试卷图像提取方法,其特征在于,所述方法包括:采集待提取试卷的试卷图像;根据预先构建的试卷模板提取所述试卷图像中的手写特征区域图像;提取并解析所述试卷图像中的身份数据信息;将所述手写特征区域图像与所述身份数据信息对应匹配,得到所述待提取试卷的试卷样本和学生手写数字训练样本。2.如权利要求1所述的试卷图像提取方法,其特征在于,所述试卷模板构建过程包括:确定标准试卷的定位点坐标信息;根据所述定位点坐标信息确定不同区域的标注数据;将不同区域的标注数据和该区域对应的特征区域属性进行关联映射,得到所述试卷模板;其中,所述定位点坐标信息包括左上角坐标、左下角坐标、右上角坐标以及右下角坐标;所述标注数据包括该区域的参考原点坐标、特征区宽以及特征区高。3.如权利要求1所述的试卷图像提取方法,其特征在于,在采集待提取试卷的试卷图像之后,所述方法还包括:通过透射变换对所述试卷图像进行矩形矫正;通过识别所述待提取试卷中预设的若干不对称的辅助定位点,得到倒置识别结果,并根据识别结果对所述试卷图像进行倒置矫正;采用预设的矫正算法将所述试卷图像与预存的标准试卷进行特征对齐矫正。4.如权利要求1所述的试卷图像提取方法,其特征在于,所述根据预先构建的试卷模板提取所述试卷图像中的手写特征区域图像,包括:获取所述试卷图像上的定位点坐标信息;根据所述试卷模板中的标注数据以及所述试卷图像上的定位点坐标信息计算不同特征区域的区域信息;根据不同特征区域的区域信息提取手写特征区域图像。5.如权利要求4所述的试卷图像提取方法,其特征在于,所述区域信息包括宽度、高度、参考原点横坐标以及参考原点纵坐标;其中,所述试卷图像中第j个特征区域的宽度;所述试卷图像中第j个特征区域的高度;所述试卷图像中第j个特征区域的左上角横坐标;所述试卷图像中第j个特征区域的左上角纵坐标;所述试卷模板与所述试卷图像在水平方向上的宽度比例;所述试卷模板与所述试卷图像在垂直方向上的高度比例;Dx1和Dx2分别为标准试卷左上角横坐标和右上角横坐标;TPx1和TPx2分别为...

【专利技术属性】
技术研发人员:陈之华姚祖发张候云黄何列李伟洪岳玉美
申请(专利权)人:广东省科技基础条件平台中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1