【技术实现步骤摘要】
数据处理方法、装置、电子设备及计算机可读存储介质
本专利技术涉及数据处理
,具体涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
批改作业是教学过程中的一个重要环节,作业批改的效率直接关系到教学过程的推进。在现有的教学过程中,学生完成作业之后通常需要由老师人工进行作业的批改,人工批改效率较低,同时很难高效完整地整理出学生的作答数据。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据处理方法、装置、电子设备及计算机可读存储介质,以提高作业批改的自动化程度和效率。第一方面,本专利技术实施例提供一种数据处理方法,所述方法包括:获取版面图片,所述版面图片显示有多个答题子区域,所述答题子区域中包括印刷体的第一文本和第二文本,相邻的答题子区域之间设置有分隔标识;根据所述版面图片确定多个答题子图片和对应的题目区域坐标,所述多个答题子图片分别对应于不同的答题子区域;确定所述版面图片内的第一文本信息和第二文本信息,所述第一文本信息包括第一文本坐标和第一文本序列, ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取版面图片,所述版面图片显示有多个答题子区域,所述答题子区域中包括第一文本和第二文本,相邻的答题子区域之间设置有分隔标识;/n根据所述版面图片确定多个答题子图片和对应的题目区域坐标,所述多个答题子图片分别对应于不同的答题子区域;/n确定所述版面图片内的第一文本信息和第二文本信息,所述第一文本信息包括第一文本坐标和第一文本序列,所述第二文本信息包括第二文本坐标和第二文本序列;/n根据所述各所述题目区域坐标、第一文本信息及第二文本信息确定所述各题目的第一文本和第二文本;/n根据所述各题目的第一文本确定对应的第三文本信息;以及 ...
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取版面图片,所述版面图片显示有多个答题子区域,所述答题子区域中包括第一文本和第二文本,相邻的答题子区域之间设置有分隔标识;
根据所述版面图片确定多个答题子图片和对应的题目区域坐标,所述多个答题子图片分别对应于不同的答题子区域;
确定所述版面图片内的第一文本信息和第二文本信息,所述第一文本信息包括第一文本坐标和第一文本序列,所述第二文本信息包括第二文本坐标和第二文本序列;
根据所述各所述题目区域坐标、第一文本信息及第二文本信息确定所述各题目的第一文本和第二文本;
根据所述各题目的第一文本确定对应的第三文本信息;以及
根据所述第三文本信息确定各题目的第四文本信息。
2.根据权利要求1所述的数据处理方法,其特征在于,所述分隔标识为多个所述答题子区域外围显示的闭合的虚线题框;
根据所述版面图片确定多个答题子图片和对应的题目区域坐标包括:
调整所述版面图片尺寸至预定尺寸,得到第一版面图片;
对所述第一版面图片进行图像二值化,得到第二版面图片;
对所述第二版面图片进行图像闭操作,得到第三版面图片;
对所述第三版面图片进行连通域分析和筛选,得到题目区域题框;以及
调整所述题目区域题框尺寸至原始尺寸,确定各所述答题子图片和对应的题目区域坐标;
其中,所述题目区域坐标用于表征各所述答题子区域在版面图片上的位置信息。
3.根据权利要求1所述的数据处理方法,其特征在于,所述确定所述版面图片内的第一文本信息和第二文本信息包括:
将所述版面图片输入至文本分割网络,获取多个特征向量;以及
对所述多个特征向量进行文本检测和文本识别,获取第一文本序列和第二文本序列以及第一文本坐标和第二文本坐标;
其中,所述第一文本序列为所述版面图片内的印刷体文本内容,所述第一文本坐标为所述第一文本序列在所述版面图片上的位置信息;所述第二文本序列为所述版面图片内的手写体内容,所述第二文本坐标为所述第二文本序列在所述版面图片上的位置信息。
4.根据权利要求3所述的数据处理方法,其特征在于,所述文本分割网络的主干网络结构为残差网络模型,所述文本识别网络采用卷积神经网络模型。
5.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述各所述题目区域坐标、第一文本信息及第二文本信息确定所述各题目的第一文本和第二文本具体为:
根据各所述题目的题目区域坐标、第一文本坐标...
【专利技术属性】
技术研发人员:黄恺,周佳,闫嵩,包英泽,
申请(专利权)人:北京大米科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。