System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种试卷信息处理方法、系统、计算机及存储介质技术方案_技高网

一种试卷信息处理方法、系统、计算机及存储介质技术方案

技术编号:40114581 阅读:7 留言:0更新日期:2024-01-23 19:42
本发明专利技术提供一种试卷信息处理方法、系统、计算机及存储介质,方法包括:对试卷图像进行预处理,以获取若干个初始矩形框;判断若干个初始矩形框之间是否存在交叠情况,以将若干个初始矩形框分隔为独立矩形框及重叠矩形框组,并将重叠矩形框组组合为聚合矩形框;对聚合矩形框进行过滤处理,以剔除无效框;将剔除无效框后的聚合矩形框及独立矩形框选定为候选矩形框,对候选矩形框进行字符判别,以确定字符框;对字符框进行合并处理,以获取文本框。通过判断交叠情况,以获取聚合矩形框,可完成对不同大小的字符的全部框选,进而通过对聚合矩形框进行过滤处理,可排除较大的矩形区域,有效的提高了对文字信息的框选精确度,避免信息处理错漏的情况。

【技术实现步骤摘要】

本申请涉及数据处理,特别是涉及一种试卷信息处理方法、系统、计算机及存储介质


技术介绍

1、随着信息化、大数据的不断发展,线下教育与线上教育的融合已愈发密切,利用大数据驱动可提供更为精准的教育服务。

2、大数据驱动的先决条件是需要获取到足够的底层数据,而学生在线下完成的大量的纸质试卷,通过对其进行信息收集,再对收集的信息进行提取、分析后,即可作为底层数据的供应源,进而完成个性化教育的大数据驱动,如薄弱知识点推荐、错题汇总等。

3、纸质试卷的信息处理虽属于文本信息处理的一种,但其与常规的文本信息处理不同之处在于,其存在较多图表、插图等非文字内容及字符大小不一的情况,在框选并提取纸质试卷上的文本信息时,容易导致文本框框选的内容不够精确,造成信息处理错漏的情况。


技术实现思路

1、本申请实施例提供了一种试卷信息处理方法、系统、计算机及存储介质,以解决现有技术中对纸质试卷进行信息处理时,因存在较多图表、插图等非文字内容及字符大小不一的情况,在框选并提取纸质试卷上的文本信息时,易导致文本框框选的内容不够精确,造成信息处理错漏的技术问题。

2、第一方面,本申请实施例提供了一种试卷信息处理方法,包括以下步骤:

3、获取试卷图像,对所述试卷图像进行预处理,以获取分别框选不同字符的若干个初始矩形框;

4、判断若干个所述初始矩形框之间是否存在交叠情况,以将若干个所述初始矩形框分隔为若干个独立矩形框及若干个重叠矩形框组,并将若干个所述重叠矩形框组组合为若干个聚合矩形框;

5、基于所述试卷图像的宽度及高度,计算若干个所述独立矩形框与所述试卷图像之间的独立宽度比及独立高度比,并计算若干个所述聚合矩形框与所述试卷图像之间的待验宽度比及待验高度比;

6、通过所述独立宽度比及所述独立高度比确定标准宽度比及标准高度比,将所述待验宽度比与所述标准宽度比进行比对,并将所述待验高度比与所述标准高度比进行比对,以从若干个所述聚合矩形框中筛选出无效框,剔除所述无效框;

7、将剔除所述无效框后的若干个所述聚合矩形框及若干个所述独立矩形框均选定为候选矩形框,对若干个所述候选矩形框进行字符判别,以从若干个所述候选矩形框中确定若干个字符框;

8、对若干个所述字符框进行合并处理,以获取文本框,基于所述文本框对所述试卷图像进行信息处理。

9、进一步地,所述对所述试卷图像进行预处理,以获取分别框选不同字符的若干个初始矩形框的步骤包括:

10、对所述试卷图像进行灰度处理及边缘检测,以获取二值化图像;

11、于所述二值化图像中选取标定像素值的像素点为起始点,将与所述起始点相邻的像素点判定为相邻点;

12、判断所述相邻点的像素值是否为所述标定像素值,以从若干个所述相邻点中选定连接点;

13、将所述起始点与所述连接点组合为与字符对应的字符区域;

14、于所述二值化图像内确定若干个所述字符区域,基于所述字符区域获取初始矩形框。

15、进一步地,所述初始矩形框的获取公式为:

16、,

17、其中,表示初始矩形框的第一角点,表示字符区域中起始点及连接点于像素坐标内x轴的最小值,表示字符区域中起始点及连接点于像素坐标内y轴的最小值;

18、,

19、其中,表示初始矩形框的第二角点,表示字符区域中起始点及连接点于像素坐标内x轴的最大值,表示字符区域中起始点及连接点于像素坐标内y轴的最大值;

20、,

21、其中,表示初始矩形框的宽,表示初始矩形框的第二角点的横坐标,表示初始矩形框的第一角点的横坐标;

22、,

23、其中,表示初始矩形框的高,表示初始矩形框的第二角点的纵坐标,表示初始矩形框的第一角点的纵坐标。

24、进一步地,所述判断若干个所述初始矩形框之间是否存在交叠情况,以将若干个所述初始矩形框分隔为若干个独立矩形框及若干个重叠矩形框组的步骤包括:

25、将其一所述初始矩形框选定为待判断框,并将所述待判断框与其他的所述初始矩形框之间分别进行重叠计算,以获取若干个交叠比;

26、将若干个所述交叠比分别与第一重叠阈值进行比对;

27、若所述交叠比大于所述第一重叠阈值,则将与大于所述第一重叠阈值的交叠比对应的所述初始矩形框判定为相交框,并将所述待判断框与所述相交框组合为重叠矩形框组;

28、若全部的所述交叠比均小于所述第一重叠阈值,则将所述待判断框判定为独立矩形框。

29、进一步地,所述交叠比的计算公式为:

30、,

31、其中,表示交叠比,表示第i个待判断框,表示第j个初始矩形框。

32、进一步地,所述对若干个所述字符框进行合并处理的步骤具体为:

33、计算两所述字符框之间的最小重力距离及垂直重叠;

34、将所述最小重力距离与距离阈值进行比对,并将所述垂直重叠与第二重叠阈值进行比对;

35、若所述最小重力阈值小于所述距离阈值,且所述垂直重叠小于所述第二重叠阈值,则合并两所述字符框。

36、第二方面,本申请实施例提供了一种试卷信息处理系统,应用于如上述技术方案中的试卷信息处理方法,所述系统包括:

37、预处理模块,用于获取试卷图像,对所述试卷图像进行预处理,以获取分别框选不同字符的若干个初始矩形框;

38、判断模块,用于判断若干个所述初始矩形框之间是否存在交叠情况,以将若干个所述初始矩形框分隔为若干个独立矩形框及若干个重叠矩形框组,并将若干个所述重叠矩形框组组合为若干个聚合矩形框;

39、校验模块,用于基于所述试卷图像的宽度及高度,计算若干个所述独立矩形框与所述试卷图像之间的独立宽度比及独立高度比,并计算若干个所述聚合矩形框与所述试卷图像之间的待验宽度比及待验高度比;

40、筛选模块,用于通过所述独立宽度比及所述独立高度比确定标准宽度比及标准高度比,将所述待验宽度比与所述标准宽度比进行比对,并将所述待验高度比与所述标准高度比进行比对,以从若干个所述聚合矩形框中筛选出无效框,剔除所述无效框;

41、识别模块,用于将剔除所述无效框后的若干个所述聚合矩形框及若干个所述独立矩形框均选定为候选矩形框,对若干个所述候选矩形框进行字符判别,以从若干个所述候选矩形框中确定若干个字符框;

42、执行模块,用于对若干个所述字符框进行合并处理,以获取文本框,基于所述文本框对所述试卷图像进行信息处理。

43、第三方面,本申请实施例提供了一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的试卷信息处理方法。

44、第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该计算机程序被处本文档来自技高网...

【技术保护点】

1.一种试卷信息处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的试卷信息处理方法,其特征在于,所述对所述试卷图像进行预处理,以获取分别框选不同字符的若干个初始矩形框的步骤包括:

3.根据权利要求2所述的试卷信息处理方法,其特征在于,所述初始矩形框的获取公式为:

4.根据权利要求1所述的试卷信息处理方法,其特征在于,所述判断若干个所述初始矩形框之间是否存在交叠情况,以将若干个所述初始矩形框分隔为若干个独立矩形框及若干个重叠矩形框组的步骤包括:

5.根据权利要求4所述的试卷信息处理方法,其特征在于,所述交叠比的计算公式为:

6.根据权利要求1所述的试卷信息处理方法,其特征在于,所述对若干个所述字符框进行合并处理的步骤具体为:

7.一种试卷信息处理系统,应用于如权利要求1~6任一项所述的试卷信息处理方法,其特征在于,所述系统包括:

8.一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的试卷信息处理方法。

9.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6中任一项所述的试卷信息处理方法。

...

【技术特征摘要】

1.一种试卷信息处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的试卷信息处理方法,其特征在于,所述对所述试卷图像进行预处理,以获取分别框选不同字符的若干个初始矩形框的步骤包括:

3.根据权利要求2所述的试卷信息处理方法,其特征在于,所述初始矩形框的获取公式为:

4.根据权利要求1所述的试卷信息处理方法,其特征在于,所述判断若干个所述初始矩形框之间是否存在交叠情况,以将若干个所述初始矩形框分隔为若干个独立矩形框及若干个重叠矩形框组的步骤包括:

5.根据权利要求4所述的试卷信息处理方法,其特征在于,所述交叠比的计算公式...

【专利技术属性】
技术研发人员:邱震钰高婉君
申请(专利权)人:南昌理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1