文档处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:29675767 阅读:16 留言:0更新日期:2021-08-13 21:58
本公开提供一种文档处理方法、装置、电子设备及计算机可读存储介质,一种文档处理方法包括提取待判页含有的第一试题片段,第一试题片段与待判页含有的相应第一作答区域位置关联;提取与待判页匹配的答案页含有的第二试题片段,第二试题片段与答案页含有的相应第二作答区域位置关联;在第一试题片段与第二试题片段的文本匹配时,根据与第一试题片段位置关联的第一作答区域内的文本和与相应第二试题片段位置关联的第二作答区域内的文本输出判题结果,实施本公开的技术方案,可以提高试题批改的准确率。

【技术实现步骤摘要】
文档处理方法、装置、电子设备及计算机可读存储介质
本专利技术涉及计算机
,尤其涉及一种文档处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
拍照判题是人工智能技术在教育领域的一项重要应用,其拍照判断流程是:用户用手机或平板电脑等终端设备进行拍照,然后将拍摄的图像上传至拍照判题程序,接着拍照判题程序将图像送入题型判断模型,题型判断模型检测预先指定的题型的文本区域,并框选该文本区域。与此同时,应用程序将图像送入文本行检测模型,文本行检测模型检测文本行区域,并框选该文本行区域;然后利用版面分析模型根据文本行检测模型的检测结果进行版面分析,对框进行合并,同时根据每种题型的特点,分析得到每个题是由哪些框组成,然后根据框的坐标在原图上进行裁剪,将裁剪得到的图像送入识别模型,得到每个题目的内容,然后根据题目内容判断试题判题结果,并将试题判题结果进行输出。
技术实现思路
根据本公开的第一方面,提供了一种文档处理方法,包括:提取待判页含有的第一试题片段,所述第一试题片段与所述待判页含有的相应第一作答区域位置关联;提取与所述待判页匹配的答案页含有的第二试题片段,所述第二试题片段与所述答案页含有的相应第二作答区域位置关联;在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果。根据本公开的第二方面,提供了一种文档处理装置,包括:第一提取模块,用于提取待判页含有的第一试题片段,所述第一试题片与所述待判页含有的第一作答区域关联;第二提取模块,用于提取与所述待判页匹配的答案页含有的第二试题片段,所述第二试题片段与所述答案页含有的相应第二作答区域关联;输出模块,用于在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果;根据本公开的第三方面,提供了电子设备,包括:处理器;以及,存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据本公开的第一方面中任一项所述的方法。根据本公开的第三方面,一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行根据本公开的第一方面中任一项所述的方法。本公开实施例中提供的一个或多个技术方案,利用第一试题片段与第二试题片段的文本匹配表征与第一试题片段位置关联的第一作答区域和相应第二试题片段置关联的第二作答区域匹配,根据匹配的第一作答区域的文本和第二作答区域的文本得到相应的判题结果,相对于直接根据第一作答区域和第二作答区域的坐标确定匹配的第一作答区域的文本和第二作答区域,本公开的方法在待判页在拍照上传时存在角度误差等情况时,因为第一试题片段和第二试题片段依旧与相应的第一作答区域和第二作答区域位置关联,故依旧可以根据第一试题片段和第二试题片段确定匹配的第一作答区域和第二作答区域,进而使得本公开的文档处理方法可以提高试题批改的准确率。附图说明附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。图1示出了根据本公开示例性实施例的实施本文描述的各种方法的一种应用场景示意图;图2示出了根据本公开示例性实施例的实施本文描述的各种方法的一种应用场景下的手机界面显示图;图3示出了根据本公开示例性实施例的文档处理方法的一种流程图;图4示出了根据本公开示例性实施例的文档处理方法的一种待判页与档案页的示意图;图5示出了根据本公开示例性实施例的文档处理方法的一种子流程图;图6示出了根据本公开示例性实施例的文档处理方法的另一种子流程图;图7示出了根据本公开示例性实施例的文档处理方法的再一种子流程图;图8示出了根据本公开示例性实施例的文档处理方法的再一种子流程图;图9示出了根据本公开示例性实施例的文档处理方法的再一种子流程图;图10示出了根据本公开示例性实施例的文档处理装置的示意性框图;图11示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。下面对本公开的实施方式中的术语做说明:试题文本:试卷、考卷、作业等页面中的试题的文本。例如:“2.在括号中填恰当的词语:银装素裹的大地别有深意的评价”中,除“大地”、“评价”是作答文本外,其他均为试题文本。试题片段:试题文本中的片段,可以是试题文本中的一个字符、两个字符或多个字符。例如:“2.在括号中填恰当的词语:银装素裹的大地别有深意的评价”中“银装素裹的”、“别有深意”等试题文本中的片段为试题片段。作答文本:试卷、作业等页面中的答案的文本。例如:“2.在括号中填恰当的词语:银装素裹的大地别有深意的评价”中,“大地”、“评价”为作答文本。作答区域:试卷、作业等页面中的用于填写答案的区域。例如:“2.在括号中填恰当的词语:银装素裹的大地别有深意的评价”中,“大地”、“评价”所在的区域是作答区域。图1是本公开示例性实施例提供的文档处理方法的一种应用场景的示意图,应当知道的,该应用场景不构成对本申请应用场景的限制,本公开示例性实施例提供的文档处理方法也可在其他应用场景中使用。以文档处理方法的一个具体应用场景为例,参本文档来自技高网...

【技术保护点】
1.一种文档处理方法,其特征在于,包括:/n提取待判页含有的第一试题片段,所述第一试题片段与所述待判页含有的第一作答区域位置关联;/n提取与所述待判页匹配的答案页含有的第二试题片段,所述第二试题片段与所述答案页含有的相应第二作答区域位置关联;/n在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果。/n

【技术特征摘要】
1.一种文档处理方法,其特征在于,包括:
提取待判页含有的第一试题片段,所述第一试题片段与所述待判页含有的第一作答区域位置关联;
提取与所述待判页匹配的答案页含有的第二试题片段,所述第二试题片段与所述答案页含有的相应第二作答区域位置关联;
在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果。


2.根据权利要求1所述的方法,其特征在于,所述第一试题片段与相应所述第一作答区域的位置关联包括所述第一试题片段与相应所述第一作答区域的位置相邻,所述第二试题片段与相应所述第二作答区域的位置关联包括所述第二试题片段与相应所述第二作答区域的位置相邻。


3.根据权利要求1所述的方法,其特征在于,所述第一试题片段与相应所述第一作答区域的位置关联包括所述第一试题片段与相应所述第一作答区域之间间隔预设数量的字符,所述第二试题片段与相应所述第二作答区域的位置关联包括所述第二试题片段与相应所述第二作答区域之间间隔所述预设数量的字符。


4.根据权利要求1所述的方法,其特征在于,所述第一试题片段包括一个第一子片段,所述第二试题片段包括一个第二子片段;
或,
所述第一试题片段包括两个第一子片段,所述第二试题片段包括两个第二子片段,其中,所述第一作答区域位于两个所述第一子片段之间,所述第二作答区域位于两个第二子片段之间。


5.根据权利要求1~4任一项所述的方法,其特征在于,所述提取待判页含有的第一试题片段,包括:
基于所述待判页含有的第一作答区域,获取含有所述第一作答区域和所述第一试题片段的第一扩展区域;
提取所述第一扩展区域含有的第一试题片段;
所述提取与所述待判页匹配的答案页含有的第二试题片段,包括:
基于所述答案页含有的第二作答区域,获取含有所述第二作答区域和所述第二试题片段的第二扩展区域;
提取所述第二扩展区域含有的第二试题片段。


6.根据权利要求5所述的方法,其特征在于,所述待判页的作答文本为手写体文本,所述待判页的试题文本为打印体文本;
所述提取所述第一扩展区域含有的第一试题片段包括:提取所述第一扩展区域内的打印体文本,得到所述第一试题片段;
或,
所述待判页的作答文本为打印体文本,所述待判页的试题文本均为手写体文本;
所述提取所述第一扩展区域含有的第一试题片段包括:提取所述第一扩展区域内的手写体文本,得到所述第一试题片段。


7.根据权利要求1所述的方法,其特征在于,所述在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果之前,所述方法包括:
确定所述第一作答区域和各个所述第二作答区域之间的位置偏差;
按所述位置偏差的由小到大的顺序,确定各个所述第二作答区域的优先级;
按照各个所述第二作答区域的优先级的先后顺序,判断所述第一作答区域关联的所述第一试题片段与各个所述第二作答区域关联的第二试题片段是否文本匹配;
其中,若所述第一作答区域关联的所述第一试题片段与第i优先级所述第二作答区域关联的第二试题片段的文本匹配,执行所述根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果;否则,判断第...

【专利技术属性】
技术研发人员:周宏浩秦勇
申请(专利权)人:北京世纪好未来教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1