【技术实现步骤摘要】
文档处理方法、装置、电子设备及计算机可读存储介质
本专利技术涉及计算机
,尤其涉及一种文档处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
拍照判题是人工智能技术在教育领域的一项重要应用,其拍照判断流程是:用户用手机或平板电脑等终端设备进行拍照,然后将拍摄的图像上传至拍照判题程序,接着拍照判题程序将图像送入题型判断模型,题型判断模型检测预先指定的题型的文本区域,并框选该文本区域。与此同时,应用程序将图像送入文本行检测模型,文本行检测模型检测文本行区域,并框选该文本行区域;然后利用版面分析模型根据文本行检测模型的检测结果进行版面分析,对框进行合并,同时根据每种题型的特点,分析得到每个题是由哪些框组成,然后根据框的坐标在原图上进行裁剪,将裁剪得到的图像送入识别模型,得到每个题目的内容,然后根据题目内容判断试题判题结果,并将试题判题结果进行输出。
技术实现思路
根据本公开的第一方面,提供了一种文档处理方法,包括:提取待判页含有的第一试题片段,所述第一试题片段与所述待判页含有的相应第一作答区域位置关联;提取与所述待判页匹配的答案页含有的第二试题片段,所述第二试题片段与所述答案页含有的相应第二作答区域位置关联;在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果。根据本公开的第二方面,提供了一种文档处理装置,包括:第一提取模块,用于 ...
【技术保护点】
1.一种文档处理方法,其特征在于,包括:/n提取待判页含有的第一试题片段,所述第一试题片段与所述待判页含有的第一作答区域位置关联;/n提取与所述待判页匹配的答案页含有的第二试题片段,所述第二试题片段与所述答案页含有的相应第二作答区域位置关联;/n在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果。/n
【技术特征摘要】
1.一种文档处理方法,其特征在于,包括:
提取待判页含有的第一试题片段,所述第一试题片段与所述待判页含有的第一作答区域位置关联;
提取与所述待判页匹配的答案页含有的第二试题片段,所述第二试题片段与所述答案页含有的相应第二作答区域位置关联;
在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果。
2.根据权利要求1所述的方法,其特征在于,所述第一试题片段与相应所述第一作答区域的位置关联包括所述第一试题片段与相应所述第一作答区域的位置相邻,所述第二试题片段与相应所述第二作答区域的位置关联包括所述第二试题片段与相应所述第二作答区域的位置相邻。
3.根据权利要求1所述的方法,其特征在于,所述第一试题片段与相应所述第一作答区域的位置关联包括所述第一试题片段与相应所述第一作答区域之间间隔预设数量的字符,所述第二试题片段与相应所述第二作答区域的位置关联包括所述第二试题片段与相应所述第二作答区域之间间隔所述预设数量的字符。
4.根据权利要求1所述的方法,其特征在于,所述第一试题片段包括一个第一子片段,所述第二试题片段包括一个第二子片段;
或,
所述第一试题片段包括两个第一子片段,所述第二试题片段包括两个第二子片段,其中,所述第一作答区域位于两个所述第一子片段之间,所述第二作答区域位于两个第二子片段之间。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述提取待判页含有的第一试题片段,包括:
基于所述待判页含有的第一作答区域,获取含有所述第一作答区域和所述第一试题片段的第一扩展区域;
提取所述第一扩展区域含有的第一试题片段;
所述提取与所述待判页匹配的答案页含有的第二试题片段,包括:
基于所述答案页含有的第二作答区域,获取含有所述第二作答区域和所述第二试题片段的第二扩展区域;
提取所述第二扩展区域含有的第二试题片段。
6.根据权利要求5所述的方法,其特征在于,所述待判页的作答文本为手写体文本,所述待判页的试题文本为打印体文本;
所述提取所述第一扩展区域含有的第一试题片段包括:提取所述第一扩展区域内的打印体文本,得到所述第一试题片段;
或,
所述待判页的作答文本为打印体文本,所述待判页的试题文本均为手写体文本;
所述提取所述第一扩展区域含有的第一试题片段包括:提取所述第一扩展区域内的手写体文本,得到所述第一试题片段。
7.根据权利要求1所述的方法,其特征在于,所述在所述第一试题片段与所述第二试题片段的文本匹配时,根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果之前,所述方法包括:
确定所述第一作答区域和各个所述第二作答区域之间的位置偏差;
按所述位置偏差的由小到大的顺序,确定各个所述第二作答区域的优先级;
按照各个所述第二作答区域的优先级的先后顺序,判断所述第一作答区域关联的所述第一试题片段与各个所述第二作答区域关联的第二试题片段是否文本匹配;
其中,若所述第一作答区域关联的所述第一试题片段与第i优先级所述第二作答区域关联的第二试题片段的文本匹配,执行所述根据与所述第一试题片段位置关联的所述第一作答区域内的文本和与相应所述第二试题片段位置关联的所述第二作答区域内的文本输出判题结果;否则,判断第...
【专利技术属性】
技术研发人员:周宏浩,秦勇,
申请(专利权)人:北京世纪好未来教育科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。