页面扭曲校正方法及系统、电子设备和计算机可读介质技术方案

技术编号:30688872 阅读:12 留言:0更新日期:2021-11-06 09:21
一种页面扭曲校正方法及系统、电子设备和计算机可读介质。所述页面扭曲校正方法包括:确定当前待校正的目标文字行,并在所述目标文字行选取若干校验点,所述若干校验点满足:在页面不扭曲时所述若干校验点的连线与校正参考线重合或平行;将所述若干校验点的位置与所述校正参考线进行比较,计算所述校验点需要校正的偏移量;根据计算的所述偏移量对所述目标文字行的各文字进行校正。本发明专利技术的方法简单高效,还原性好,适应性强,校正结果更稳定。校正结果更稳定。校正结果更稳定。

【技术实现步骤摘要】
页面扭曲校正方法及系统、电子设备和计算机可读介质


[0001]本专利技术属于图像识别和处理
,更具体的是涉及一种页面扭曲校正方法及系统、电子设备和计算机可读介质。

技术介绍

[0002]随着技术进步,现在的学生在遇到难题时可以通过手机拍摄不会解的难题进行全网络搜索答案,极大地便利了对知识的求索,弥补了师资的缺乏。在手机拍摄过程中,由于承载题目的纸张有可能弯折变形,导致拍摄得到的页面有可能也会随之拉伸变形,增加了文字识别的难度。在传统的扫描仪和复印机领域,也存在对变形页面的简单校正工艺,但其只是识别出页面的四个顶角进行简单的系数运算,并不能校正页面卷曲带来的字体扭曲失真的情形。因此,现有的页面扭曲校正技术还存在很大的不足,迫切需要研究开发一种新的校正方法及系统。

技术实现思路

[0003]有鉴于此,本专利技术的主要目的在于提出一种页面扭曲校正方法及系统、电子设备和计算机可读介质,以期至少部分地解决上述技术问题中的至少之一。
[0004]为了实现上述目的,作为本专利技术的第一个方面,提出了一种页面扭曲校正方法,包括如下步骤:
[0005]确定当前待校正的目标文字行,并在所述目标文字行选取若干校验点,所述若干校验点满足:在页面不扭曲时所述若干校验点的连线与校正参考线重合或平行;
[0006]将所述若干校验点的位置与所述校正参考线进行比较,计算所述校验点需要校正的偏移量;
[0007]根据计算的所述偏移量对所述目标文字行的各文字进行校正。
[0008]可选地,所述确定当前待校正的目标文字行之前,所述方法还包括:识别待校正页面图像中的文字行;
[0009]可选地,所述识别待校正页面图像中的文字行的步骤,包括以下方式中的任一种或多种的结合:
[0010]检测所述待校正页面图像中的文字目标,并获取所述文字目标的位置信息;基于所述文字目标的位置信息,确定位于同一行上的文字行;或者,
[0011]根据所述待校正页面图像的图像灰度来识别所述待校正页面图像中的文字行,如果所述待校正页面图像存在横向或纵向延伸的灰度区域且宽度满足预设值则判定为文本行;或者
[0012]通过用于检测图像中的文本行的人工智能模型检测所述文字行。
[0013]可选地,所述检测待校正页面图像中的文字目标,并获取所述文字目标的位置信息的步骤,包括以下方式中的任一种或多种的结合:
[0014]通过对所述待校正页面图像进行OCR识别来检测所述文字目标,并获取识别出的
所述文字目标的位置信息;
[0015]通过用于检测图像中的文字目标的人工智能模型检测所述文字目标,获取检测出的所述文字目标的位置信息。
[0016]可选地,所述在目标文字行选取若干校验点的步骤,包括:基于所述目标文字行的长度和字体大小,在字体高度设定一个比例等间距采样若干校验点;
[0017]可选地,选取所述文字的字体宽度和/或高度方向上的设定比例位置处的点作为校验点;
[0018]可选地,所述文字目标为印刷字体;
[0019]可选地,所述方法还包括:根据计算的所述偏移量对与所述目标文字行相邻行的文字进行校正;
[0020]可选地,所述方法还包括:根据计算的所述偏移量对与所述目标文字行扭曲一致的区域进行校正;
[0021]可选地,每行待校正的目标文字行对应一所述校正参考线,同一待校正页面上的多个所述校正参考线平行;
[0022]可选地,所述方法还包括:对待校正页面中所有的目标文字行均执行上述操作,从而以目标文字行上选取的校验点作为锚点,对整个待校正页面进行校正。
[0023]可选地,所述校正参考线为所述目标文字行对应的水平线;
[0024]所述将若干校验点的位置与所述校正参考线进行比较,计算所述校验点需要校正的偏移量的步骤中,将最左侧或最右侧的点作为基准点,所有校验点均相对其计算纵向方向上的相对偏移量;
[0025]可选地,所述计算校验点需要校正的偏移量的步骤还包括:将所述若干校验点的位置与根据目标文字行的宽度和行文字数计算得到的每个文字的理论位置进行比较,得到所有校验点横向方向上的相对偏移量;
[0026]可选地,校正时,对于纵向方向,基准点所属字体不移动,将其他点所属字体移动到过所述基准点的且与所述校正参考线平行的一条线上;
[0027]可选地,校正时,对于横向方向,基准点所属字体不移动,将其他点所属字体根据相对偏移量进行移动;
[0028]作为优选,所述计算校验点需要校正的偏移量的步骤之前,还对待校正页面的扭曲程度进行评估;
[0029]进一步优选地,所述对待校正页面的扭曲程度进行评估的步骤,是通过将偏移量与目标文字行中字体的宽度和高度分别进行比较来实现的;
[0030]进一步优选地,当待校正页面扭曲程度的评估分值低于第一阈值时,结束校正程序;
[0031]可选地,所述校验点需要校正的偏移量的步骤中,还通过插值或曲线拟合来计算求得两个选取的所述校验点之间的文字上的校验辅助点的偏移量;后续根据所述校验辅助点的偏移量对该两个选取的所述校验点之间的文字进行校正。
[0032]可选地,在所述确定当前待校正的目标文字行之前,还包括对页面预校正的步骤;
[0033]可选地,所述对页面预校正的步骤,包括:从待校正页面图像中确定纸张页面的顶角;将所述顶角的坐标与对应的基准水平线和/或基准竖直线进行比较,计算每个顶角需要
校正的偏移量;根据计算的偏移量对所述待校正页面图像进行预校正;
[0034]可选地,通过一个训练好的人工智能模型来自动识别待校正页面图像中的顶角,并将识别出的顶角的位置信息存储在数据库中;
[0035]可选地,所述对页面预校正包括:去除待校正页面图像中的无关信息,将所述待校正页面图像中的页面区域拉伸至与页面对应的规范化形状。
[0036]可选地,所述根据计算的相对偏移量对待校正页面图像进行预校正的步骤中,还包括:
[0037]通过插值或曲线拟合来计算位于任意两个所述顶角之间的预校正辅助点的相对偏移量。
[0038]作为本专利技术的第二个方面,还提出了一种页面扭曲校正系统,包括:
[0039]校验点选择单元,用于确定当前待校正的目标文字行,并在所述目标文字行选取若干校验点,所述若干校验点满足:在页面不扭曲时所述若干校验点的连线与校正参考线重合或平行;
[0040]偏移量确定单元,用于将所述若干校验点的位置与所述校正参考线进行比较,计算所述校验点需要校正的偏移量;
[0041]校正单元,用于根据计算的所述偏移量对所述目标文字行的各文字进行校正。
[0042]作为本专利技术的第三个方面,还提出了一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机可执行程序被所述处理器执行时,所述处理器执行如上所述的页面扭曲校正方法。
[0043]作为本专利技术的第四个方面,还提出了一种计算机可读介质本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种页面扭曲校正的方法,其特征在于,包括如下步骤:确定当前待校正的目标文字行,并在所述目标文字行选取若干校验点,所述若干校验点满足:在页面不扭曲时所述若干校验点的连线与校正参考线重合或平行;将所述若干校验点的位置与所述校正参考线进行比较,计算所述校验点需要校正的偏移量;根据计算的所述偏移量对所述目标文字行的各文字进行校正。2.根据权利要求1所述的方法,其特征在于,所述确定当前待校正的目标文字行之前,所述方法还包括:识别待校正页面图像中的文字行;可选地,所述识别待校正页面图像中的文字行的步骤,包括以下方式中的任一种或多种的结合:检测所述待校正页面图像中的文字目标,并获取所述文字目标的位置信息;基于所述文字目标的位置信息,确定位于同一行上的文字行;或者,根据所述待校正页面图像的图像灰度来识别所述待校正页面图像中的文字行,如果所述待校正页面图像存在横向或纵向延伸的灰度区域且宽度满足预设值则判定为文本行;或者通过用于检测图像中的文本行的人工智能模型检测所述文字行。3.根据权利要求2所述的方法,其特征在于,所述检测待校正页面图像中的文字目标,并获取所述文字目标的位置信息的步骤,包括以下方式中的任一种或多种的结合:通过对所述待校正页面图像进行OCR识别来检测所述文字目标,并获取识别出的所述文字目标的位置信息;通过用于检测图像中的文字目标的人工智能模型检测所述文字目标,获取检测出的所述文字目标的位置信息。4.根据权利要求1所述的方法,其特征在于,所述在目标文字行选取若干校验点的步骤,包括:基于所述目标文字行的长度和字体大小,在字体高度设定一个比例等间距采样若干校验点;可选地,选取所述文字的字体宽度和/或高度方向上的设定比例位置处的点作为校验点;可选地,所述文字目标为印刷字体;可选地,所述方法还包括:根据计算的所述偏移量对与所述目标文字行相邻行的文字进行校正;可选地,所述方法还包括:根据计算的所述偏移量对与所述目标文字行扭曲一致的区域进行校正;可选地,每行待校正的目标文字行对应一所述校正参考线,同一待校正页面上的多个所述校正参考线平行;可选地,所述方法还包括:对待校正页面中所有的目标文字行均执行上述操作,从而以目标文字行上选取的校验点作为锚点,对整个待校正页面进行校正。5.根据权利要求1所述的方法,其特征在于,所述校正参考线为所述目标文字行对应的水平线;所述将若干校验点的位置与所述校正参考线进行比较,计算所述校验点需要校正的偏
移量的步骤中,将最左侧或最右侧的点作为基准点,所有校验点均相对其计算纵向方向上的相对偏移量;可选地,所述计算校验点需要校正的偏移量的步骤还包括:将所述若干校验点的位置与根据目标文字行的宽度和行文字数计算得到的每个文字的理...

【专利技术属性】
技术研发人员:安晟杨森王岩王岩蔡红
申请(专利权)人:作业帮教育科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1