一种文字行弯曲的修正方法及系统技术方案

技术编号:14572416 阅读:124 留言:0更新日期:2017-02-06 09:19
本发明专利技术公开了一种文字行弯曲的修正方法及系统。该方法,包括:获取扫描图片的文字行的曲线;获取曲线的最高点A和最大切线斜率对应的点B;计算最高点A与点B之间的直线AB与水平线之间的夹角α;确定所述夹角α大于等于预置角度,对所述文字行进行拉直。本发明专利技术通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α,确定所述夹角α大于等于预置角度,则对所述文字行进行拉直,本发明专利技术可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题,有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。

【技术实现步骤摘要】

本专利技术涉及图像处理
,尤其涉及一种文字行弯曲的修正方法及系统
技术介绍
用户在使用扫描笔的时候,书本未摆放规范、书页拱起而导致的形变,使扫描图片中的文字行弯曲,导致在后续的OCR(OpticalCharacterRecognition,光学字符识别)识别和搜索过程的准确程度受到影响。因此,需要提供一种扫描图片中文字行弯曲的修正方法,以修正弯曲的文字行,保证图片的视觉效果和后续OCR识别和搜索的准确性。
技术实现思路
本专利技术提供了一种文字行弯曲的修正方法及系统,有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题,有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。为实现上述设计,本专利技术采用以下技术方案:一方面,提供了一种文字行弯曲的修正方法,该方法,包括:获取扫描图片的文字行的曲线;获取曲线的最高点A和最大切线斜率对应的点B;计算最高点A与点B之间的直线AB与水平线之间的夹角α;确定所述夹角α大于等于预置角度,对所述文字行进行拉直。优选地,所述获取扫描图片的文字行的曲线,包括:根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。优选地,所述对所述文字行进行拉直,包括:把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;r>分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。优选地,所述预置角度为5°。优选地,所述对所述文字行进行拉直之后,还包括:识别文字行中的文字,使用所述文字进行搜索。另一方面,提供了一种文字行弯曲的修正系统,该系统,包括:曲线获取模块,用于获取扫描图片的文字行的曲线;点获取模块,用于获取曲线的最高点A和最大切线斜率对应的点B;夹角计算模块,用于计算最高点A与点B之间的直线AB与水平线之间的夹角α;拉直模块,用于确定所述夹角α大于等于预置角度,对所述文字行进行拉直。优选地,所述曲线获取模块具体用于,根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。优选地,所述拉直模块,具体用于:把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。优选地,所述预置角度为5°。优选地,还包括:识别搜索模块,用于识别文字行中的文字,使用所述文字进行搜索。与现有技术相比,本专利技术的有益效果为:获取扫描图片的文字行的曲线;获取曲线的最高点A和最大切线斜率对应的点B;计算最高点A与点B之间的直线AB与水平线之间的夹角α;确定所述夹角α大于等于预置角度,对所述文字行进行拉直。本专利技术通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α,确定所述夹角α大于等于预置角度,则对所述文字行进行拉直,本专利技术可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题,有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本专利技术实施例的内容和这些附图获得其他的附图。图1是本专利技术具体实施方式中提供的一种文字行弯曲的修正方法的第一实施例的方法流程图。图2是本专利技术具体实施方式中提供的一种文字行弯曲的修正方法的第二实施例的方法流程图。图3是本专利技术具体实施方式中提供的一种文字行弯曲的修正系统的第一实施例的结构方框图。图4是本专利技术具体实施方式中提供的一种文字行弯曲的修正系统的第二实施例的结构方框图。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本专利技术实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其是本专利技术具体实施方式中提供的一种文字行弯曲的修正方法的第一实施例的方法流程图。如图所示,该方法,包括:步骤S101:获取扫描图片的文字行的曲线。优选地,所述获取扫描图片的文字行的曲线,包括:根据扫描图片的文字本文档来自技高网...

【技术保护点】
一种文字行弯曲的修正方法,其特征在于,包括:获取扫描图片的文字行的曲线;获取曲线的最高点A和最大切线斜率对应的点B;计算最高点A与点B之间的直线AB与水平线之间的夹角α;确定所述夹角α大于等于预置角度,对所述文字行进行拉直。

【技术特征摘要】
1.一种文字行弯曲的修正方法,其特征在于,包括:
获取扫描图片的文字行的曲线;
获取曲线的最高点A和最大切线斜率对应的点B;
计算最高点A与点B之间的直线AB与水平线之间的夹角α;
确定所述夹角α大于等于预置角度,对所述文字行进行拉直。
2.根据权利要求1所述的修正方法,其特征在于,所述获取扫描图片的文
字行的曲线,包括:根据扫描图片的文字行的黑色像素点确定文字行高度,获
取文字行高度的中点,由所述中点组成文字行的曲线。
3.根据权利要求1所述的修正方法,其特征在于,所述对所述文字行进行
拉直,包括:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了
n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到
每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向
下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了
n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,
取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间
的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的
弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向
下移动,将移动后的分割的扫描图片进行拼接。
4.根据权利要求1所述的修正方法,其特征在于,所述预置角度为5°。
5.根据权利要求1所述的修正方法,其特征在于,所述对所述文字行进行
拉直之后,还包括:识别文字行中的文字,使用所述文字进行搜索。
6.一种文字行弯曲的修正系统,其...

【专利技术属性】
技术研发人员:张春雷龙安忠
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1