文本图像的倾斜校正方法、系统、设备和存储介质技术方案

技术编号:25309709 阅读:28 留言:0更新日期:2020-08-18 22:28
本发明专利技术公开了一种文本图像的倾斜校正方法、系统、设备和存储介质,方法包括:对文本图像利用边缘检测算法获取二值图像;提取二值图像的所有轮廓,轮廓包括第一轮廓和第二轮廓,第一轮廓内包含多个第二轮廓;利用轮廓特征寻找符合预设的边缘轮廓,获取边缘轮廓及内部的第二轮廓的角度集合,并根据角度集合计算出倾斜角度;若不存在边缘轮廓,利用自适应霍夫变换筛选出所有线段并求出角度集合,再利用聚类算法求出倾斜角度;根据倾斜角度对文本图像进行倾斜校正。本发明专利技术结合文本图像的特征,根据边缘轮廓及霍夫直线检测并结合聚类算法计算图像的倾斜角度,可以准确快速的获得文本图像的倾斜角度并进行倾斜校正,提高了文本图像倾斜校正的准确率。

【技术实现步骤摘要】
文本图像的倾斜校正方法、系统、设备和存储介质
本专利技术涉及图像处理领域,具体涉及一种文本图像的倾斜校正方法、系统、设备和存储介质。
技术介绍
文本图像的倾斜校正属于图像校正处理中的一种,是为了将图像中倾斜的文本进行旋转校正后,更有利于人们查看,也更有利机器进行识别和分析图像中的文字内容。文本图像的倾斜校正广泛应用于文字识别领域。文本图像的倾斜校正技术的关键在于如何有效地找到最准确的倾斜角度,而通常会将寻找角度转换为寻找最优的倾斜直线,然后求出对应的倾斜角度。目前文本图像的倾斜校正的方法主要包括:(1)投影法;(2)Hough(霍夫)变换法;(3)最近邻聚类法;(4)基于OCR(光学字符识别,OpticalCharacterRecognition)识别反馈的文档倾斜校正方法等。上述方法都有各自的优点,但是,仍然有一些不足,如投影法一般计算量较大且精度较差;Hough变换法对于文字边缘不清晰或边缘不连续或有干扰的图像的检测精度不准;最近邻聚类法依赖文档图像的排版,适应性较差;而基于OCR识别反馈的方法,虽然提高了检测精度,但是计算量大且依赖识别的精度,在OCR文字识别过程中,由于用户拍摄或图像本身存在倾斜,导致图片的文本倾斜,在OCR识别过程中,对倾斜的文本检测难度加大,同时对倾斜的文本识别难度加大,从而降低了识别准确率;总之,目前现有文本图像的倾斜校正方法普遍存在精度不高,算法适应性较差或计算量大的问题,不能满足实际使用需求。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中文本图像的倾斜校正方法存在文本检测的精度较低及文本的整体识别率低的缺陷,提供一种文本图像的倾斜校正方法、系统、设备和存储介质。本专利技术是通过下述技术方案来解决上述技术问题:一种文本图像的倾斜校正方法,包括:获取文本图像的二值图像;获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;根据所述目标倾斜角度对所述文本图像进行倾斜校正。较佳地,所述判断所述第一轮廓是否符合预设边缘轮廓的条件的步骤包括:对所述第一轮廓进行遍历;判断所述第一轮廓是否符合预设边缘轮廓的条件;所述预设边缘轮廓的条件包括:所述第一轮廓的四条边连续且至少有三个交点、获取的所述第一轮廓内的每个所述第二轮廓的倾斜角度与所述第一轮廓的倾斜角度相差小于预设角度值,和获取的所述第一轮廓内的所述第二轮廓的数量大于预设数量值。较佳地,所述获取文本图像的二值图像的步骤包括:对所述文本图像进行预处理以得到第一图像;获取所述第一图像的亮度平均值和标准差;设置第一参数,所述第一参数可动态调整;根据所述亮度平均值、所述标准差和所述第一参数计算得到第一阈值和第二阈值;根据所述第一阈值和所述第二阈值使用边缘检测算法对所述第一图像进行边缘检测得到所述二值图像。较佳地,所述获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓的步骤具体包括:使用寻找轮廓函数计算得到所述二值图像中的所有轮廓;计算得到所有所述轮廓的最小外接矩形;计算得到所有所述最小外接矩形的第一平均高度、第一平均宽度和平均面积;采用聚类算法筛选出在第一预设范围内的所述第一平均高度和第一平均宽度,并根据筛选后的所述第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;根据所述第二平均高度和所述第二平均宽度获取文本平均高度;根据所述文本平均高度设置面积阈值;获取所述轮廓中面积值大于所述面积阈值的轮廓作为第二轮廓,所述第二轮廓包括所述二值图像中单个文字的轮廓;获取所述第二轮廓的最大外接矩形;根据所述平均面积、所述最大外接矩形及所述文本平均高度值获取包含若干所述第二轮廓的所述第一轮廓。较佳地,在所述第一轮廓不符合预设边缘轮廓的条件时,所述倾斜校正方法还包括:根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;采用霍夫变换算法根据设定参数阈值对所述二值图像进行直线检测得到直线线段;利用反正切函数获取所有所述直线线段的第一角度;将每个所述第一角度转换为预设角度范围内以形成第三角度集合;使用聚类算法获取所述第三角度集合中的最优角度集合;根据所述最优角度集合计算得到平均倾斜角度集合;判断所述平均倾斜角度集合中的每个平均倾斜角度是否有效,若有效,则将所述平均倾斜角度作为目标倾斜角度。一种文本图像的倾斜校正系统,包括:二值图像获取模块,用于获取文本图像的二值图像;轮廓获取模块,用于获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;边缘轮廓判断模块,用于判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则调用角度获取模块,所述角度获取模块用于获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;目标倾斜角度计算模块,用于根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;文本图像校正模块,用于根据所述目标倾斜角度对所述文本图像进行倾斜校正。较佳地,所述边缘轮廓判断模块包括:轮廓遍历单元,用于对所述第一轮廓进行遍历;条件判断单元,用于判断所述第一轮廓是否符合预设边缘轮廓的条件;所述预设边缘轮廓的条件包括:所述第一轮廓的四条边连续且至少有三个交点、获取的所述第一轮廓内的每个所述第二轮廓的倾斜角度与所述第一轮廓的倾斜角度相差小于预设角度值,和获取的所述第一轮廓内的所述第二轮廓的数量大于预设数量值。较佳地,所述二值图像获取模块包括:预处理单元,用于对所述文本图像进行预处理以得到第一图像;亮度和标准差获取单元,用于获取所述第一图像的亮度平均值和标准差;第一参数设置单元,用于设置第一参数,所述第一参数可动态调整;阈值计算单元,用于根据所述亮度平均值、所述标准差和所述第一参数计算得到第一阈值和第二阈值;二值图像获取单元,用于根据所述第一阈值和所述第二阈值使用边缘检测算法对所述第一图像进行边缘检测得到所述二值图像。较佳地,所述轮廓获取模块包括:轮廓计算单元,用于使用寻找轮廓函数计算得到所述二值图像中的所有轮廓;最小外接矩形计算单元,用于计算得到所有所述轮廓的最小外接矩形;计算单本文档来自技高网...

【技术保护点】
1.一种文本图像的倾斜校正方法,其特征在于,包括:/n获取文本图像的二值图像;/n获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;/n判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;/n根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;/n根据所述目标倾斜角度对所述文本图像进行倾斜校正。/n

【技术特征摘要】
1.一种文本图像的倾斜校正方法,其特征在于,包括:
获取文本图像的二值图像;
获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;
判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则获取所述第一轮廓的第一倾斜角度和所述第一轮廓中所述第二轮廓的第二倾斜角度集合;
根据所述第一倾斜角度和所述第二倾斜角度集合计算得到所述文本图像的目标倾斜角度;
根据所述目标倾斜角度对所述文本图像进行倾斜校正。


2.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述判断所述第一轮廓是否符合预设边缘轮廓的条件的步骤包括:
对所述第一轮廓进行遍历;
判断所述第一轮廓是否符合预设边缘轮廓的条件;
所述预设边缘轮廓的条件包括:所述第一轮廓的四条边连续且至少有三个交点、获取的所述第一轮廓内的每个所述第二轮廓的倾斜角度与所述第一轮廓的倾斜角度相差小于预设角度值,和获取的所述第一轮廓内的所述第二轮廓的数量大于预设数量值。


3.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述获取文本图像的二值图像的步骤包括:
对所述文本图像进行预处理以得到第一图像;
获取所述第一图像的亮度平均值和标准差;
设置第一参数,所述第一参数可动态调整;
根据所述亮度平均值、所述标准差和所述第一参数计算得到第一阈值和第二阈值;
根据所述第一阈值和所述第二阈值使用边缘检测算法对所述第一图像进行边缘检测得到所述二值图像。


4.如权利要求1所述的文本图像的倾斜校正方法,其特征在于,所述获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓的步骤具体包括:
使用寻找轮廓函数计算得到所述二值图像中的所有轮廓;
计算得到所有所述轮廓的最小外接矩形;
计算得到所有所述最小外接矩形的第一平均高度、第一平均宽度和平均面积;
采用聚类算法筛选出在第一预设范围内的所述第一平均高度和第一平均宽度,并根据筛选后的所述第一平均高度和第一平均宽度重新计算得到第二平均高度和第二平均宽度;
根据所述第二平均高度和所述第二平均宽度获取文本平均高度;
根据所述文本平均高度设置面积阈值;
获取所述轮廓中面积值大于所述面积阈值的轮廓作为第二轮廓,所述第二轮廓包括所述二值图像中单个文字的轮廓;
获取所述第二轮廓的最大外接矩形;
根据所述平均面积、所述最大外接矩形及所述文本平均高度值获取包含若干所述第二轮廓的所述第一轮廓。


5.如权利要求4所述的文本图像的倾斜校正方法,其特征在于,在所述第一轮廓不符合预设边缘轮廓的条件时,所述倾斜校正方法还包括:
根据最大外接矩形和文本平均高度值获取霍夫变换算法对应的设定参数阈值;
采用霍夫变换算法根据设定参数阈值对所述二值图像进行直线检测得到直线线段;
利用反正切函数获取所有所述直线线段的第一角度;
将每个所述第一角度转换为预设角度范围内以形成第三角度集合;
使用聚类算法获取所述第三角度集合中的最优角度集合;
根据所述最优角度集合计算得到平均倾斜角度集合;
判断所述平均倾斜角度集合中的每个平均倾斜角度是否有效,若有效,则将所述平均倾斜角度作为目标倾斜角度。


6.一种文本图像的倾斜校正系统,其特征在于,包括:
二值图像获取模块,用于获取文本图像的二值图像;
轮廓获取模块,用于获取所述二值图像中的所有轮廓,所述轮廓包括第一轮廓和第二轮廓,所述第一轮廓内包括若干个所述第二轮廓,所述第二轮廓为所述二值图像中单个文字对应的轮廓;
边缘轮廓判断模块,用于判断所述第一轮廓是否符合预设边缘轮廓的条件,若符合,则调用角度获取模块,所述角度获取模块用于获取所述第一轮廓...

【专利技术属性】
技术研发人员:黄登周源
申请(专利权)人:携程旅游信息技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1