一种分离式OCR识别方法及其系统技术方案

技术编号:18526580 阅读:143 留言:0更新日期:2018-07-25 13:01
本发明专利技术公开了一种分离式图像OCR识别方法及其系统,包括以下步骤:建立坐标模型;获取图像的水印标识;标定坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别;根据水印标识部分区域对应坐标在待处理文字中插入标识符;灰度处理;USM锐化处理;二值化处理;对含水印标识部分的区域执行OCR识别;将相应待插入文字根据插入标识符插入到待处理文字。本发明专利技术采用文字分离的方式,将非水印部分的文字和水印部分的文字分别进行识别,其中通过提取水印部分的图片进行处理后再识别,最终分别将识别出的文字进行合并,本发明专利技术能有效提高对水印部分文字的识别准确性。

【技术实现步骤摘要】
一种分离式OCR识别方法及其系统
本专利技术涉及图像识别领域,特别是一种分离式OCR识别方法及其系统。
技术介绍
带水印的图片,就是在文字的上面添加上一层半透明的图像,这层图像不会影响读者对于文字的阅读。OCR文字识别,指利用OCR(OpticalCharacterRecognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。但是目前的OCR识别方法均不能识别出带有水印图片上面的文字。
技术实现思路
为解决上述问题,本专利技术的目的在于提供一种能够识别出包括水印图像上文字的一种分离式OCR识别方法及其系统。本专利技术解决其问题所采用的技术方案是:一种分离式图像OCR识别方法,包括以下步骤:对图像进行坐标矫正,建立坐标模型;获取图像的水印标识,在图像上标出包含有水印标识部分的区域;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;根据水印标识部分区域对应坐标在待处理文字中插入标识符;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;对含水印标识部分的区域执行OCR识别,识别出待插入文字;将相应待插入文字根据插入标识符插入到待处理文字,形成最终识别文字。进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。进一步,所述二值化处理包括以下步骤:横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:调用并运行word拼写检测与纠正插件;输出OCR识别后的文字,进行自动纠正;输出自动纠正后的文字。一种分离式图像OCR识别系统,包括:纠正装置,对图像进行坐标矫正,建立坐标模型;水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;坐标记录装置,标定水印标识部分区域对应坐标;提取水印装置,提取包含水印标识部分的区域;去除水印装置,图片去除含有水印标识部分的区域;第一OCR识别装置,对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;标识符插入装置,根据水印标识部分区域对应坐标在待处理文字中插入标识符;灰度处理装置,对含水印标识部分的区域进行灰度处理;锐化处理装置,对含水印标识部分的区域进行USM锐化处理;二值化处理装置,对含水印标识部分的区域进行二值化处理;第二OCR识别装置,对含水印标识部分的区域执行OCR识别,识别出待插入文字;文本合并装置,将相应待插入文字根据插入标识符插入到待处理文字,形成最终识别文字。本专利技术的有益效果是:本专利技术采用的一种分离式图像OCR识别方法及其系统,包括以下步骤:对图像进行坐标矫正,建立坐标模型;获取图像的水印标识,在图像上标出包含有水印标识部分的区域;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;根据水印标识部分区域对应坐标在待处理文字中插入标识符;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;对含水印标识部分的区域执行OCR识别,识别出待插入文字;将相应待插入文字根据插入标识符插入到待处理文字,形成最终识别文字。本专利技术采用文字分离的方式,将非水印部分的文字和水印部分的文字分别进行识别,其中通过提取水印部分的图片进行处理后再识别,最终分别将识别出的文字进行合并,本专利技术能有效提高对水印部分文字的识别准确性。附图说明下面结合附图和实例对本专利技术作进一步说明。图1是本专利技术的方法流程图。具体实施方式参照图1,本专利技术的一种分离式图像OCR识别方法,包括以下步骤:对图像进行坐标矫正,建立坐标模型;获取图像的水印标识,在图像上标出包含有水印标识部分的区域;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;根据水印标识部分区域对应坐标在待处理文字中插入标识符;对含水印标识部分的区域进行灰度处理,这样得出来的图片就像黑白照片一样,这样就可以降低后面步骤的运算量,并且使得图片更加易于辨认。对含水印标识部分的区域进行USM锐化处理;由于水印是半透明地覆盖在文字资料上,使得水印下文字的边缘变得模糊且难以辨认,因此要对图片锐化,这样会突出图片中的文字,有利于实现图片中文字与水印。对含水印标识部分的区域进行二值化处理;对含水印标识部分的区域执行OCR识别,识别出待插入文字;将相应待插入文字根据插入标识符插入到待处理文字,形成最终识别文字。进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。进一步,所述二值化处理包括以下步骤:横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:调用并运行word拼写检测与纠正插件;输出OCR识别后的文字,进行自动纠正;输出自动纠正后的文字。一种分离式图像OCR识别系统,包括:纠正装置,对图像进行坐标矫正,建立坐标模型;水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;坐标记录装置,标定水印标识部分区域对应坐标;提取水印装置,提取包含水印标识部分的区域;去除水印装置,图片去除含有水印标识部分的区域;第一OCR识别装置,对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;标识符插入装置,根据水印标识部分区域对应坐标在待处理文字中插入标识符;灰度处理装置,对含水印标识部分的区域进行灰度处理;锐化处理装置,对含水印标识部分的区域进行USM锐化处理;二值化处理装置,对含水印标识部分的区域进行二值化处理;第二OCR识别装置,对含水印标识部分的区域执行OCR识别,识别出待插入文字;文本合并装置,将相应待插入文字根据插入标识符插入到待处理文字,形成最终识别文字。以上所述,只是本专利技术的较佳实施例而已,本专利技术并不局限于上述实施方式,只要其以相同的手段达到本专利技术的技术效果,都应属于本专利技术的保护范围。本文档来自技高网...

【技术保护点】
1.一种分离式图像OCR识别方法,其特征在于,包括以下步骤:对图像进行坐标矫正,建立坐标模型;获取图像的水印标识,在图像上标出包含有水印标识部分的区域;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;根据水印标识部分区域对应坐标在待处理文字中插入标识符;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;对含水印标识部分的区域执行OCR识别,识别出待插入文字;将相应待插入文字根据插入标识符插入到待处理文字,形成最终识别文字。

【技术特征摘要】
1.一种分离式图像OCR识别方法,其特征在于,包括以下步骤:对图像进行坐标矫正,建立坐标模型;获取图像的水印标识,在图像上标出包含有水印标识部分的区域;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;根据水印标识部分区域对应坐标在待处理文字中插入标识符;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;对含水印标识部分的区域执行OCR识别,识别出待插入文字;将相应待插入文字根据插入标识符插入到待处理文字,形成最终识别文字。2.根据权利要求1所述的一种分离式图像OCR识别方法,其特征在于:所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。3.根据权利要求2所述的一种分离式图像OCR识别方法,其特征在于:所述二值化处理包括以下步骤:横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;二值化的阈...

【专利技术属性】
技术研发人员:欧阳永中
申请(专利权)人:佛山科学技术学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1