本发明专利技术提供了一种在图像中识别字符区域的方法,包括以下步骤:步骤S1:建立图像的彩色直方图;以及步骤S2:根据彩色直方图上的像素点密度区分图像上的字符区域和非字符区域。通过本发明专利技术所提供的在图像中识别字符区域的方法,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。
【技术实现步骤摘要】
本专利技术基本上涉及图像处理领域,更具体地来说,涉及一种。
技术介绍
在如今的计算机应用中,经常需要将视频或者静态图片中的字符信息提取出来,这就在技术实现上提出了更高的要求。现有技术提供了一种视频字幕提取的方法,包括以下步骤(I)对视频字幕区域进行基于连通区统计的字幕颜色判断,确认字幕颜色是深色还是浅色,同时反转浅色字幕的灰度图片为深色字幕图片;(2)对步骤(I)获得的灰度图片进行基于局部窗口分析的灰度图片二值化;(3)进行OCR软件识别,提取字幕文本结果。上述现有技术使用了字幕文字颜色判断和局部阈值的方法,能取得较好的二值化效果,然而,该现有技术通过深色和浅色对于字幕区域进行判断,准确度不高,无法应对较为复杂的识别需要。
技术实现思路
针对现有技术准确度不高,无法应对较为复杂的识别需要的缺陷,本专利技术提供了一种。通过本专利技术所描述的技术方案,解决了如何更精确地在图像中识别字符区域的技术问题。本专利技术提供了一种,其特征在于,包括步骤S1:建立所述图像的彩色直方图;以及步骤S2 :根据所述彩色直方图上的像素点密度识别所述图像上的字符区域和非字符区域。优选地,所述步骤S2包括步骤S21 :如果所述彩色直方图上只具有一个像素点聚集区域,则所述像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色;以及步骤S22 :将所述图像中的所述字符颜色的区域识别为字符区域,其他区域为非字符区域。优选地,所述步骤S2包括步骤S21 :如果所述彩色直方图上具有两个像素点聚集区域,则所述两个像素点聚集区域中的第一像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色,所述两个像素点聚集区域中的第二像素点聚集区域中的直方图坐标点所表示的颜色是非字符颜色;以及步骤S22 :将所述图像中的所述字符颜色的区域识别为字符区域,并且将所述图像中的所述非字符颜色的区域识别为非字符区域。优选地,所述第一像素点聚集区域中的像素点多于所述第二像素点聚集区域中的像素点。优选地,所述像素点聚集区域为像素点密度大于预定密度阈值的区域。优选地,所述像素点聚集区域为像素点占所述图像中的所有像素点的比例大于预定比例阈值的区域。优选地,还包括对所述图像进行二值化处理。优选地,所述预定比例阈值为20 %至30 %。优选地,所述彩色直方图的像素为256*256*256。通过本专利技术所提供的,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中图1是根据本专利技术的实施例的的总体流程图;图2是根据本专利技术的一个具体实施例的的流程图;图3是根据本专利技术的另一个具体实施例的的流程图。具体实施例方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图1是根据本专利技术的实施例的的总体流程图。在图1中步骤SlOO :建立图像的彩色直方图。在一个优选实施例中,该彩色直方图的像素为 256*256*256。步骤S102 :根据彩色直方图上的像素点密度区分图像上的字符区域和非字符区域。具体来说,彩色直方图中的每个直方图坐标点均代表了一种颜色,而每个直方图坐标点上均标记有数字,这个数字代表了在图像上有多少个像素点的颜色是这个直方图坐标点所表示的颜色。可以通过两种具体方式来实现该步骤,这两种方式将在以下两个具体实施例中示出。通过本专利技术所描述的,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。图2是根据本专利技术的一个具体实施例的的流程图。步骤S200和步骤SlOO相同,在此不再赘述。此外,在图2中还包括以下步骤步骤S202 :如果彩色直方图上具有一个像素点聚集区域,则像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色。其中,可以通过两种方式来判断一个区域是否是像素点聚集区域在第一种方式中,该像素点聚集区域被限定为像素点密度大于预定密度阈值的区域,其中,该像素点密度是在彩色直方图的坐标系中的单位体积中所包含的图像的像素点的数量;在第二种方式中,该像素点聚集区域为像素点占图像中的所有像素点的比例大于预定比例阈值的区域,也就是说,在该像素点聚集区域中,像素点的数量所占全部像素点的数量的比例达到了一定程度。优选地,该预定比例阈值为20 %至30 %。在本实施例中,由于有且只有一个区域是像素点聚集区域,也就是只有该区域所包含的像素点的数量达到了一定程度,因此,可以认为该区域中的颜色是字符颜色,即步骤S204:将图像中的字符颜色的区域识别为字符区域,其他区域为非字符区域。通过本实施例所描述的,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。图3是根据本专利技术的另一个具体实施例的的流程图。步骤S300和步骤SlOO相同,在此不再赘述。此外,在图3中还包括以下步骤步骤S302 :如果彩色直方图上具有两个像素点聚集区域,则两个像素点聚集区域中的第一像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色,两个像素点聚集区域中的第二像素点聚集区域中的直方图坐标点所表示的颜色是非字符颜色。其中,可以通过两种方式来判断一个区域是否是像素点聚集区域(包括第一像素点聚集区域和第二像素点聚集区域)在第一种方式中,该像素点聚集区域被限定为像素点密度大于预定密度阈值的区域,其中,该像素点密度是在彩色直方图的坐标系中的单位体积中所包含的图像的像素点的数量;在第二种方式中,该像素点聚集区域为像素点占图像中的所有像素点的比例大于预定比例阈值的区域,也就是说,在该像素点聚集区域中,像素点的数量所占全部像素点的数量的比例达到了 一定程度。优选地,该预定比例阈值为20 %至30 %。在本实施例中,由于有两个区域是像素点聚集区域,也就是说有两个区域所包含的像素点的数量达到了一定程度,因此,可以认为这两个区域中的颜色是一种字符颜色,另一种是非字符颜色(即,背景颜色),即步骤S304 :将图像中的字符颜色的区域识别为字符区域,并且将图像中的非字符颜色的区域识别为非字符区域。通过本实施例所描述的,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。以上所描述的内容仅为本专利技术的优选实施例而已,并不用于限制本专利技术,对于本领域的技术人员来说,本专利技术可以有各种更改和变化。凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...
【技术保护点】
一种在图像中识别字符区域的方法,其特征在于,包括:步骤S1:建立所述图像的彩色直方图;以及步骤S2:根据所述彩色直方图上的像素点密度识别所述图像上的字符区域和非字符区域。
【技术特征摘要】
1.一种在图像中识别字符区域的方法,其特征在于,包括 步骤S1:建立所述图像的彩色直方图;以及 步骤S2 :根据所述彩色直方图上的像素点密度识别所述图像上的字符区域和非字符区域。2.根据权利要求1中所述的在图像中识别字符区域的方法,其特征在于,所述步骤S2包括 步骤S21 :如果所述彩色直方图上只具有一个像素点聚集区域,则所述像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色;以及 步骤S22 :将所述图像中的所述字符颜色的区域识别为字符区域。3.根据权利要求1中所述的在图像中识别字符区域的方法,其特征在于,所述步骤S2包括 步骤S21 :如果所述彩色直方图上具有两个像素点聚集区域,则所述两个像素点聚集区域中的第一像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色,所述两个像素点聚集区域中的第二像素点聚集区域中的直方图坐标点所表示的颜色是非字符颜色;以及 步骤S22 :将所述图像中的所述字符...
【专利技术属性】
技术研发人员:刘立,
申请(专利权)人:曙光信息产业北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。