一种图像识别方法、过滤方法及相关装置制造方法及图纸

技术编号:9695012 阅读:115 留言:0更新日期:2014-02-21 01:39
本申请实施例公开了一种图像识别方法、过滤方法及其相关装置。其中的识别方法包括:提取目标图像上的文字区域块;采用图像边缘算法,提取目标图像上的强边缘区域;判断所述强边缘区域是否为所述文字区域块的背景区域;如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。进行识别后,再根据所述辅助信息区域的区域信息和内容信息中的任意一个或者任意多个,确定所述辅助信息区域所在图像的类型。根据本申请实施例,可以识别出辅助信息区域,并根据辅助信息区域过滤异常图像,避免异常图像对消费者或者管理者造成的危害。

【技术实现步骤摘要】
一种图像识别方法、过滤方法及相关装置
本申请涉及图像处理
,特别是涉及一种图像识别方法、过滤方法及相关装置。
技术介绍
在购物网站上,商家用于展示商品的图像从内容上来看一般包括两个部分:展示商品状态的商品图像和在商品图像上增加的展示商品的一些辅助信息的辅助信息区域。这些辅助信息区域一般用于标识商品的品牌、介绍商品的特点或者宣传促销、打折信息等,辅助信息区域中通常包括文字(包括中文汉字、数字和英文字母)、商标和图案等。但一些辅助信息区域的内容很可能包含有不实或者夸张的广告等误导信息,消费者会因为错信这些误导信息而带来经济上的损失。另外,还有一些辅助信息区域往往以各种夸张的展现方式“喧宾夺主”,成为视觉的关注点,影响商品图像本身的展示效果。而商家和第三方购物平台也会受到信誉上的损失,甚至危害到商家和第三方购物平台的生存。可见,一些辅助信息区域很有可能是具有危害性的,它既影响了消费者的正常消费,也影响了管理者对商品的正常管理。通常,将包含这些具有危害性或干扰信息比较突出的辅助信息区域的图像称为异常图像。基于现有技术中存在的上述技术问题,目前迫切需要提供一种在用于展示商品的图像中识别出辅助信息区域的图像识别方法,以及,一种在包含识别出的辅助信息区域的所有图像中过滤异常图像的图像过滤方法。
技术实现思路
为了解决上述技术问题,本申请实施例提供了一种图像识别方法、过滤方法及相关装置,以识别出辅助信息区域,并从包含辅助信息区域的图像中过滤异常图像,避免异常图像对消费者或者管理者造成的危害。本申请实施例公开公开了如下技术方案:一种图像识别方法,包括:提取目标图像上的文字区域块;采用图像边缘算法,提取目标图像上的强边缘区域;判断所述强边缘区域是否为所述文字区域块的背景区域;如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。一种图像过滤方法,包括:提取目标图像上的文字区域块;采用图像边缘算法,提取目标图像上的强边缘区域;判断所述强边缘区域是否为文字区域块的背景区域;如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域;根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。一种图像识别装置,包括:文字区域块提取模块,用于提取目标图像上的文字区域块;强边缘区域提取模块,用于采用图像边缘算法,提取目标图像上的强边缘区域;背景区域判断模块,用于判断所述强边缘区域是否为文字区域块的背景区域;图像识别模块,用于当所述背景区域判断模块的判断结果为是时,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。一种图像过滤装置,包括:文字区域块提取模块,用于提取目标图像上的文字区域块;强边缘区域提取模块,用于采用图像边缘算法,提取目标图像上的强边缘区域;背景区域判断模块,用于判断所述强边缘区域是否为文字区域块的背景区域;图像识别模块,用于当所述背景区域判断模块的判断结果为是时,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域;图像过滤模块,用于根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。由上述实施例可以看出,提取目标图像中的文字区域块,对文字区域块进行背景扩展,可识别出目标图像中的辅助信息区域。基于识别出的辅助信息区域,根据辅助信息区域的个数、大小、位置或内容,进一步过滤出异常图像,从而可以避免异常图像对消费者或者管理者造成的危害。【附图说明】为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例一揭示的一种图像识别方法的方法流程图;图2为本申请中文字排布信息的统计示意图;图3为本申请中带有文字区域块的背景区域的商品图像示意图;图4为本申请实施例二揭示的一种图像过滤方法的方法流程图;图5为本申请中过滤商品图像的对比示意图;图6为本申请实施例三揭示的一种图像过滤方法的方法流程图;图7为本申请实施例四揭示的一种图像识别装置的装置结构图;图8为本申请实施例四揭示的一种图像识别装置的装置结构图。【具体实施方式】为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例进行详细描述。实施例一请参阅图1,其为本申请实施例一揭示的一种图像识别方法的方法流程图,该方法包括以下步骤:步骤101:提取目标图像上的文字区域块;可基于现有技术中的纹理统计法或者区域分析法,从目标图像上提取文字区域块。其中,基于纹理统计法的文字区域块提取方法具体为:对目标图像进行纹理提取,如,常见的有sobel (索贝尔)、Ibp (局部二值模式)或者小波等纹理提取方式;根据提取出的纹理统计文字排布信息;根据文字排布信息确定是否为文字区域块,例如,只要统计的文字排布信息符合如图2所示的文字排布结构,即被确定为文字区域块。另外,基于区域分析的文字区域块提取方法具体为:对图像进行区域提取,如,常见的有canny或mser等区域提取方式;根据文字区域的基础特征、笔划特征或排列特征等特征对非文字区域进行过滤。如,常用的基础特征包括:区域面积或区域面积与目标图像总面积的比值、区域面积与拟合椭圆的比值、或区域周长与区域面积的比值等。常用的笔划特征包括:笔划的平均相对角度、笔划的对称边缘比例、主笔划宽度、或笔划宽度的离散程度等。常用的排列特征包括:邻近区域大小、笔划宽度、或颜色等属性相似度,几何排列性质坐寸ο按照上述方法进行提取后,获得的文字区域块是文字区域的外接矩形,通过该外接矩形的起始位置和矩形的长、宽来标识该外接矩形。需要说明的是,本申请实施例并不限定采用何种方法提取目标图像上的文字区域块,除了上述列举的两种方法外,也可以采用现有技术公开的其它方法提取文字区域块。步骤102:采用图像边缘算法,提取目标图像上的强边缘区域;在很多辅助信息区域中,文字区域块并不是直接置于商品图像之上,往往还会加有一个背景区域,以示突出。如图3所示,文字区域块都伴随有一定大小的背景区域,这些文字区域块的背景区域也同样属于辅助信息区域的一部分。因此,在对文字区域块进行提取的同时,还需要一并提取出文字区域块的背景区域。在本申请实施例中,提供了一种基于强边缘区域的背景区域识别方案。例如,采用canny图像边缘算法,提取目标图像上的强边缘区域。当然,本申请实施例并不限定采用何种方法提取目标图像的强边缘区域,除了 canny图像边缘算法外,也可以采用现有技术公开的其它方法提取强边缘区域。步骤103:判断所述强边缘区域是否为所述文字区域块的背景区域,如果是,进入步骤104,否则,进入步骤105 ;判断所述强边缘区域是否为文字区域块的背景区域的一种实现方式为:根据所述强边缘区域的主颜色率判断所述强边缘区域是本文档来自技高网...

【技术保护点】
一种图像识别方法,其特征在于,包括:提取目标图像上的文字区域块;采用图像边缘算法,提取目标图像上的强边缘区域;判断所述强边缘区域是否为所述文字区域块的背景区域;如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括: 提取目标图像上的文字区域块; 采用图像边缘算法,提取目标图像上的强边缘区域; 判断所述强边缘区域是否为所述文字区域块的背景区域; 如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否贝U,将所述文字区域块识别为辅助信息区域。2.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。3.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 判断是否有文字区域块位于所述强边缘区域上; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。4.根据权利 要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 判断所述强边缘区域和文字区域块的主颜色是否相同; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。5.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为:AC = ^(2 + 7/256) χ Ar2 +4xAg2 +(2 + (255-7)/256) X Δ?2 ,其中,r = (rY +r2)/2 , Ar = rrr2, Ag = g「g2,Δb = Id1-1d2 ;强边缘区域的主颜色为:(rl, gl,bl),文字区域块的主颜色为:(r2,g2,b2); 判断所述强边缘区域和文字区域块的主颜色之间的距离是否小于预设距离阈值;如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。6.根据权利要求1-5中任意一项所述的方法,其特征在于,所述从目标图像上提取出文字区域块包括: 基于纹理统计法或者基于区域分析法,从目标图像上提取文字区域块。7.一种图像过滤方法,其特征在于,包括: 提取目标图像上的文字区域块; 采用图像边缘算法,提取目标图像上的强边缘区域; 判断所述强边缘区域是否为文字区域块的背景区域; 如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否贝U,将所述文字区域块识别为辅助信息区域; 根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。8.根据权利要求7所述的方法,其特征在于,所述辅助信息区域的区域信息包括:辅助信息区域的区域个数、大小和位置。9.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的个数确定所述辅助信息区域所在图像的类型包括: 统计所述辅助信息区域的个数; 判断统计的个数是否大于第一预设数目阈值; 如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。10.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的大小确定所述辅助信息区域所在图像的类型包括: 计算所述辅助信息区域的面积; 判断计算的面积是否大于预设面积阈值; 如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。11.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的个数和位置确定所述辅助信息区域所在图像的类型包括: 统计位于目标图像的指定区域的所述辅助信息区域的个数,所述目标图像的指定区域为目标图像的核心区域、目标图像的中间区域或目标图像的边缘区域; 判断统计的个数是否大于第二预设数目阈值; 如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。12.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的内容确定所述辅助信息区域所在图像的类型包括: 根据机器学习法,从所述文字区域块中识别出文字; 判断识别出的文字是否与预设词库中的违禁词相匹配; 如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。13.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。14.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 判断是否有文字区域块位于所述强边缘区域上; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。15.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 判断所述强边缘区域和文字区域块的主颜色是否相同; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。16.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为: 17.一种图像识别装置,其特征在于,包括: 文字区域块提取模块,用于提取目标图像上的文字区域块; 强边缘区域提取模块,用于采用图像边缘算法,提取目标图像上的强边缘区域; 背景区域判断模块,用于判断所述强边缘区域是否为文字区域块的背景区域; 图像识别模块,用于当所述背景区域判断模块的判断结果为是时,把所述...

【专利技术属性】
技术研发人员:贾梦雷王永攀郑琪
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1