【技术实现步骤摘要】
一种图像识别方法、过滤方法及相关装置
本申请涉及图像处理
,特别是涉及一种图像识别方法、过滤方法及相关装置。
技术介绍
在购物网站上,商家用于展示商品的图像从内容上来看一般包括两个部分:展示商品状态的商品图像和在商品图像上增加的展示商品的一些辅助信息的辅助信息区域。这些辅助信息区域一般用于标识商品的品牌、介绍商品的特点或者宣传促销、打折信息等,辅助信息区域中通常包括文字(包括中文汉字、数字和英文字母)、商标和图案等。但一些辅助信息区域的内容很可能包含有不实或者夸张的广告等误导信息,消费者会因为错信这些误导信息而带来经济上的损失。另外,还有一些辅助信息区域往往以各种夸张的展现方式“喧宾夺主”,成为视觉的关注点,影响商品图像本身的展示效果。而商家和第三方购物平台也会受到信誉上的损失,甚至危害到商家和第三方购物平台的生存。可见,一些辅助信息区域很有可能是具有危害性的,它既影响了消费者的正常消费,也影响了管理者对商品的正常管理。通常,将包含这些具有危害性或干扰信息比较突出的辅助信息区域的图像称为异常图像。基于现有技术中存在的上述技术问题,目前迫切需要提供一种在用于展示商品的图像中识别出辅助信息区域的图像识别方法,以及,一种在包含识别出的辅助信息区域的所有图像中过滤异常图像的图像过滤方法。
技术实现思路
为了解决上述技术问题,本申请实施例提供了一种图像识别方法、过滤方法及相关装置,以识别出辅助信息区域,并从包含辅助信息区域的图像中过滤异常图像,避免异常图像对消费者或者管理者造成的危害。本申请实施例公开公开了如下技术方案:一种图像识别方法,包括:提取 ...
【技术保护点】
一种图像识别方法,其特征在于,包括:提取目标图像上的文字区域块;采用图像边缘算法,提取目标图像上的强边缘区域;判断所述强边缘区域是否为所述文字区域块的背景区域;如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否则,将所述文字区域块识别为辅助信息区域。
【技术特征摘要】
1.一种图像识别方法,其特征在于,包括: 提取目标图像上的文字区域块; 采用图像边缘算法,提取目标图像上的强边缘区域; 判断所述强边缘区域是否为所述文字区域块的背景区域; 如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否贝U,将所述文字区域块识别为辅助信息区域。2.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。3.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 判断是否有文字区域块位于所述强边缘区域上; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。4.根据权利 要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 判断所述强边缘区域和文字区域块的主颜色是否相同; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。5.根据权利要求1所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为:AC = ^(2 + 7/256) χ Ar2 +4xAg2 +(2 + (255-7)/256) X Δ?2 ,其中,r = (rY +r2)/2 , Ar = rrr2, Ag = g「g2,Δb = Id1-1d2 ;强边缘区域的主颜色为:(rl, gl,bl),文字区域块的主颜色为:(r2,g2,b2); 判断所述强边缘区域和文字区域块的主颜色之间的距离是否小于预设距离阈值;如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。6.根据权利要求1-5中任意一项所述的方法,其特征在于,所述从目标图像上提取出文字区域块包括: 基于纹理统计法或者基于区域分析法,从目标图像上提取文字区域块。7.一种图像过滤方法,其特征在于,包括: 提取目标图像上的文字区域块; 采用图像边缘算法,提取目标图像上的强边缘区域; 判断所述强边缘区域是否为文字区域块的背景区域; 如果是,把所述文字区域块扩展背景区域,将扩展后的区域识别为辅助信息区域,否贝U,将所述文字区域块识别为辅助信息区域; 根据所述辅助信息区域的区域信息和内容信息中的任意一个信息或者任意多个信息组合,确定所述辅助信息区域所在图像的类型。8.根据权利要求7所述的方法,其特征在于,所述辅助信息区域的区域信息包括:辅助信息区域的区域个数、大小和位置。9.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的个数确定所述辅助信息区域所在图像的类型包括: 统计所述辅助信息区域的个数; 判断统计的个数是否大于第一预设数目阈值; 如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。10.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的大小确定所述辅助信息区域所在图像的类型包括: 计算所述辅助信息区域的面积; 判断计算的面积是否大于预设面积阈值; 如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。11.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的个数和位置确定所述辅助信息区域所在图像的类型包括: 统计位于目标图像的指定区域的所述辅助信息区域的个数,所述目标图像的指定区域为目标图像的核心区域、目标图像的中间区域或目标图像的边缘区域; 判断统计的个数是否大于第二预设数目阈值; 如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。12.根据权利要求7所述的方法,其特征在于,所述根据所述辅助信息区域的内容确定所述辅助信息区域所在图像的类型包括: 根据机器学习法,从所述文字区域块中识别出文字; 判断识别出的文字是否与预设词库中的违禁词相匹配; 如果是,确定所述辅助信息区域所在图像的类型为异常图像,否则,确定所述辅助信息区域所在图像的类型为正常图像。13.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 根据所述强边缘区域的主颜色率判断所述强边缘区域是否为纯色区域; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。14.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 判断是否有文字区域块位于所述强边缘区域上; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。15.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 判断所述强边缘区域和文字区域块的主颜色是否相同; 如果是,所述强边缘区域是文字区域块的背景区域,否则,所述强边缘区域不是文字区域块的背景区域。16.根据权利要求7所述的方法,其特征在于,所述判断所述强边缘区域是否为文字区域块的背景区域包括: 通过颜色距离公式计算所述强边缘区域和文字区域块的主颜色之间的距离,其中,颜色距离公式为: 17.一种图像识别装置,其特征在于,包括: 文字区域块提取模块,用于提取目标图像上的文字区域块; 强边缘区域提取模块,用于采用图像边缘算法,提取目标图像上的强边缘区域; 背景区域判断模块,用于判断所述强边缘区域是否为文字区域块的背景区域; 图像识别模块,用于当所述背景区域判断模块的判断结果为是时,把所述...
【专利技术属性】
技术研发人员:贾梦雷,王永攀,郑琪,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。