图像的识别方法及装置制造方法及图纸

技术编号:14938760 阅读:85 留言:0更新日期:2017-04-01 00:40
本申请公开了一种图像的识别方法及装置。其中,该方法包括:按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。本申请解决了现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的技术问题。

【技术实现步骤摘要】

本申请涉及互联网领域,具体而言,涉及一种图像的识别方法及装置
技术介绍
随着电子商务的发展,炒信、欺诈等非法行为也趁机悄然滋生,此类违背诚信的虚假行为严重影响了电子商务的健康发展。例如,在淘宝、天猫等平台中,为了规避文本规则的管控,以图片作为信息载体的比重逐年增加。相比于单纯的文本信息,对于嵌入图片乃至视频中的文本信息的提取具有较大的技术难度,其具有较大的技术难度的主要有以下两个原因:1.图片样式的多样性;2.文字嵌入样式的多样性。在现有技术中,对于带有嵌入文字的图片进行识别方法分为两类:第一类为利用以图比图的方法对嵌入文字进行识别。通过标注一定数量的嵌入文字的图片样本,并提取图片样本的图像特征作为图像指纹,利用图像指纹计算图片与图片样本之间的相似度来进行图片的识别。通过以图比图的方法对嵌入文字的图片进行识别是一种较为简单的防控方法,但是,主要存在如下问题:1、通过以图比图的方法对图片进行识别,其识别图片的范围受到图片样本库范围的限制,对于采用新的文字嵌入方式的图片只能通过人工在对该类图片审核之后,将该类图片添加进图片样本库的方法来保证算法准确,操作较为复杂,并且不能保证时效性。2、在嵌入文字的图片中,存在很多背景相同但是嵌入的文字不同的图片,通过意图比图的方法,很难区分出此类文件,导致识别图片的识别精度低。第二类为利用自然场景OCR方法对嵌入文字进行识别。利用自然场景OCR技术对图片中的文字信息进行识别的方法,是一种较为有效的方法,但是存在如下问题:1、嵌入文字的图片可以选择任意图片作为背景,因在某些自然场景的图片中,通常包含了固有的文字内容,例如图片中的门牌号、车牌号等,而嵌入1文字的方式又多种多样,通过现有的自然场景OCR的识别方法很难对嵌入图片文字与图片自然场景中固有的文字内容进行区分。2、包含自然场景的图片具有一定的方向性,通常图片中固有的文字内容的主轴方向与图片自然场景的主轴方向相同。但是,用于嵌入图片的文字,在图片上可以以各种方向进行嵌入,单纯利用主轴对嵌入图片中的文字进行区分,难以达到识别效果。3、在嵌入文字的图片中,因嵌入文字的字体大小、笔画宽度等都多种多样,所以导致以标注字库训练的识别引擎无法进行识别。4、利用语义模型进行文本信息优选的方式也因准确率较低,难以满足特定类型文本图片识别的要求。5.不同的自然场景对于识别算法一般都有着特定的要求,使用单一的自然场景OCR算法以及关键词匹配算法很难保证算法的总体准确率。针对上述由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的问题,目前尚未提出有效的解决方案。申请内容本申请实施例提供了一种图像的识别方法及装置,以至少解决现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的的技术问题。根据本申请实施例的一个方面,提供了一种图像的识别方法,包括:按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。根据本申请实施例的另一方面,还提供了一种图像的识别装置,包括:第一提取模块,用于按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;筛选模块,用于根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;识别模块,用于对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;匹配模块,用于将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像。在本申请实施例中,采用按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像的方式,通过第一提取模块,用于按照颜色通道对获取的图像信息进行区域特征值提取处理,得到图像信息中与颜色通道对应的各个区域的区域特征值;筛选模块,用于根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选,确定图像信息中的文本区域;识别模块,用于对图像信息中的文本区域进行文字识别,得到与文本区域对应的字段信息;匹配模块,用于将字段信息与预先设置的非法关键词集合进行匹配,确定图像信息是否为包含非法字段信息的非法图像,达到了对图像信息中在各种场景下的文字信息的进行识别的目的,从而实现了提升对图像信息中的文字信息进行识别的准确率的技术效果,进而解决了现有技术中由于受图像信息的背景内容的影响,导致的对图像信息中的文字信息识别准确率低的的技术问题。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的一种图像的识别方法的移动终端的硬件结构框图;图2是根据本申请实施例的一种图像的识别方法的流程示意图;图3是根据本申请实施例的一种可选的图像的识别方法的流程示意图;图4是根据本申请实施例的一种可选的图像的识别方法的流程示意图;图5是根据本申请实施例的一种图像的识别装置的结构示意图;图6是根据本申请实施例的一种可选的图像的识别装置的结构示意图;图7是根据本申请实施例的一种可选的图像的识别装置的结构示意图;图8是根据本申请实施例的一种可选的图像的识别装置的第一提取模块的结构示意图;图9是根据本申请实施例的一种可选的图像的识别装置的第一提取模块的结构示意图;图10是根据本申请实施例的一种可选的图像的识别装置的结构示意图;图11是根据本申请实施例的一种可选的图像的识别装置的结构示意图;图12是根据本申请实施例的一种可选的图像的识别装置的识别模块的结构示意图;图13是根据本申请实施例的一种可选的图像的识别装置的结构示意图;以及图14是根据本申请实施例的一种可选的图像的识别装置的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例本文档来自技高网
...
图像的识别方法及装置

【技术保护点】
一种图像的识别方法,其特征在于,包括:按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值;根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选,确定所述图像信息中的文本区域;对所述图像信息中的所述文本区域进行文字识别,得到与所述文本区域对应的字段信息;将所述字段信息与预先设置的非法关键词集合进行匹配,确定所述图像信息是否为包含非法字段信息的非法图像。

【技术特征摘要】
1.一种图像的识别方法,其特征在于,包括:按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值;根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选,确定所述图像信息中的文本区域;对所述图像信息中的所述文本区域进行文字识别,得到与所述文本区域对应的字段信息;将所述字段信息与预先设置的非法关键词集合进行匹配,确定所述图像信息是否为包含非法字段信息的非法图像。2.根据权利要求1所述的方法,其特征在于,在将所述字段信息与预先设置的非法关键词集合进行匹配,确定所述图像信息是否为包含非法字段信息的非法图像之前,所述方法还包括:按照预先设置的分词规则对所述字段信息进行拆分,得到与所述字段信息对应的分词集合,其中,所述分词集合用于记录对所述字段信息进行拆分后得到的分词词条。3.根据权利要求2所述的方法,其特征在于,将所述字段信息与预先设置的非法关键词集合进行匹配,确定所述图像信息是否为包含非法字段信息的非法图像,包括:获取预先设置的非法关键词集合;获取与所述非法关键词集合中各非法关键词对应的权重值;将所述分词集合中的所述分词词条,分别与所述非法关键词集合中的非法关键词进行匹配,得到匹配结果;根据与所述非法关键词对应的权重值与所述匹配结果进行加权运算,得到所述字段信息的字段权重;将所述字段权重与预先设置的第二阈值进行比对,确定所述图像信息是否为包含所述非法字段的所述非法图像。4.根据权利要求1所述的方法,其特征在于,所述颜色通道包括:彩色通道和灰度通道,所述彩色通道至少包括:红色通道、绿色通道、蓝色通道和黄色通道,所述灰度通道至少包括:黑色通道、白色通道。5.根据权利要求4所述的方法,其特征在于,当所述颜色通道为所述彩色通道时,其中,按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值,包括:通过对所述图像信息中像素点的RGB颜色值进行修正处理,得到与所述像素点对应的预处理颜色值,其中,所述预处理颜色值中包括:红色值、绿色值、蓝色值和黄色值;根据所述预处理颜色值和所述像素点的位置信息,确定所述像素点在所述彩色通道中的第一像素特征值,其中,所述第一像素特征值与所述彩色通道对应;根据所述第一像素特征值,对所述图像信息进行提取处理,得到与所述彩色通道对应的所述区域特征值。6.根据权利要求4所述的方法,其特征在于,当所述颜色通道为所述灰度通道时,其中,按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值,还包括:获取预先设置的计算参数;根据所述图像信息中像素点的RGB颜色值、所述像素点的位置信息和所述计算参数,确定所述像素点在所述灰度通道中的第二像素特征值,其中,所述第二像素特征值与所述灰度通道对应;根据所述第二像素特征值对所述图像信息进行提取处理,得到与所述灰度通道对应的所述区域特征值。7.根据权利要求1所述的方法,其特征在于,根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选,确定所述图像信息中的文本区域,包括:将与所述颜色通道对应的所述区域特征值分别与所述第一阈值进行比对,得到比对结果;根据所述比对结果,确定所述图像信息中与所述颜色通道对应的所述文本区域。8.根据权利要求7所述的方法,其特征在于,当所述图像信息中包括至少两个所述文本区域时,在根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选,确定所述图像信息中的文本区域之后,所述方法还包括:获取所述文本区域在所述图像信息中的相对位置信息;根据所述文本区域的所述区域特征值,确定与所述文本区域对应的颜色通道信息;根据所述相对位置信息和所述颜色通道信息,确定所述文本区域之间的关联关系;将具有所述关联关系的文本区域合并为新文本区域。9.根据权利要求1所述的方法,其特征在于,对所述图像信息中的所述文本区域进行文字识别,得到与所述文本区域对应的字段信息,包括:按照预定方向对所述文本区域进行投影处理,得到与所述方向对应的所述文本区域的投影结果,其中,所述投影处理为沿预定方向对所述文本区域中每个区间内的像素密度进行统计处理,得到与所述方向对应的像素密度的分布结果;根据所述投影结果确定所述文本区域中的文字走向;根据所述文字走向和所述投影结果对所述文本区域进行顺序分割,分割得到子字符区域,其中,每个所述子字符区域包含一个字符;通过字符识别引擎对所述子字符区域中的字符进行识别,确定与所述子字符区域对应的识别结果;根据所述文字走向和所述识别结果,生成所述字段信息。10.根据权利要求9所述的方法,其特征在于,通过字符识别引擎对所述子字符区域中的字符进行识别,确定与所述子字符区域对应的识别结果,包括:通过所述字符识别引擎对所述子字符区域进行识别,得到与所述子字符区域对应的初始识别结果,其中,所述初始识别结果中至少包括一个备选字符和与所述备选字符对应的置信度;根据所述置信度,从所述初始识别结果中确定所述置信度最高的预定数量的备选字符作为所述识别结果。11.根据权利要求1所述的方法,其特征在于,当确定所述图像信息为包含非法字段
\t信息的非法图像之后,所述方法还包括:获取预先设置的第一图像特征向量,其中,所述第一图像特征向量用于表征特定类型图像的图像特征;对所述非法图像进行特征向量提取,得到第二图像特征向量;将所述第二图像特征向量与所述第一图像特征向量进行比对,确定所述非法图像的图像类型,其中,所述图像类型至少包括:聊天截图、非聊天截图。12.根据权利要求1至11中任意一项所述的方法,其特征在于,在按照颜色通道对获取的图像信息进行区域特征值提取处理,得到所述图像信息中与所述颜色...

【专利技术属性】
技术研发人员:金炫
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1