图像的识别方法及装置制造方法及图纸

技术编号：14938760 阅读：85 留言：0更新日期：2017-04-01 00:40

本申请公开了一种图像的识别方法及装置。其中，该方法包括：按照颜色通道对获取的图像信息进行区域特征值提取处理，得到图像信息中与颜色通道对应的各个区域的区域特征值；根据区域特征值与预先设置的第一阈值对图像信息中各个区域进行筛选，确定图像信息中的文本区域；对图像信息中的文本区域进行文字识别，得到与文本区域对应的字段信息；将字段信息与预先设置的非法关键词集合进行匹配，确定图像信息是否为包含非法字段信息的非法图像。本申请解决了现有技术中由于受图像信息的背景内容的影响，导致的对图像信息中的文字信息识别准确率低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及互联网领域，具体而言，涉及一种图像的识别方法及装置。
技术介绍
随着电子商务的发展，炒信、欺诈等非法行为也趁机悄然滋生，此类违背诚信的虚假行为严重影响了电子商务的健康发展。例如，在淘宝、天猫等平台中，为了规避文本规则的管控，以图片作为信息载体的比重逐年增加。相比于单纯的文本信息，对于嵌入图片乃至视频中的文本信息的提取具有较大的技术难度，其具有较大的技术难度的主要有以下两个原因：1.图片样式的多样性；2.文字嵌入样式的多样性。在现有技术中，对于带有嵌入文字的图片进行识别方法分为两类：第一类为利用以图比图的方法对嵌入文字进行识别。通过标注一定数量的嵌入文字的图片样本，并提取图片样本的图像特征作为图像指纹，利用图像指纹计算图片与图片样本之间的相似度来进行图片的识别。通过以图比图的方法对嵌入文字的图片进行识别是一种较为简单的防控方法，但是，主要存在如下问题：1、通过以图比图的方法对图片进行识别，其识别图片的范围受到图片样本库范围的限制，对于采用新的文字嵌入方式的图片只能通过人工在对该类图片审核之后，将该类图片添加进图片样本库的方法来保证算法准确，操作较为复杂，并且不能保证时效性。2、在嵌入文字的图片中，存在很多背景相同但是嵌入的文字不同的图片，通过意图比图的方法，很难区分出此类文件，导致识别图片的识别精度低。第二类为利用自然场景OCR方法对嵌入文字进行识别。利用自然场景OCR技术对图片中的文字信息进行识别的方法，是一种较为有效的方法，但是存在如下问题：1、嵌入文字的图片可以选择任意图片作为背景，因在某些自然场景的图片中，通常包含了固有的文字内容，例如图...
图像的识别方法及装置

【技术保护点】
一种图像的识别方法，其特征在于，包括：按照颜色通道对获取的图像信息进行区域特征值提取处理，得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值；根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选，确定所述图像信息中的文本区域；对所述图像信息中的所述文本区域进行文字识别，得到与所述文本区域对应的字段信息；将所述字段信息与预先设置的非法关键词集合进行匹配，确定所述图像信息是否为包含非法字段信息的非法图像。

【技术特征摘要】
1.一种图像的识别方法，其特征在于，包括：按照颜色通道对获取的图像信息进行区域特征值提取处理，得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值；根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选，确定所述图像信息中的文本区域；对所述图像信息中的所述文本区域进行文字识别，得到与所述文本区域对应的字段信息；将所述字段信息与预先设置的非法关键词集合进行匹配，确定所述图像信息是否为包含非法字段信息的非法图像。2.根据权利要求1所述的方法，其特征在于，在将所述字段信息与预先设置的非法关键词集合进行匹配，确定所述图像信息是否为包含非法字段信息的非法图像之前，所述方法还包括：按照预先设置的分词规则对所述字段信息进行拆分，得到与所述字段信息对应的分词集合，其中，所述分词集合用于记录对所述字段信息进行拆分后得到的分词词条。3.根据权利要求2所述的方法，其特征在于，将所述字段信息与预先设置的非法关键词集合进行匹配，确定所述图像信息是否为包含非法字段信息的非法图像，包括：获取预先设置的非法关键词集合；获取与所述非法关键词集合中各非法关键词对应的权重值；将所述分词集合中的所述分词词条，分别与所述非法关键词集合中的非法关键词进行匹配，得到匹配结果；根据与所述非法关键词对应的权重值与所述匹配结果进行加权运算，得到所述字段信息的字段权重；将所述字段权重与预先设置的第二阈值进行比对，确定所述图像信息是否为包含所述非法字段的所述非法图像。4.根据权利要求1所述的方法，其特征在于，所述颜色通道包括：彩色通道和灰度通道，所述彩色通道至少包括：红色通道、绿色通道、蓝色通道和黄色通道，所述灰度通道至少包括：黑色通道、白色通道。5.根据权利要求4所述的方法，其特征在于，当所述颜色通道为所述彩色通道时，其中，按照颜色通道对获取的图像信息进行区域特征值提取处理，得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值，包括：通过对所述图像信息中像素点的RGB颜色值进行修正处理，得到与所述像素点对应的预处理颜色值，其中，所述预处理颜色值中包括：红色值、绿色值、蓝色值和黄色值；根据所述预处理颜色值和所述像素点的位置信息，确定所述像素点在所述彩色通道中的第一像素特征值，其中，所述第一像素特征值与所述彩色通道对应；根据所述第一像素特征值，对所述图像信息进行提取处理，得到与所述彩色通道对应的所述区域特征值。6.根据权利要求4所述的方法，其特征在于，当所述颜色通道为所述灰度通道时，其中，按照颜色通道对获取的图像信息进行区域特征值提取处理，得到所述图像信息中与所述颜色通道对应的各个区域的区域特征值，还包括：获取预先设置的计算参数；根据所述图像信息中像素点的RGB颜色值、所述像素点的位置信息和所述计算参数，确定所述像素点在所述灰度通道中的第二像素特征值，其中，所述第二像素特征值与所述灰度通道对应；根据所述第二像素特征值对所述图像信息进行提取处理，得到与所述灰度通道对应的所述区域特征值。7.根据权利要求1所述的方法，其特征在于，根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选，确定所述图像信息中的文本区域，包括:将与所述颜色通道对应的所述区域特征值分别与所述第一阈值进行比对，得到比对结果；根据所述比对结果，确定所述图像信息中与所述颜色通道对应的所述文本区域。8.根据权利要求7所述的方法，其特征在于，当所述图像信息中包括至少两个所述文本区域时，在根据所述区域特征值与预先设置的第一阈值对所述图像信息中所述各个区域进行筛选，确定所述图像信息中的文本区域之后，所述方法还包括：获取所述文本区域在所述图像信息中的相对位置信息；根据所述文本区域的所述区域特征值，确定与所述文本区域对应的颜色通道信息；根据所述相对位置信息和所述颜色通道信息，确定所述文本区域之间的关联关系；将具有所述关联关系的文本区域合并为新文本区域。9.根据权利要求1所述的方法，其特征在于，对所述图像信息中的所述文本区域进行文字识别，得到与所述文本区域对应的字段信息，包括：按照预定方向对所述文本区域进行投影处理，得到与所述方向对应的所述文本区域的投影结果，其中，所述投影处理为沿预定方向对所述文本区域中每个区间内的像素密度进行统计处理，得到与所述方向对应的像素密度的分布结果；根据所述投影结果确定所述文本区域中的文字走向；根据所述文字走向和所述投影结果对所述文本区域进行顺序分割，分割得到子字符区域，其中，每个所述子字符区域包含一个字符；通过字符识别引擎对所述子字符区域中的字符进行识别，确定与所述子字符区域对应的识别结果；根据所述文字走向和所述识别结果，生成所述字段信息。10.根据权利要求9所述的方法，其特征在于，通过字符识别引擎对所述子字符区域中的字符进行识别，确定与所述子字符区域对应的识别结果，包括：通过所述字符识别引擎对所述子字符区域进行识别，得到与所述子字符区域对应的初始识别结果，其中，所述初始识别结果中至少包括一个备选字符和与所述备选字符对应的置信度；根据所述置信度，从所述初始识别结果中确定所述置信度最高的预定数量的备选字符作为所述识别结果。11.根据权利要求1所述的方法，其特征在于，当确定所述图像信息为包含非法字段
\t信息的非法图像之后，所述方法还包括：获取预先设置的第一图像特征向量，其中，所述第一图像特征向量用于表征特定类型图像的图像特征；对所述非法图像进行特征向量提取，得到第二图像特征向量；将所述第二图像特征向量与所述第一图像特征向量进行比对，确定所述非法图像的图像类型，其中，所述图像类型至少包括：聊天截图、非聊天截图。12.根据权利要求1至11中任意一项所述的方法，其特征在于，在按照颜色通道对获取的图像信息进行区域特征值提取处理，得到所述图像信息中与所述颜色...

【专利技术属性】
技术研发人员：金炫，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人