图像种类识别的方法、可读存储介质及计算机设备技术

技术编号:35996766 阅读:18 留言:0更新日期:2022-12-17 23:13
本申请实施例提供一种图像种类识别的方法、可读存储介质及计算机设备,本发明专利技术在现有识别算法的基础之上还需要提取印章局部的文字图像特征,并融合现有算法提取的形状特征、颜色特征、空间几何特征,比如可以识别法院印章的种类、发票印制的种类、护照出入境印章的种类,包括出境还是入境、特定国家的种类、鉴别印章的真假等,以有利于提升印章识别算法的鲁棒性和泛化性能。棒性和泛化性能。棒性和泛化性能。

【技术实现步骤摘要】
图像种类识别的方法、可读存储介质及计算机设备


[0001]本申请涉及图像处理
,具体地涉及一种图像种类识别的方法、可读存储介质及计算机设备。

技术介绍

[0002]识别印章需要提取印章的形状特征、颜色特征、空间几何结构特征、局部文字图像特征。现有的深度学习识别算法可以提取形状特征,颜色特征,空间几何结构特征,如imagenet数据集上的分类算法resnet、googlenet、SEnet等。
[0003]现有的印章识别算法大多通过OCR算法提取印章上的文字信息,现有的OCR算法分为两种:一种是两阶段的:第一阶段通过CNN文本定位算法定位文字区域,第二阶段通过定位出的文字区域,再通过RNN算法对定位出的文字区域进行文字识别;另一种OCR算法是端到端的,同时进行文本定位和文本识别两个任务学习。
[0004]现有的图像识别算法如resnet、SEnet、googlenet,只能提取形状特征、颜色特征、空间几何特征,导致对只有局部文字不同的印章,无法进行识别,而局部文字不同的印章比较常见,因此现有算法通用性和泛化性较差,并不能提取局部的文字图像特征。

技术实现思路

[0005]本申请实施例的目的是提供一种图像种类识别的方法、可读存储介质及计算机设备。
[0006]为了实现上述目的,本申请第一方面提供一种图像种类识别的方法,所述方法包括:
[0007]将待识别图像输入至图像种类识别网络,所述待识别图像包括印章图像;
[0008]获取所述图像种类识别网络的第一卷积神经网络对所述待识别图像提取的第一特征向量;
[0009]获取所述待识别图像的分类标签图像块;
[0010]获取所述图像种类识别网络的第二卷积神经网络根据所述待识别图像的分类标签图像块对所述待识别图像提取的第二特征向量,所述第二特征向量为待识别的印章图像的包含字符的局部特征;
[0011]获取对所述第一特征向量和第二特征向量进行融合处理后得到的第三特征向量;
[0012]根据所述第三特征向量对所述待识别图像进行识别;
[0013]输出所述待识别图像的种类。
[0014]在本申请的实施例中,所述获取所述待识别图像的分类标签图像块的步骤包括:
[0015]对所述待识别图像按照预设窗口大小进行扫描,以获得所述待识别图像预设窗口大小的像素块;
[0016]判断所述像素块是否含有字符;
[0017]若所述像素块含有字符,则确定所述像素块的标签为1;若所述像素块不含字符,
则确定所述像素块的标签为0;
[0018]获取带有标签值的待识别图像的分类标签图像块。
[0019]在本申请的实施例中,所述获取所述图像种类识别网络的第二卷积神经网络根据所述待识别图像的标签对所述待识别图像提取的第二特征向量的步骤包括:
[0020]在所述像素块的标签为0时,所述图像种类识别网络的第二卷积神经网络不对所述待识别图像进行特征提取;
[0021]在所述像素块的标签为1时,获取所述图像种类识别网络的第二卷积神经网络对所述待识别图像提取的包含字符的局部特征。
[0022]在本申请的实施例中,所述判断所述像素块是否含有字符包括:
[0023]获取含有字符的图像的正例像素块和非字符图像的负例像素块;
[0024]将正例像素块和负例像素块输入至分类卷积神经网络,通过分类卷积神经网络输出字符图像特征。
[0025]在本申请的实施例中,所述判断所述像素块是否含有字符的步骤,还包括:
[0026]将带有标签值的分类标签图像块输入学习网络;
[0027]通过wx+b1对所述带有标签值的分类标签图像块在所述学习网络中进行自适应学习以判断所述分类标签图像块中字符的位置及重要指数;
[0028]其中w为分类标签图像块的标签值,x为分类图像块的像素,b1为自适应学习参数。
[0029]在本申请的实施例中,所述对所述待识别图像按照预设窗口大小进行扫描,以获得所述待识别图像预设窗口大小的像素块的步骤之前,还包括:
[0030]将所述待识别图像的大小固定为预设大小。
[0031]在本申请的实施例中,所述获取对所述第一特征向量和第二特征向量进行融合处理后得到的第三特征向量的步骤包括:
[0032]将所述第一特征向量和所述第二特征向量进行拼接;
[0033]对拼接后的第一特征向量的全局特征和第二特征向量的包含字符的局部特征进行融合处理;
[0034]获取融合处理后的第三特征向量。
[0035]在本申请的实施例中,所述对拼接后的第一特征向量的全局特征和第二特征向量的包含字符的局部特征进行融合处理的步骤包括:
[0036]获取对所述第一特征向量和多数第二特征向量进行拼接后的特征向量;
[0037]对拼接后的特征向量y按照ay+b2进行融合处理;
[0038]得到融合后的第三特征向量。
[0039]在本申请的实施例中,所述预设窗口大小为所述待识别图像中一个字符的大小。
[0040]本申请第二方面提供一种处理器,被配置成执行上述的图像种类识别的方法。
[0041]本申请第三方面提供一种计算机可读存储介质,被配置成执行如上所述的图像种类识别的方法。
[0042]本专利技术在现有识别算法的基础之上还需要提取印章局部的文字图像特征,并融合现有算法提取的形状特征、颜色特征、空间几何特征,比如可以识别法院印章的种类、发票印制的种类、护照出入境印章的种类,包括出境还是入境、特定国家的种类、鉴别印章的真假等,以有利于提升印章识别算法的鲁棒性和泛化性能。
[0043]本申请实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0044]附图是用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本申请实施例,但并不构成对本申请实施例的限制。在附图中:
[0045]图1示意性示出了根据本申请实施例的图像种类识别的方法的流程示意图;
[0046]图2示意性示出了根据本申请实施例的待识别图像的像素块示例图;
[0047]图3示意性示出了根据本申请实施例的计算机设备的内部结构图。
具体实施方式
[0048]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解的是,此处所描述的具体实施方式仅用于说明和解释本申请实施例,并不用于限制本申请实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0049]具体的,现有卷积网络架构,从卷积的特性上看,卷积的采样格子固定,比如都是3x3的,而且卷积的参数共享,也就是对局部文字图像和非局部文字图像,滤波器的参数是相同的,那么提取的特征就相同,因此并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像种类识别的方法,其特征在于,所述方法包括:将待识别图像输入至图像种类识别网络,所述待识别图像包括印章图像;获取所述图像种类识别网络的第一卷积神经网络对所述待识别图像提取的第一特征向量;获取所述待识别图像的分类标签图像块;获取所述图像种类识别网络的第二卷积神经网络根据所述待识别图像的分类标签图像块对所述待识别图像提取的第二特征向量,所述第二特征向量为待识别的印章图像的包含字符的局部特征;获取对所述第一特征向量和第二特征向量进行融合处理后得到的第三特征向量;根据所述第三特征向量对所述待识别图像进行识别;输出所述待识别图像的种类。2.根据权利要求1所述的所述图像种类识别的方法,其特征在于,所述获取所述待识别图像的分类标签图像块的步骤包括:对所述待识别图像按照预设窗口大小进行扫描,以获得所述待识别图像预设窗口大小的像素块;判断所述像素块是否含有字符;若所述像素块含有字符,则确定所述像素块的标签为1;若所述像素块不含字符,则确定所述像素块的标签为0;获取带有标签值的待识别图像的分类标签图像块。3.根据权利要求2所述的所述图像种类识别的方法,其特征在于,所述获取所述图像种类识别网络的第二卷积神经网络根据所述待识别图像的分类标签图像块对所述待识别图像提取的第二特征向量的步骤包括:在所述像素块的标签为0时,所述图像种类识别网络的第二卷积神经网络不对所述待识别图像进行特征提取;在所述像素块的标签为1时,获取所述图像种类识别网络的第二卷积神经网络对所述待识别图像提取的包含字符的局部特征。4.根据权利要求2所述的所述图像种类识别的方法,其特征在于,所述判断所述像素块是否含有字符包括:获取含有字符的图像的正例像素块和非字符图像的负例像素块;将正...

【专利技术属性】
技术研发人员:高亚南
申请(专利权)人:深圳市雄帝科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1