一种基于多模板的图像识别方法技术

技术编号:15640488 阅读:168 留言:0更新日期:2017-06-16 06:14
本发明专利技术公开了一种图像识别方法,包括:接收待识别的图像;利用两个模板同时对所述图像进行卷积计算,以便得到所述图像的各区域与所述两个模板对应的类别得分;基于所述类别得分判断图像区域中是否包含所识别的物体。

【技术实现步骤摘要】
一种基于多模板的图像识别方法
本专利技术涉及图像处理领域,尤其涉及一种基于多模板的图像识别方法。
技术介绍
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,与传统的BP神经网络相比,具有识别效率高、旋转缩放不变性好等优点,已在数字图像处理及人脸识别等各个领域得到了广泛的应用。传统卷积神经网络模型的应用原理为:首先,根据待输入图像的属性设计卷积神经网络模板架构,所设计的卷积神经网络模板架构为多层结构,包括1个输入层,在输入层之后,按各种顺序排布有若干个卷积层和若干个降采样层,最后为输出层。其中,输入层用于接收原始图像;每个卷积层包括多个相同尺寸的特征图,并且,每个特征图的像素,对应于前一层指定的若干特征图相应窗口位置的像素集合;每个降采样层包括多个相同尺寸的特征图,并且,降采样层的每张特征图,对应于前一层卷积层的一张特征图,降采样层的特征图像素对应于前一层相应特征图的采样区域。某一层节点与前一层节点和后一层节点之间通过边相互连接。在搭建得到上述具有特定网络架构的卷积神经网络模板后,当需要识别某一图片时,需要对上述的卷积神经网络模板进行训练,训练过程为:初始化卷积神经网络模板的参数为随机值,包括:边的权重值以及卷积核的值等;然后,将训练样本输入卷积神经网络模板,对卷积神经网络模板反复“刺激”,不断调整边的权重值以及卷积核的值等,直到训练得到可识别该图片的卷积神经网络模板。在后续应用中,只需要将待分析图片或其他样本输入到训练好的卷积神经网络模板中,即可达到分类和智能识别的目的。为了从复杂场景中分开并识别出每个物体,需要使用大量的模板对图像进行遍历卷积计算,其计算量大,计算时间长,很难实现实时物体识别。
技术实现思路
针对现有技术中,从复杂场景中分开并识别出每个物体,需要使用大量的模板对图像进行遍历卷积计算,计算时间过长的问题,本专利技术提出了一种图像识别方法,包括:接收待识别的图像;利用两个模板同时对所述图像进行卷积计算,以便得到所述图像的各区域与所述两个模板对应的类别得分;基于所述类别得分判断图像区域中是否包含所识别的物体。进一步地,该方法还包括在利用两个模板同时对所述图像进行卷积计算之前,判断所述两个模板尺寸相同,如果所述两个模板尺寸不同,则所述方法终止。进一步地,所述两个模板为对称模板。进一步地,所述两个模板通过特定程序和大量数据集训练得到。进一步地,利用两个模板同时对所述图像进行卷积计算包括:按照特定规律,使所述两个模板逐个像素地遍历整个图像。进一步地,按照特定规律,使所述两个模板逐个像素地遍历整个图像包括:A)以所述图像的起始位置为起点,沿x轴方向和y轴方向取与模板大小等同的图像区域;B)将所述图像区域分别与所述两个模板进行卷积计算,得到所述图像区域分别与两个模板对应的类别得分;C)使起点坐标沿x轴方向加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;D)判断所取的图像区域沿x轴方向是否超出图像的范围,如果所取的图像区域沿x轴方向未超出图像的范围,则返回步骤B),并重复步骤B)至D),直到所取的图像区域沿x轴方向超出图像的范围,则前进到步骤E);E)将起点坐标的x值置为起始位置坐标值并将y值增加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;F)判断所取的图像区域沿y轴方向是否超出图像的范围,如果所取的图像区域沿y轴方向未超出图像的范围,则返回步骤B),并重复步骤B)至E),直到所取的图像区域沿y轴方向超出图像的范围。进一步地,中央处理单元从图像读取要进行卷积计算的图像区域的像素值矩阵,并且在所述中央处理单元的控制下由图像处理单元完成图像区域与两个模板的卷积计算。进一步地,图像区域与模板的卷积计算包括模板每点的值与图像区域相对应的值相乘,得到的值再求和,最终得到的和作为该图像区域的类别得分。进一步地,当某一图像区域的类别得分大于特定阈值时,则判断该图像区域中包含所识别的物体;当某一图像区域的类别得分小于或等于特定阈值时,则判断该图像区域中不包含所识别的物体。进一步地,通过统计训练图片集中所有正样本目标得分降序排序后的前95%的位置分数作为模板的所述特定阈值。根据本专利技术提供的方案,同时使用两个模板进行卷积,减少了数据的读取次数,对于整张图像的计算而言,能节省大量的数据读取时间,显著提高识别速度。附图说明为了进一步阐明本专利技术的各实施例的以上和其它优点和特征,将参考附图来呈现本专利技术的各实施例的更具体的描述。可以理解,这些附图只描绘本专利技术的典型实施例,因此将不被认为是对其范围的限制。在附图中,为了清楚明了,相同或相应的部件将用相同或类似的标记表示。图1示出待识别图像和模板的示意图。图2示出使模板遍历整张图像的流程图。图3示出根据本专利技术的一个实施例的识别人模板的示意图。图4示出根据本专利技术的实施例的使用两个模板同时对图像进行卷积遍历的流程图400。具体实施方式在以下的描述中,参考各实施例对本专利技术进行描述。然而,本领域的技术人员将认识到可在没有一个或多个特定细节的情况下或者与其它替换和/或附加方法、材料或组件一起实施各实施例。在其它情形中,未示出或未详细描述公知的结构、材料或操作以免使本专利技术的各实施例的诸方面晦涩。类似地,为了解释的目的,阐述了特定数量、材料和配置,以便提供对本专利技术的实施例的全面理解。然而,本专利技术可在没有特定细节的情况下实施。此外,应理解附图中示出的各实施例是说明性表示且不一定按比例绘制。在本说明书中,对“一个实施例”或“该实施例”的引用意味着结合该实施例描述的特定特征、结构或特性被包括在本专利技术的至少一个实施例中。在本说明书各处中出现的短语“在一个实施例中”并不一定全部指代同一实施例。首先,介绍使用模板处理图像的过程中用到的相关概念:模板指的是矩阵方块,其数学含义是一种卷积计算。卷积计算:可看作是加权求和的过程,使用到的图像区域中的每个像素分别与卷积核(即,权矩阵)的每个元素对应相乘,所有乘积之和作为区域中心像素的新值。卷积核:卷积时使用到的权用一个矩阵表示,该矩阵与使用的图像区域大小相同,其行、列都是奇数,是一个权矩阵。卷积计算示例:3*3的像素区域R与卷积核G的卷积计算:假设R为3*3的像素区域,卷积核为G:卷积和=R1G1+R2G2+R3G3+R4G4+R5G5+R6G6+R7G7+R8G8+R9G9本专利技术提出使用模板计算图像的类别得分,基于类别得分检测是否为识别的物体。下面结合图1和图2介绍计算图像的类别得分的具体过程。图1示出待识别图像和模板的示意图。如图1所示,矩形方框110为图像,由若干像素点组成,该图像具有特定宽度和高度。阴影方框120为模板。将模板120与所覆盖区域的图像进行卷积计算,即模板每点的值与所覆盖区域图像相对应的值相乘,得到的值再求和,最终得到的和作为该图像区域的类别得分。类别得分表示该区域与模板的响应强度,响应强度越大得分越高,反之得分越小。在对图像进行识别的过程中,需要使模板遍历整张图像。图2示出使模板遍历整张图像的流程图。首先,在步骤210,接收一张待处理的图像。接下来,使模板从该图像的起始位置开始进行卷积计算遍历。例如,设图像的起始位置的坐标为(0,0),以起始位置(0,0)为起本文档来自技高网
...
一种基于多模板的图像识别方法

【技术保护点】
一种图像识别方法,包括:接收待识别的图像;利用两个模板同时对所述图像进行卷积计算,以便得到所述图像的各区域与所述两个模板对应的类别得分;基于所述类别得分判断图像区域中是否包含所识别的物体。

【技术特征摘要】
1.一种图像识别方法,包括:接收待识别的图像;利用两个模板同时对所述图像进行卷积计算,以便得到所述图像的各区域与所述两个模板对应的类别得分;基于所述类别得分判断图像区域中是否包含所识别的物体。2.如权利要求1所述方法,其特征在于,所述方法还包括在利用两个模板同时对所述图像进行卷积计算之前,判断所述两个模板尺寸相同,如果所述两个模板尺寸不同,则所述方法终止。3.如权利要求1所述方法,其特征在于,所述两个模板为对称模板。4.如权利要求1所述方法,其特征在于,所述两个模板通过特定程序和大量数据集训练得到。5.如权利要求1所述方法,其特征在于,利用两个模板同时对所述图像进行卷积计算包括:按照特定规律,使所述两个模板逐个像素地遍历整个图像。6.如权利要求5所述方法,其特征在于,按照特定规律,使所述两个模板逐个像素地遍历整个图像包括:A)以所述图像的起始位置为起点,沿x轴方向和y轴方向取与模板大小等同的图像区域;B)将所述图像区域分别与所述两个模板进行卷积计算,得到所述图像区域分别与两个模板对应的类别得分;C)使起点坐标沿x轴方向加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;D)判断所取的图像区域沿x轴方向是否超出图像的范围,如果所取的图像区域沿x轴方向...

【专利技术属性】
技术研发人员:肖东晋张立群刘顺宗
申请(专利权)人:阿依瓦北京技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1