一种基于卷积神经网络的目标分类方法技术

技术编号:21185398 阅读:53 留言:0更新日期:2019-05-22 16:01
本发明专利技术提供一种基于卷积神经网络的目标分类方法,不采用卷积核直接遍历目标图像,而是采用与输出特征图像大小相同的滑窗按行再按列遍历整幅目标图像,从而提取出目标图像的对应的像素点作为子图像,再将卷积核的各特征参数分别与各子图像对应相乘得到中间图像,最后将中间图像的和值作为输出特征图像,在获取与现有卷积实现方式相同的卷积结果的前提条件下,将卷积运算拆分成单个点的乘加运算,能够最大程度的减少卷积实现过程中,微处理器读取数据时地址跳变的次数,进而大大提高硬件处理的效率。

A Target Classification Method Based on Convolutional Neural Network

The invention provides a target classification method based on convolution neural network, which does not use convolution kernel to traverse the target image directly, but uses a sliding window with the same size as the output feature image to traverse the whole target image in rows and columns, thereby extracting the corresponding pixels of the target image as sub-images, and then multiplying each feature parameter of the convolution core with each sub-image respectively. The sum value of the intermediate image is taken as the output characteristic image. On the premise of obtaining the same convolution result as the existing convolution implementation, the convolution operation is divided into the multiplication and addition operation of a single point, which can minimize the number of address jumps when the microprocessor reads the data in the convolution implementation process, thus greatly improving the efficiency of hardware processing.

【技术实现步骤摘要】
一种基于卷积神经网络的目标分类方法
本专利技术属于图像分类
,尤其涉及一种基于卷积神经网络的目标分类方法。
技术介绍
图像的分类是图像处理
中的一个重要类别,如何快速并且准确地实现图像的分类是当前图像领域很热门的研究课题。近五年来,卷积神经网络在图像特征提取、分类识别等领域取得了很好的效果。由于卷积神经网络在进行卷积计算时,需要采样卷积核去遍历输入特征图,每进行一次遍历,就会发生地址跳变,其中,地址跳变是指卷积计算的过程中,需要对顺序存储的输入特征图数据进行跳址操作,而硬件平台上实现跳址操作比软件平台上要花费更多的逻辑控制,则随着遍历次数的增加,ARM(微处理器)NEON(向量协处理单元)读取数据时,地址跳变也会成倍增长,大大降低了硬件处理的效率。
技术实现思路
为解决上述问题,本专利技术提供一种基于卷积神经网络的目标分类方法,能够最大程度的减少卷积实现过程中,微处理器读取数据时地址跳变的次数,进而大大提高硬件处理的效率。一种基于卷积神经网络的目标分类方法,包括以下步骤:S1:获取大小为M×M的目标图像;S2:采用大小为(M-N+1)×(M-N+1)的滑窗从目标图像的左上角开始逐行逐列遍历整幅目标图像,其中,每次遍历时,滑窗均从目标图像中提取滑窗内的像素点作为子图像,则子图像的个数为N×N;其中,N为卷积神经网络中所采用的卷积核的大小,且大小为N×N的卷积核包括N×N个预设特征参数;S3:将卷积核的第一个预设特征参数与第一幅子图像的各个像素点相乘,得到第一幅中间图像,以此类推,将卷积核剩余的预设特征参数逐一与剩余的子图像的各个像素点相乘,得到N×N幅中间图像,其中,中间图像的大小为(M-N+1)×(M-N+1);S4:将N×N幅中间图像对应像素点进行求和,得到特征输出图像,大小为(M-N+1)×(M-N+1);S5:对特征输出图像进行池化操作,得到大小为(M-N+1)/2×(M-N+1)/2的采样图像;S6:采用设定的全连接层对所述采样图像进行分类。进一步地,所述采用设定的全连接层对所述采样图像进行分类具体包括以下步骤:所述设定的全连接层为[(M-N+1)/2]2行X列的权值矩阵,其中,X为图像种类数,权值矩阵的每一行分别对应一个不同的预设识别特征,权值矩阵的每一列分别对应一个不同的图像种类,且每一列中的元素值表示该列对应的图像种类的预设识别特征的权重;将所述采样图像的第一个像素点与权值矩阵的第一行相乘,得到一个1行X列的缓存矩阵;以此类推,逐行逐列遍历采样图像的所有像素点,得到[(M-N+1)/2]2个1行X列的缓存矩阵;将所有缓存矩阵对应相加,得到1行X列的输出矩阵;将输出矩阵中最大值所在列对应的图像种类,作为采样图像的所属类别。有益效果:本专利技术提供一种基于卷积神经网络的目标分类方法,不采用卷积核直接遍历目标图像,而是采用与输出特征图像大小相同的滑窗按行再按列遍历整幅目标图像,从而提取出目标图像的对应的像素点作为子图像,再将卷积核的各特征参数分别与各子图像对应相乘得到中间图像,最后将中间图像的和值作为输出特征图像,在获取与现有卷积实现方式相同的卷积结果的前提条件下,将卷积运算拆分成单个点的乘加运算,能够最大程度的减少卷积实现过程中,微处理器读取数据时地址跳变的次数,进而大大提高硬件处理的效率。附图说明图1为本专利技术提供的一种基于卷积神经网络的目标分类方法的流程图;图2为本专利技术提供的现有卷积实现方法与本专利技术卷积实现方法的原理对比示意图;图3为本专利技术提供的现有全连接实现方法与本专利技术全连接实现方法的原理对比示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。实施例一参见图1,该图为本实施例提供的一种基于卷积神经网络的目标分类方法的流程图。一种基于卷积神经网络的目标分类方法,其特征在于,包括以下步骤:S1:获取大小为M×M的目标图像。S2:采用大小为(M-N+1)×(M-N+1)的滑窗从目标图像的左上角开始逐行逐列遍历整幅目标图像,其中,每次遍历时,滑窗均从目标图像中提取滑窗内的像素点作为子图像,则子图像的个数为N×N;其中,N为卷积神经网络中所采用的卷积核的大小,且大小为N×N的卷积核包括N×N个预设特征参数。S3:将卷积核的第一个预设特征参数与第一幅子图像的各个像素点相乘,得到第一幅中间图像,以此类推,将卷积核剩余的预设特征参数逐一与剩余的子图像的各个像素点相乘,得到N×N幅中间图像,其中,中间图像的大小为(M-N+1)×(M-N+1)。也就是说,第一个特征参数与第一个滑窗提取的子图像的各个像素点对应相乘,得到第一幅中间图像;第二个特征参数与第二个滑窗提取的子图像的各个像素点对应相乘,得到第二幅中间图像;以此类推,得到N×N幅中间图像。S4:将N×N幅中间图像对应像素点进行求和,得到特征输出图像,大小为(M-N+1)×(M-N+1)。S5:对特征输出图像进行池化操作,得到大小为(M-N+1)/2×(M-N+1)/2的采样图像。S6:采用设定的全连接层对所述采样图像进行分类。参见图2,该图为本实施例提供的现有卷积实现方法与本专利技术卷积实现方法的原理对比示意图。其中,图2的左半部分为现有卷积实现方法的原理示意图,右半部分为本实施例提供的卷积实现方法原理示意图。假设目标图像的大小为M×M,卷积核大小为N×N;现有技术的卷积实现方式,是直接采用N×N的卷积核遍历整幅目标图像,而特征输出图像的每一个像素点,均为卷积核的每一个特征参数分别与其每次遍历提取的目标图像的像素点一一对应相乘再求和的结果;例如,假设在M=32,N=5的情况下,特征输出图像的第一个像素点的像素值,就是通过将第一次遍历时,卷积核提取的目标图像前5行前5列交集的25个像素点,与卷积核的25个特征参数一一对应相乘,得到25个乘积,再将25个乘积进行求和而得到。然而,目标图像在于ARMNEON中是按行顺序存储在内存中的,也就是说,目标图像每一个像素点的地址是按照每一行从左往右的顺序编排,卷积核每次遍历时提取的同一行内像素点地址是连续变化的,而不同行间的像素点地址是跳变的;因此,每提取一个N×N范围大小的目标图像的像素点,就会发生N-1次地址跳变。对于一个大小为M×M的目标图像,如果使用N×N的卷积核遍历图像,则遍历一张图像地址跳变次数为(N-1)×(M-N+1)×(M-N+1)。例如,在M=32,N=5的情况下,每次遍历5×5区域的不同行之间地址跳变的次数为4次,卷积核向右滑动27次遍历目标图像的所有行,向下滑动27次遍历目标图像的所有列,则地址跳变次数为4×27×27=2916。对于本实施例提供的卷积实现方法,卷积核固定不变,而是采用与输出特征图像大小(M-N+1)×(M-N+1)相同的滑窗来遍历整幅目标图像,地址跳变的次数为(M-N+1)×N×N。同样在M=32,N=5的情况下,本实施例的滑窗大小为28×28,则滑窗内不同行之间地址跳变的次数为27次,滑窗向右滑动4次遍历目标图像的所有行,向下滑动4次遍历目标图像的所有列,则地址跳变次数为27×4×4=432。由此可见,滑窗取的越大,地址跳变次数就会越少,而滑窗大小最大与输出图像大小相等。则本实本文档来自技高网
...

【技术保护点】
1.一种基于卷积神经网络的目标分类方法,其特征在于,包括以下步骤:S1:获取大小为M×M的目标图像;S2:采用大小为(M‑N+1)×(M‑N+1)的滑窗从目标图像的左上角开始逐行逐列遍历整幅目标图像,其中,每次遍历时,滑窗均从目标图像中提取滑窗内的像素点作为子图像,则子图像的个数为N×N;其中,N为卷积神经网络中所采用的卷积核的大小,且大小为N×N的卷积核包括N×N个预设特征参数;S3:将卷积核的第一个预设特征参数与第一幅子图像的各个像素点相乘,得到第一幅中间图像,以此类推,将卷积核剩余的预设特征参数逐一与剩余的子图像的各个像素点相乘,得到N×N幅中间图像,其中,中间图像的大小为(M‑N+1)×(M‑N+1);S4:将N×N幅中间图像对应像素点进行求和,得到特征输出图像,大小为(M‑N+1)×(M‑N+1);S5:对特征输出图像进行池化操作,得到大小为(M‑N+1)/2×(M‑N+1)/2的采样图像;S6:采用设定的全连接层对所述采样图像进行分类。

【技术特征摘要】
1.一种基于卷积神经网络的目标分类方法,其特征在于,包括以下步骤:S1:获取大小为M×M的目标图像;S2:采用大小为(M-N+1)×(M-N+1)的滑窗从目标图像的左上角开始逐行逐列遍历整幅目标图像,其中,每次遍历时,滑窗均从目标图像中提取滑窗内的像素点作为子图像,则子图像的个数为N×N;其中,N为卷积神经网络中所采用的卷积核的大小,且大小为N×N的卷积核包括N×N个预设特征参数;S3:将卷积核的第一个预设特征参数与第一幅子图像的各个像素点相乘,得到第一幅中间图像,以此类推,将卷积核剩余的预设特征参数逐一与剩余的子图像的各个像素点相乘,得到N×N幅中间图像,其中,中间图像的大小为(M-N+1)×(M-N+1);S4:将N×N幅中间图像对应像素点进行求和,得到特征输出图像,大小为(M-N+1)×(M-N+1);S5:对特征输出图像进行池化操作,得...

【专利技术属性】
技术研发人员:陈禾魏鑫贾明飞刘文超陈亮
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1