当前位置: 首页 > 专利查询>贵州大学专利>正文

一种基于神经局域连接的线性分类方法技术

技术编号:37318116 阅读:15 留言:0更新日期:2023-04-21 22:59
本发明专利技术公开了一种基于神经局域连接的线性分类方法,包括:从数据集中获取原始图像数据,经过去除全连接层和预测层的神经网络模型处理,得到特征向量X;对X进行分区,以区间长α按步长β向右移动,每滑动一次就进行一次矩阵乘法运算,直到最后一个区间;若n

【技术实现步骤摘要】
一种基于神经局域连接的线性分类方法


[0001]本专利技术涉及深度学习卷积神经网络域,具体来说是一种基于神经局域连接的线性分类方法。

技术介绍

[0002]近年来,深度学习技术迅速崛起,其中包括计算机视觉和自然语言处理等领域。深度学习(Deep Learning)通过模仿大脑的神经元结构、功能与机制,来进行对人脑智能的模拟,并以此来处理、学习与解释数据,例如图像、声音、文本及图结构等。随着深度学习技术的不断发展,各种改良的卷积神经网络(Convolutional Neural Network)和循环神经网络(Recurrent Neural Network)层出不穷以及大规模的训练模型(如Transformer、BERT、GPT等)。这些深度学习模型及其各种变体,能够通过大量数据进行学习,已经在图像分类,语音识别、视频分析等领域中取得了不错的效果。
[0003]深度卷积神经网络是深度学习发展过程中的一个里程碑,也是近年来深度学习研究和应用领域中最活跃的一个分支。卷积神经网络的应用十分广泛,其结构为输入层、卷积层,激活层、池化层(Pooling)、全连接层以及输出层。而全连接层通过将卷积神经网络中所提取的特征进行组合,将该层的每一个神经元都与上一层的所有神经元相连,使得卷积输出的二维特征图转化为一维的向量,从而得到数据的高级特征。其核心思想是使卷积层和池化层等神经网络层学习到“分布式特征表示”并映射到样本标记空间,在整个卷积神经网络中起到“分类器”的作用。简单来说,全连接层就是将前面的神经网络层所提取出来的局部特征重新通过权值矩阵组合起来并进行特征融合,形成一个完整的图,从而达到分类的效果。随着全连接层的应用越加广泛,研究人员的研究也越加深入。
[0004]在农业领域,随着智慧农业的发展,能够准确地识别植物病害、减轻农业从业人员工作量的设备非常重要,这就要求能很好地降低设备对于算力的要求,优化网络层,其中全连接层参数量的降低十分关键。全连接层存在的问题为参数冗杂,计算量大,大量的参数容易出现学习能力太好而导致过拟合,为降低计算负担,一般只适用于对特征相对较少的图像进行处理,不适用于特征相对较多的图像。然而,在图像处理领域,很多图像往往具有极高维度。如何对特征相对较多的大尺度图像进行有效地训练并降低网络的参数量,是本领域的一大重要课题。目前为了降低全连接层参数,采取的主要措施是尽量避免使用全连接层,主流的方法是用全局平均池化层代替全连接层,即对最后一层卷积的输出结果直接求平均值。但此方法在使得模型参数量骤减的同时,学习压力全部前导到卷积层,可能会造成收敛速度减慢。此前,东南大学CN108229404A公开了一种基于深度学习的雷达回波信号目标识别方法,该方法直接对雷达回波信号进行识别,避免了SAR图像的复杂二维匹配滤波处理以及成像过程中的信息损失,在此方法中利用了卷积神经网络,避免了对回波信号的复杂预处理和特征提取过程,极大的简化了识别处理过程。但是此方法在使用卷积神经网络的同时,并未对全连接层的计算方式进行改变,在计算时可能会导致模型的参数量过大,从而造成过拟合,本方法通过将全连接层的全局计算转为局部计算,有效地降低了参数量。

技术实现思路

[0005]本专利技术的目的在于克服上述缺点而提出一种在学习相对较多特征时的图像时,能够降低参数量的基于神经局域连接的线性分类方法。
[0006]为实现上述目标,本专利技术技术方案如下:
[0007]本专利技术提出的一种基于神经局域连接的线性分类方法,包括以下步骤:
[0008](1)从图像数据集中获取原始图像数据,选取现有的卷积神经网络模型,将模型的全连接层以及预测层去除后,得到所需要的网络模型,将原始图像数据输入该模型,经过卷积层、激活层和池化层等网络层对图像特征进行提取,从而得到特征向量X;
[0009](2)获取基于神经网络所得到的特征向量X,将其展平为一维向量X∈R1×
n
,X={x1,x2,x3,

,x
n
};设置区间长为α,第一个区间为[1,α],此区间为第一份数据,记为α1∈R1×
α
;设置步长β,将第一个区间按步长β向右滑动,得到第二个区间为[1+β,α+β],此区间的数据为第二份数据,记为α2∈R1×
α
;再继续向右按步长β滑动,依此类推,直到最后一个区间。若n

α能被β整除,设最后一个区间为第t份数据,记为α
t
∈R1×
α
;若n

α不能β整除,则向下取整或向上取整,若选择向下取整,设所得最后一个区间为第t份数据,记为α
t
∈R1×
α
;若选择向上取整,所得最后一个区间为第t+1份数据,记为α
t+1
∈R1×
α
,不足区间长度的部分用0填充;
[0010](3)对第一份数据α1进行矩阵乘法运算,得到单个输出矩阵y1,y1计算公式如下:
[0011]y1=wα1+b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0012]其中,w∈R
α
×
γ
(w是所需的权重参数),经此变换后y1∈R1×
γ
;向右滑动步长β,区间变为[1+β,α+β],为第二份数据α2∈R1×
α
,进行线性变换得到单个输出矩阵y2,y2计算公式如下:
[0013]y2=wα2+b
ꢀꢀ
(2)
[0014]其中,w∈R
α
×
γ
,y2∈R1×
γ

[0015]依此类推,直到滑到最后一个区间,当n

α能被β整除时,最后一个区间为第t份数据α
t
∈R1×
α
,进行线性变换得到单个输出矩阵y
t
,y
t
计算公式如下:
[0016]y
t
=wα
t
+b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0017]其中,w∈R
α
×
γ
,y
t
∈R1×
γ

[0018]当n

α不能被β整除时,若向下取整,则最后一个区间为第t份数据α
t
∈R1×
α
,进行线性变换得到单个输出矩阵y
t
,y
t
计算公式如下:
[0019]y
t
=wα
t
+b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0020]其中,w∈R
α
×
γ
,y
t
∈R1×
γ

[0021]若向上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于神经局域连接的线性分类方法,包括以下步骤:(1)从图像数据集中获取原始图像数据,选取现有的卷积神经网络模型,将模型的全连接层以及预测层去除后,得到所需要的网络模型,将原始图像数据输入该模型,经过卷积层、激活层和池化层等网络层对图像特征进行提取,从而得到特征向量X;(2)获取基于神经网络所得到的特征向量X,将其展平为一维向量X∈R1×
n
,X={x1,x2,x3,

,x
n
};设置区间长为α,第一个区间为[1,α],此区间为第一份数据,记为α1∈R1×
α
;设置步长β,将第一个区间按步长β向右滑动,得到第二个区间为[1+β,α+β],此区间的数据为第二份数据,记为α2∈R1×
α
;再继续向右按步长β滑动,依此类推,直到最后一个区间。若n

α能被β整除,设最后一个区间为第t份数据,记为α
t
∈R1×
α
;若n

α不能β整除,则向下取整或向上取整,若选择向下取整,设所得最后一个区间为第t份数据,记为α
t
∈R1×
α
;若选择向上取整,所得最后一个区间为第t+1份数据,记为α
t+1
∈R1×
α
,不足区间长度的部分用0填充;(3)对第一份数据α1进行矩阵乘法运算,得到单个输出矩阵y1,y1计算公式如下:y1=wα1+b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,w∈R
α
×
γ
(w是所需的权重参数),经此变换后y1∈R1×
γ
;向右滑动步长β,区间变为[1+β,α+β],为第二份数据α2∈R1×
α
,进行线性变换得到单个输出矩阵y2,y2计算公式如下:y2=wα2+b
ꢀꢀꢀ
(2)其中,w∈R
α
×
γ
,y2∈R1×
γ
。依此类推,直到滑到最后一个区间,当n

α能被β整除时,最后一个区间为第t份数据α
t
∈R1×
α
,进行线性变换得到单个输出矩阵...

【专利技术属性】
技术研发人员:王崎李娜吴晨阳吴兴财吴雪
申请(专利权)人:贵州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1