一种基于深度卷积神经网络的猪体识别方法技术

技术编号:20797760 阅读:24 留言:0更新日期:2019-04-06 11:22
本发明专利技术公开了一种基于深度卷积神经网络的猪体识别方法,涉及计算机视觉领域。所提供的方法以包含猪体的图像为输入,以两个深度卷积神经网络提取特征,每个卷积神经网络输出的特征融合了各自的较低层次的特征和较高层次的特征,最后融合两个网络提取的特征输入到作为分类器的全连接层和Softmax层。本发明专利技术提供的基于深度卷积神经网络的猪体识别方法,以监控视频采集的图像为输入,以计算机视觉和机器学习技术为基础实现猪个体的身份识别,无需放置电子耳标,有利于节约养殖成本,也避免了耳标容易丢失的问题。

A pig recognition method based on deep convolution neural network

The invention discloses a pig body recognition method based on deep convolution neural network, which relates to the field of computer vision. The proposed method takes the image of pig body as input and extracts features from two deep convolution neural networks. The features of each convolution neural network output feature their respective lower level features and higher level features. Finally, the features extracted from the two networks are input into the full connection layer and the Softmax layer as classifier. The pig body recognition method based on the deep convolution neural network provided by the present invention is based on computer vision and machine learning technology, which is used to monitor the video captured images as input, and does not need to place electronic ear tags, which is conducive to saving the cost of breeding and avoiding the problem of easy loss of ear tags.

【技术实现步骤摘要】
一种基于深度卷积神经网络的猪体识别方法
本专利技术涉及计算机视觉领域,特别涉及一种基于深度卷积神经网络的猪体识别方法。
技术介绍
猪体识别是智慧畜牧业中一个非常重要的研究方向。同一养殖场中的猪与猪之间的差异比较细微,因此猪体识别可以看作是细粒度图像识别问题,要求猪体识别系统所采用的特征具有较强的表达能力,所采用的分类器具有较好的判别能力。传统的基于手工特征的算法其特征表述能力有限且依赖大量人工标注信息,很难达到很好的效果。本专利技术提供一种基于深度卷积神经网络的猪体识别方法,以监控视频采集的图像为输入,以计算机视觉和机器学习技术为基础实现猪个体的身份识别,无需放置电子耳标,有利于节约养殖成本,也避免了耳标容易丢失的问题。
技术实现思路
本专利技术的目的在于解决现有技术中存在的问题,并提供一种基于深度卷积神经网络的猪体识别方法,所提供的方法以包含猪体的图像为输入,以两个深度卷积神经网络提取特征,每个卷积神经网络输出的特征融合了各自的较低层次的特征和较高层次的特征,最后融合两个网络提取的特征输入到作为分类器的全连接层和Softmax层。本专利技术具体采用的技术方案如下:一种基于深度卷积神经网络的猪体识别方法,该方法包括以下步骤:1)获取用于训练图像识别模型的猪体图像数据集并进行标注;2)建立用于猪体识别的图像识别模型,该模型为一个四元组B=(fA,fB,P,C),其中fA和fB为两个特征提取函数,分别对应一个深度卷积神经网络;P为池化函数;C为分类函数,包括一个全连接层和一个Softmax层;在该四元组模型中,特征提取函数fA或fB所对应的深度卷积神经网络,首先进行层间特征融合,再将融合后的特征采用池化函数P组合后形成新特征,依次连接由所有特征转化而成的向量,最后将该向量作为分类函数C的输入;其具体过程如21)~24):21)设LZ为深度卷积神经网络的最后一个卷积层,LX为位于LZ之前的卷积层,它们的通道数分别为D1和D2,mLz和mLx分别为LX和LZ对应的卷积层输出的特征,取特征mLz的所有通道在位置l的值形成一个1×D1的向量mLz(l),取mLx的所有通道在位置l的值形成一个1×D2的向量mLx(l),按下式计算LZ和LX两个卷积层融合后在位置l处的融合特征:G(l,mLz,mLx)=mLz(l)TmLx(l);其中l代表特征图的一个位置,上标T代表转置,该融合特征为一个大小D1×D2的矩阵;22)采用Sum-pooling作为池化函数P,对所有位置形成的融合特征按以下公式汇聚成一个特征φ:其中Λ代表所有位置的集合;23)将汇聚后的特征φ按逐行连接的方式转换成向量,设融合特征对应的矩阵大小为D1×D2,则转换得到的向量的第mD2到第(m+1)D2个元素来自所述矩阵的第m行,其中0≤m<D1;24)对fA或fB所对应的深度卷积神经网络的最后一个卷积层输出特征与若干个位于其之前的卷积层输出特征,均执行步骤21~23),转换得到多个向量,然后依次连接两个深度卷积神经网络中所有由特征转化而成的向量,作为分类函数C的输入,由Softmax层以概率的形式输出所属的类别判断;3)分两阶段训练所述的图像识别模型,在第一阶段,固定与所述fA或fB对应的卷积神经网络各层的权值参数,仅训练全连接层和Softmax层;第二阶段,全连接层和Softmax层采用第一阶段训练所得的模型作为预加载模型,批量加载经标注的猪体图像数据,以迭代优化的方式获取卷积神经网络各层的权值参数;第一阶段和第二阶段的训练都以最小化如下的损失函数E为目标:其中n为训练样本的数目,K为总的类别数,当第i个样本的真实标签为k时,yi,k=1,否则yi,k=0;pi,k为第i个样本由Softmax层预测为标签为k的概率;4)使用训练好的图像识别模型识别场景图像中的猪体,输出结果为Softmax层以概率的形式作出的所属类别的判断。上述技术方案中的各步骤,可采用如下具体方式实现。步骤1)中所述的fA和fB分别对应的两个深度卷积神经网络采用相同的网络结构,包括:1个输入层、13个卷积层和4个池化层,4个池化层分别接在第2、4、7、10个卷积层之后,均为最大值池化操作,滤波器大小均为2×2,13个卷积层的卷积核均为3×3,卷积层的通道个数依次为64、64、128、128、256、256、256、512、512、512、512、512、512。步骤3)中所述的第一阶段训练时,加载由标准数据库ImageNet训练所得的预训练模型,然后批量加载经标注的猪体图像数据。进一步的,第一阶段训练采用Momentum优化方法。步骤3)中所述的第二阶段以梯度下降优化算法获取卷积神经网络各层的权值参数。本专利技术提供的基于深度卷积神经网络的猪体识别方法,以监控视频采集的图像为输入,以计算机视觉和机器学习技术为基础实现猪个体的身份识别,无需放置电子耳标,有利于节约养殖成本,也避免了耳标容易丢失的问题。附图说明图1为本专利技术图像识别模型示意图;图2为用于提取特征的卷积神经网络的结构示意图;图3为卷积神经网络层间特征融合示意图。具体实施方式下面结合附图和具体实施例对本专利技术做进一步阐述,以便本领域技术人员更好地理解本专利技术的实质。一种基于深度卷积神经网络的猪体识别方法,该方法包括:1)获取用于训练图像识别模型的猪体图像数据集并进行标注;2)建立用于猪体识别的图像识别模型,本专利技术实施例的图像识别模型可表示为一个四元组,B=(fA,fB,P,C),其中fA和fB为特征提取函数,分别对应图1的卷积神经网络CNN-A和CNN-B,P为池化函数,C为分类函数。图像识别模型B=(fA,fB,P,C)中的特征提取函数fA和fB分别对应一个深度卷积神经网络。可选地,本专利技术实施例采用对称结构,两个网络的结构相同,参照图2,本专利技术实施例的卷积神经网络包括1个输入层、13个卷积层和4个池化层,具体地,4个池化层分别接在第2、4、7、10个卷积层之后,均为最大值池化操作,滤波器大小均为2×2,13个卷积层的卷积核均为3×3,卷积层的通道个数依次为64、64、128、128、256、256、256、512、512、512、512、512、512。在该四元组模型中特征提取函数fA或fB所对应的深度卷积神经网络,首先需要进行层间特征融合,再将融合后的特征采用池化函数P组合后形成新特征,依次连接由所有特征转化而成的向量,最后将该向量作为分类函数C的输入。下面对这个过程进行详细描述,其具体过程如21)~24):21)本专利技术的图像识别模型所采用的卷积神经网络,在层间引入特征融合,将融合后的特征组合成新的特征。本专利技术实施例的特征融合是将包含较多位置信息的前层特征与包含更多语义信息的最后一层特征做融合,具体地,参照图2,设LZ为深度卷积神经网络的最后一个卷积层,LX为LZ之前的一个卷积层,它们的通道数分别为D1和D2,mLz和mLx分别为LX和LZ对应的卷积层输出的特征,取特征mLz的所有通道在某个位置l的值将形成一个1×D1的向量mLz(l),取mLx的所有通道在某个位置l的值将形成一个1×D2的向量mLx(l),按下式计算LZ和LX融合后的特征:G(l,mLz,mLx)=mLz(l)TmLx(l)(1)其中l代表特征图的一个位置,上标T代本文档来自技高网...

【技术保护点】
1.一种基于深度卷积神经网络的猪体识别方法,其特征在于,该方法包括以下步骤:1)获取用于训练图像识别模型的猪体图像数据集并进行标注;2)建立用于猪体识别的图像识别模型,该模型为一个四元组B=(fA,fB,P,C),其中fA和fB为两个特征提取函数,分别对应一个深度卷积神经网络;P为池化函数;C为分类函数,包括一个全连接层和一个Softmax层;在该四元组模型中,特征提取函数fA或fB所对应的深度卷积神经网络,首先进行层间特征融合,再将融合后的特征采用池化函数P组合后形成新特征,依次连接由所有特征转化而成的向量,最后将该向量作为分类函数C的输入;其具体过程如21)~24):21)设LZ为深度卷积神经网络的最后一个卷积层,LX为位于LZ之前的卷积层,它们的通道数分别为D1和D2,mLz和mLx分别为LX和LZ对应的卷积层输出的特征,取特征mLz的所有通道在位置l的值形成一个1×D1的向量mLz(l),取mLx的所有通道在位置l的值形成一个1×D2的向量mLx(l),按下式计算LZ和LX两个卷积层融合后在位置l处的融合特征:G(l,mLz,mLx)=mLz(l)TmLx(l);其中l代表特征图的一个位置,上标T代表转置,该融合特征为一个大小为D1×D2的矩阵;22)采用Sum‑pooling作为池化函数P,对所有位置形成的融合特征按以下公式汇聚成一个特征φ:...

【技术特征摘要】
1.一种基于深度卷积神经网络的猪体识别方法,其特征在于,该方法包括以下步骤:1)获取用于训练图像识别模型的猪体图像数据集并进行标注;2)建立用于猪体识别的图像识别模型,该模型为一个四元组B=(fA,fB,P,C),其中fA和fB为两个特征提取函数,分别对应一个深度卷积神经网络;P为池化函数;C为分类函数,包括一个全连接层和一个Softmax层;在该四元组模型中,特征提取函数fA或fB所对应的深度卷积神经网络,首先进行层间特征融合,再将融合后的特征采用池化函数P组合后形成新特征,依次连接由所有特征转化而成的向量,最后将该向量作为分类函数C的输入;其具体过程如21)~24):21)设LZ为深度卷积神经网络的最后一个卷积层,LX为位于LZ之前的卷积层,它们的通道数分别为D1和D2,mLz和mLx分别为LX和LZ对应的卷积层输出的特征,取特征mLz的所有通道在位置l的值形成一个1×D1的向量mLz(l),取mLx的所有通道在位置l的值形成一个1×D2的向量mLx(l),按下式计算LZ和LX两个卷积层融合后在位置l处的融合特征:G(l,mLz,mLx)=mLz(l)TmLx(l);其中l代表特征图的一个位置,上标T代表转置,该融合特征为一个大小为D1×D2的矩阵;22)采用Sum-pooling作为池化函数P,对所有位置形成的融合特征按以下公式汇聚成一个特征φ:其中Λ代表所有位置的集合;23)将汇聚后的特征φ按逐行连接的方式转换成向量,设融合特征对应的矩阵大小为D1×D2,则转换得到的向量的第mD2到第(m+1)D2个元素来自所述矩阵的第m行,其中0≤m<D1;24)对fA或fB所对应的深度卷积神经网络的最后一个卷积层输出特征与若干个位于其之前的卷积层输出特征,均执行步骤21~23),转换得到多个向量,然后依次连接两个深度卷积神经网络中所有由特征转化而成的向量,作为...

【专利技术属性】
技术研发人员:陈卫刚贾军伟王勋
申请(专利权)人:浙江工商大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1