【技术实现步骤摘要】
一种图像分割分类方法和装置
本专利技术是关于一种图像分割分类方法和装置,属于图像处理
技术介绍
对于一段含有待分析目标对象的视频,有些图像帧场景中存在目标对象,有些图像帧则不存在,同时有些图像帧虽然存在目标对象,但由于在目标区域存在遮挡、或者目标不清晰、或者目标区域面积过小、或者目标对象姿势不正确等原因,致使这些图像帧图像不可用。所以要实现人机交互自动摄影就必须解决分割出目标对象区域并同时给出该帧图像分类类别的问题。现有技术中常规的做法是将对图像帧中目标对象的分割与对图像帧场景状态的分类分两步进行,此种方法减小了移动电子设备端分析的速度。而且,目前存在的分割深度学习模型大多只能进行目标区域分割,而不能同时进行图像帧场景状态有效性分类识别,不能满足移动电子设备端对目标对象实时分析的需求。虽然,在自动驾驶领域中确实存在能够同时进行图像帧分割、分类或检测的方法,但该方法所用的模型占内存大,运算速度较慢,且对硬件平台有较高要求,并不能满足移动终端中的视频图像处理的需求。
技术实现思路
针 ...
【技术保护点】
1.一种图像分割分类方法,其特征在于,包括以下步骤:/nS1建立图像分割分类网络模型,同时实现图像帧的分割与分类;所述分割分类的网络模型包括上下文信息提取通路和空间信息提取通路,所述上下文信息提取通路和所述空间信息提取通路通讯连接,且所述上下文信息提取通路输出图像分类结果;所述空间信息提取通路输出图像分割结果;/nS2训练所述分割分类的网络模型,使所述网络模型达到预设标准。/n
【技术特征摘要】
1.一种图像分割分类方法,其特征在于,包括以下步骤:
S1建立图像分割分类网络模型,同时实现图像帧的分割与分类;所述分割分类的网络模型包括上下文信息提取通路和空间信息提取通路,所述上下文信息提取通路和所述空间信息提取通路通讯连接,且所述上下文信息提取通路输出图像分类结果;所述空间信息提取通路输出图像分割结果;
S2训练所述分割分类的网络模型,使所述网络模型达到预设标准。
2.如权利要求1所述的图像分割分类方法,其特征在于,所述上下文信息提取通路包括两个支路,其中一个支路输出所述图像帧的场景状态的类别;另一个支路与所述空间信息提取通路连接,将所述上下文信息提取通路输出特征值输送至所述空间信息提取通路得到包括上下文信息和空间信息的特征图,并输出所述特征图作为所述图像帧的分割结果。
3.如权利要求2所述的图像分割分类方法,其特征在于,所述上下文信息提取通路包括依次连接的Conv3*3-BN-ReLU模块,Pooling层,倒残差模块组,Conv1*1-BN-ReLU模块、全局均值池化模块和分类器,经过所述分类器输出图像帧场景状态的类别,其中,所述上下文信息提取通路中,所述倒残差模块组包括依次连接的第一倒残差模块组、第二倒残差模块组和第三倒残差模块组,其中,所述第二倒残差模块组输出的特征图A经过模块注意力精炼模块处理,进入双线性插值采样层进行双线性插值采样操作,经过所述双线性差值采样操作的特征图A记为up1;所述Conv1*1-BN-ReLU模块输出的特征图B经过模块注意力精炼处理后,与所述全局均值池化模块输出的特征图C相乘,得到特征图D,所述特征图D经过双线性插值采样操作后记为up2,将up1与up2串联,得到特征图E,并将所述特征图E输入所述空间信息提取通路。
4.如权利要求3所述的图像分割分类装置,其特征在于,所述,空间信息提取通路包括依次连接的深度可分离卷积模块、第一DenseNet模块、第一DenseNet过渡层、第二DenseNet模块和第二DenseNet过渡层,第二DenseNet过渡层输出的特征图F与特征图E一起输入特征融合模块进行处理,获得融合后的特征图G,对输出特征图G进行双线性插值操作,获得稀疏特征图H,特征图H经过一个Conv1*1层处理后,获得输入图像每个像素对应的类别,即图像分割结果。
5.如权利要求1-4任一项所述的图像分割分类方法,其特征在于,所述分割分类的网络模型包括:采集并标注训练数据,初步训练分割分类的网络模型测试,判断经过初步训练的所述分割分类网络模型处理每张图像帧的速度、分类精度和分割精度是否达到所述预...
【专利技术属性】
技术研发人员:王文君,朱婷,候建伟,王东,邢婉丽,程京,
申请(专利权)人:博奥生物集团有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。