【技术实现步骤摘要】
目标类别识别方法、训练方法及可读存储介质
[0001]本专利技术实施例涉及图像处理
,尤其涉及目标类别识别方法、用于目标类别识别的神经网络的训练方法、及可读存储介质和计算机程序产品。
技术介绍
[0002]在很多场景中,由于种种目的,需要对目标进行分类。而对于形态和纹理相近的不同目标类别,一般的图像分类方法难以区分。例如:在地下管道建设场景中,近些年来,我国的城市化进程发展迅猛,随着数以亿计的人口涌入城市,地下管道承担的压力进一步加剧,地下管道建设作为城市建设过程中一项非常重要的基础任务,影响着城市正常运行的稳定性,及时检修管网系统,是保证城市基础设施建设稳定性的重要保障。
[0003]目前,针对地下管道缺陷检测采用最多的是先通过机器人下井拍摄视频数据,再将获取的海量信息通过人力筛选进行缺陷类型评判,最后生成相关报告。例如,现有的方法是使用单幅图像输入实现了不同管道缺陷的分类。但是该方法具有如下不足之处:一、该方法忽略了管道缺陷的一个独有问题,即大多数关键缺陷类型分布广,但是实际占据面积比例小,如:树根、裂缝、 ...
【技术保护点】
【技术特征摘要】
1.一种目标类别识别方法,其特征在于,该方法包括:对待识别图像进行特征提取,得到第一特征向量,第一特征向量的维度为C1*H1*W1,其中,C1为预设的通道数,H1为预设的每个通道的特征长度,W1为预设的每个通道的特征宽度;对第一特征向量分别进行不同粒度下的特征降解,对不同粒度下得到的特征降解后的特征向量分别进行空间级别的注意力系数计算,得到不同粒度下每个通道的每个特征值的注意力系数;对于每一粒度下每个通道中的每个特征值,将特征值与特征值的注意力系数相乘,得到特征值对应的空间增强特征值,每一粒度下的所有通道的所有空间增强特征值构成所述粒度下的第二特征向量;分别采用不同粒度下的第二特征向量进行目标分类计算,得到不同粒度下待识别图像中含有各目标类别的概率;对于每一目标类别,对不同粒度下待识别图像中含有所述目标类别的概率进行加权计算,得到待识别图像中含有所述目标类别的最终概率。2.根据权利要求1所述的方法,其特征在于,所述分别采用不同粒度下的第二特征向量进行目标分类计算,包括:对不同粒度下的第二特征向量分别进行基于通道的全局平均池化处理,得到不同粒度下的每个通道的全局平均特征值,在不同粒度下分别采用所述粒度下的所有通道的全局平均特征值进行所述粒度下的目标分类计算,从而得到不同粒度下待识别图像中含有各目标类别的概率。3.根据权利要求1所述的方法,其特征在于,所述对第一特征向量分别进行不同粒度下的特征降解,包括:设当前粒度为m2,则将第一特征向量的每个通道中的所有特征值划分为m2个子区域,每个子区域中包含的特征值的数目为(H1/m)*(W1/m),针对所述m2个子区域中处于相同位置的每m2个特征值,取所述m2个特征值中的最大特征值,这样共取到(H1/m)*(W1/m)个最大值,(H1/m)*(W1/m)个最大值构成了通道的特征降解后的特征值,所有通道的特征降解后的特征值构成了当前粒度m2下特征降解后的特征向量,其中,m为不小于1的整数。4.根据权利要求1所述的方法,其特征在于,所述待识别图像为管道图像,所述目标类别为管道缺陷类别。5.根据权利要求4所述的方法,其特征在于,所述管道缺陷类别包括:暗接、变形、错接、残墙、穿入、腐蚀、浮渣、结垢、起伏、树根、脱节、脱落、障碍物、错口、沉积、渗漏、或/和破裂。6.一种用于目标类别识别的神经网络的训练方法,其特征在于,该方法包括:获取多帧目标类别识别场景中的图像作为训练图像;将训练图像依次输入神经网络的骨干网络进行特征提取,得到第一特征向量;对第一特征向量分别进行不同粒度下的特征降解,将不同粒度下得到的特征降解后的特征向量分别输入到所述神经网络的对应粒度的空间级别的注意力模块进行空间级别的注意力系数计算,得到不同粒度下每个通道的每个特征值的注意力系数;对于每一粒度下每个通道中的每个特征值,将所述特征值与特征值...
【专利技术属性】
技术研发人员:艾国,凌明,杨作兴,房汝明,向志宏,
申请(专利权)人:深圳比特微电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。