目标物的识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37851401 阅读:9 留言:0更新日期:2023-06-14 22:41
本申请涉及数据识别领域,公开了一种目标物的识别方法、装置、电子设备及存储介质,方法包括:将包含目标物的待识别图像输入目标识别模型,得到结果图像;目标识别模型包括编码器、分解器及解码器;编码器包括多层卷积层,分解器包括至少一层分解层,解码器包括多层反卷积层,每层反卷积层用于将已接收的图像、当前层级的卷积层输出的第一特征图及已连接的分解层输出的特征矩阵进行融合,得到当前层级的第二特征图,将当前层级的第二特征图传递至下一反卷积层。本申请提供的方案,通过目标识别模型实现对多层级特征的综合分析,通过特征分解和融合的方式获得更多语义特征,提高了识别精度,解决了传统识别模型识别精度低的问题。解决了传统识别模型识别精度低的问题。解决了传统识别模型识别精度低的问题。

【技术实现步骤摘要】
目标物的识别方法、装置、电子设备及存储介质


[0001]本申请涉及数据识别
,尤其涉及一种目标物的识别方法、装置、电子设备及存储介质。

技术介绍

[0002]在数据识别领域中,常涉及对图像中目标物的识别,尤其在自动驾驶场景中,目标物的识别精度将直接影响自动驾驶的安全性。
[0003]相关技术中,目标物的识别任务一般通过机器学习算法实现,比如基于CNN(Convolutional Neural Networks,卷积神经网络)以及FCN(Fully Convolutional Networks,全卷积网络)等深度学习网络搭建的传统识别模型,利用上述传统识别模型进行目标识别的过程中,由于上述深度学习网络自身结构原因,对图像中目标物的识别精度较低,对于图像中尺寸较小的目标物识别效果较差,难以满足实际应用中更高精度的数据识别需求。

技术实现思路

[0004]为解决或部分解决相关技术中存在的问题,本申请提供一种目标物的识别方法、装置、电子设备及存储介质,能够通过对目标识别模型的结构改进提升对于较小尺寸目标物的识别精度。
[0005]本申请第一方面提供一种目标物的识别方法,该方法包括:将包含目标物的待识别图像输入目标识别模型,得到所述目标识别模型输出的结果图像;其中,所述结果图像包括对所述待识别图像中目标物进行标记的识别结果;所述目标识别模型包括编码器、分解器以及解码器;所述编码器包括多层卷积层,每层所述卷积层用于提取接收到的图像在当前层级对应的语义特征,输出包含所述语义特征的第一特征图至与当前卷积层相连接的下一卷积层以及所述解码器;所述分解器包括至少一层分解层,所述解码器包括多层反卷积层,每一所述分解层分别与一卷积层和一反卷积层连接,每层所述分解层用于对接收到的第一特征图进行特征分解,得到特征矩阵,并将所述特征矩阵输出至与当前分解层相连接的反卷积层;每层所述反卷积层用于将已接收的图像、当前层级对应的卷积层输出的第一特征图以及已连接的分解层输出的特征矩阵进行融合,得到当前层级的第二特征图,并将当前层级的第二特征图传递至与当前反卷积层相连接的下一反卷积层。
[0006]根据本申请提供的目标物的识别方法,每层所述分解层具体通过如下过程对接收到的第一特征图进行特征分解:确定接收到的第一特征图对应的图像矩阵;对所述图像矩阵进行奇异值分解,得到奇异值分解结果;
依据所述奇异值分解结果,确定所述第一特征图对应的特征矩阵。
[0007]根据本申请提供的目标物的识别方法,所述对所述图像矩阵进行奇异值分解,得到奇异值分解结果,包括:确定所述图像矩阵的转置,依据所述图像矩阵以及所述图像矩阵的转置,分别确定所述图像矩阵对应的左奇异矩阵和右奇异矩阵;其中,所述左奇异矩阵包括多个左奇异向量,所述右奇异矩阵包括多个右奇异向量;依据所述图像矩阵、所述多个左奇异向量以及所述多个右奇异向量,确定所述图像矩阵对应的奇异值矩阵;将所述左奇异矩阵、所述右奇异矩阵以及所述奇异值矩阵,作为所述奇异值分解结果。
[0008]根据本申请提供的目标物的识别方法,所述依据所述奇异值分解结果,确定所述第一特征图对应的特征矩阵,包括:依据所述奇异值分解结果中的左奇异矩阵、右奇异矩阵以及奇异值矩阵中至少一个,确定所述第一特征图对应的特征矩阵。
[0009]根据本申请提供的目标物的识别方法,依据所述图像矩阵以及所述图像矩阵的转置,确定所述图像矩阵对应的左奇异矩阵,包括:将所述图像矩阵与所述图像矩阵的转置相乘,得到第一矩阵;对所述第一矩阵进行特征分解,得到多个左奇异向量;将所述多个左奇异向量进行拼接,得到所述左奇异矩阵。
[0010]根据本申请提供的目标物的识别方法,依据所述图像矩阵以及所述图像矩阵的转置,确定所述图像矩阵对应的右奇异矩阵,包括:将所述图像矩阵的转置与所述图像矩阵相乘,得到第二矩阵;对所述第二矩阵进行特征分解,得到多个右奇异向量;将所述多个右奇异向量进行拼接,得到所述右奇异矩阵。
[0011]根据本申请提供的目标物的识别方法,所述反卷积层具体通过如下过程将已接收的图像、当前层级对应的卷积层输出的第一特征图以及已连接的分解层输出的特征矩阵进行融合:确定已接收的图像的图像矩阵,得到第三矩阵;确定当前层级对应的卷积层输出的第一特征图的图像矩阵,得到第四矩阵;将所述第三矩阵、所述第四矩阵以及所述已连接的分解层输出的特征矩阵进行融合。
[0012]本申请第二方面提供一种目标物的识别装置,该装置包括:识别模块,用于将包含目标物的待识别图像输入目标识别模型,得到所述目标识别模型输出的结果图像;其中,所述结果图像包括对所述待识别图像中目标物进行标记的识别结果;所述目标识别模型包括编码器、分解器以及解码器;所述编码器包括多层卷积层,每层所述卷积层用于提取接收到的图像在当前层级对应的语义特征,输出包含所述语义特征的第一特征图至与当前卷积层相连接的下一卷积层以及所述解码器;
所述分解器包括至少一层分解层,所述解码器包括多层反卷积层,每一所述分解层分别与一卷积层和一反卷积层连接,每层所述分解层用于对接收到的第一特征图进行特征分解,得到特征矩阵,并将所述特征矩阵输出至当前分解层对应的反卷积层;每层所述反卷积层用于将已接收的图像、当前层级对应的卷积层输出的第一特征图、已连接的分解层输出的特征矩阵进行融合,得到当前层级的第二特征图,并将当前层级的第二特征图传递至与当前反卷积层相连接的下一反卷积层。
[0013]本申请第三方面提供一种电子设备,包括:处理器;以及存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
[0014]本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
[0015]本申请提供的技术方案可以包括以下有益效果:由于目标识别模型中编码器能够利用多层卷积层从多个层级提取语义特征,分解器可以从接收到的第一特征图中分解得到特征矩阵,解码器能够利用多层反卷积层将相应层级的语义特征与已连接的分解层输出的特征矩阵进行融合,这样的话,目标识别模型可以实现对待识别图像中多层级特征的综合分析,且能够通过特征分解和融合的方式获得更多的语义特征,能够充分获得待识别图像中的语义特征,进而能够更准确的识别到待识别图像中尺寸较小的目标物,提高了目标物的识别精度。
[0016]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0017]通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
[0018]图1是本申请实施例示出的目标物的识别方法的流程示意图;图2是本申请实施例示出的改进后目标识别模型的结构示意图;图3是本申请实施例中包含路牌的道路图像示意图;图4是本申请实施例中包含路牌的道路图像对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标物的识别方法,其特征在于,包括:将包含目标物的待识别图像输入目标识别模型,得到所述目标识别模型输出的结果图像;其中,所述结果图像包括对所述待识别图像中目标物进行标记的识别结果;所述目标识别模型包括编码器、分解器以及解码器;所述编码器包括多层卷积层,每层所述卷积层用于提取接收到的图像在当前层级对应的语义特征,输出包含所述语义特征的第一特征图至与当前卷积层相连接的下一卷积层以及所述解码器;所述分解器包括至少一层分解层,所述解码器包括多层反卷积层,每一所述分解层分别与一卷积层和一反卷积层连接,每层所述分解层用于对接收到的第一特征图进行特征分解,得到特征矩阵,并将所述特征矩阵输出至与当前分解层相连接的反卷积层;每层所述反卷积层用于将已接收的图像、当前层级对应的卷积层输出的第一特征图以及已连接的分解层输出的特征矩阵进行融合,得到当前层级的第二特征图,并将当前层级的第二特征图传递至与当前反卷积层相连接的下一反卷积层。2.根据权利要求1所述的目标物的识别方法,其特征在于,每层所述分解层具体通过如下过程对接收到的第一特征图进行特征分解:确定接收到的第一特征图对应的图像矩阵;对所述图像矩阵进行奇异值分解,得到奇异值分解结果;依据所述奇异值分解结果,确定所述第一特征图对应的特征矩阵。3.根据权利要求2所述的目标物的识别方法,其特征在于,所述对所述图像矩阵进行奇异值分解,得到奇异值分解结果,包括:确定所述图像矩阵的转置,依据所述图像矩阵以及所述图像矩阵的转置,分别确定所述图像矩阵对应的左奇异矩阵和右奇异矩阵;其中,所述左奇异矩阵包括多个左奇异向量,所述右奇异矩阵包括多个右奇异向量;依据所述图像矩阵、所述多个左奇异向量以及所述多个右奇异向量,确定所述图像矩阵对应的奇异值矩阵;将所述左奇异矩阵、所述右奇异矩阵以及所述奇异值矩阵,作为所述奇异值分解结果。4.根据权利要求3所述的目标物的识别方法,其特征在于,所述依据所述奇异值分解结果,确定所述第一特征图对应的特征矩阵,包括:依据所述奇异值分解结果中的左奇异矩阵、右奇异矩阵以及奇异值矩阵中至少一个,确定所述第一特征图对应的特征矩阵。5.根据权利要求3所述的目标物的识别方法,其特征在于,依据所述图像矩阵以及所述图像矩阵的转置,确定所述图像矩阵对应的左奇异矩阵,包括:将所述图像矩阵与所述图像矩阵的转置相乘,得到第一矩阵;对所...

【专利技术属性】
技术研发人员:李宁朱磊贾双成万如
申请(专利权)人:智道网联科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1