用于检测目标的方法和装置制造方法及图纸

技术编号:18351247 阅读:21 留言:0更新日期:2018-07-02 01:01
本申请实施例公开了用于检测目标的方法和装置。该方法的一具体实施方式包括:获取待检测图像;对待检测图像进行语义分割,得到掩膜图像;融合待检测图像和掩膜图像,得到融合图像;将融合图像输入至预先训练的目标检测模型,得到与待检测图像对应的检测结果图像,其中,检测结果图像中的每个像素点包括区域信息和N个置信度,每个像素点的区域信息用于指示待检测图像中与该像素点相对应的区域,每个像素点的N个置信度用于表征待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度,目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。该实施方式提高了目标检测的速度。

【技术实现步骤摘要】
用于检测目标的方法和装置
本申请实施例涉及计算机
,具体涉及图像识别
,尤其涉及用于检测目标的方法和装置。
技术介绍
图像目标检测,即检测出图像中所包括的目标的类别和/或位置信息。现有的图像目标检测方法通常直接在待检测的原始图像中进行检测。
技术实现思路
本申请实施例提出了用于检测目标的方法和装置。第一方面,本申请实施例提供了一种用于检测目标的方法,该方法包括:获取待检测图像;对待检测图像进行语义分割,得到掩膜图像,其中,掩膜图像中的每个像素点包括N个初始置信度,每个像素点的N个初始置信度用于表征待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度,N为正整数;融合待检测图像和掩膜图像,得到融合图像;将融合图像输入至预先训练的目标检测模型,得到与待检测图像对应的检测结果图像,其中,检测结果图像中的每个像素点包括区域信息和N个置信度,每个像素点的区域信息用于指示待检测图像中与该像素点相对应的区域,每个像素点的N个置信度用于表征待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度,目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。在一些实施例中,对待检测图像进行语义分割,得到掩膜图像,包括:将待检测图像输入至预先训练的第一卷积神经网络,得到与待检测图像对应的特征图像,其中,第一卷积神经网络用于提取图像特征;对特征图像进行语义分割,得到掩膜图像。在一些实施例中,对特征图像进行语义分割,得到掩膜图像,包括:将特征图像输入至预先训练的第二卷积神经网络,得到掩膜图像,其中,第二卷积神经网络用于对图像进行语义分割。在一些实施例中,融合待检测图像和掩膜图像,得到融合图像,包括:融合特征图像和掩膜图像,得到融合图像。在一些实施例中,融合特征图像和掩膜图像,得到融合图像,包括:将特征图像和掩膜图像对应像素点的数据的乘积作为融合图像中对应像素点的数据;或者将对特征图像中的像素点按照掩膜图像中的对应像素点的N个初始置信度进行阈值截断后的数据作为融合图像中对应像素点的数据;或者将特征图像中的像素点所包括的数据和掩膜图像中对应像素点所包括的N个初始置信度作为融合图像中对应像素点的数据。在一些实施例中,将融合图像输入至预先训练的目标检测模型,得到与待检测图像对应的检测结果图像,包括:将融合图像输入至预先训练的第三卷积神经网络,得到与待检测图像对应的检测结果图像,其中,第三卷积神经网络用于检测图像中的目标。在一些实施例中,第二卷积神经网络和第三卷积神经网络是通过如下训练步骤得到的:初始化第二卷积神经网络和第三卷积神经网络的网络参数;获取训练样本集,其中,每个训练样本包括样本图像、与样本图像对应的标注掩膜图像和标注检测结果图像;对于训练样本集中的每个训练样本,执行以下操作:将该训练样本中的样本图像输入至第一卷积神经网络,得到与该训练样本对应的特征图像;将与该训练样本对应的特征图像输入至第二卷积神经网络,得到与该训练样本对应的掩膜图像;融合与该训练样本对应的特征图像和与该训练样本对应的掩膜图像,得到与该训练样本对应的融合图像;将与该训练样本对应的融合图像输入至第三卷积神经网络,得到与该训练样本对应的检测结果图像;基于第一差异和第二差异调整第二卷积神经网络和第三卷积神经网络的网络参数,其中,第一差异是与该训练样本对应的掩膜图像和与该训练样本对应的标注掩膜图像之间的差异,第二差异是与该训练样本对应的检测结果图像和与该训练样本对应的标注检测结果图像之间的差异。第二方面,本申请实施例提供了一种用于检测目标的装置,该装置包括:获取单元,配置用于获取待检测图像;语义分割单元,配置用于对待检测图像进行语义分割,得到掩膜图像,其中,掩膜图像中的每个像素点包括N个初始置信度,每个像素点的N个初始置信度用于表征待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度,N为正整数;融合单元,配置用于融合待检测图像和掩膜图像,得到融合图像;目标检测单元,配置用于将融合图像输入至预先训练的目标检测模型,得到与待检测图像对应的检测结果图像,其中,检测结果图像中的每个像素点包括区域信息和N个置信度,每个像素点的区域信息用于指示待检测图像中与该像素点相对应的区域,每个像素点的N个置信度用于表征待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度,目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。在一些实施例中,语义分割单元包括:特征图像提取模块,配置用于将待检测图像输入至预先训练的第一卷积神经网络,得到与待检测图像对应的特征图像,其中,第一卷积神经网络用于提取图像特征;语义分割模块,配置用于对特征图像进行语义分割,得到掩膜图像。在一些实施例中,语义分割模块进一步用于:将特征图像输入至预先训练的第二卷积神经网络,得到掩膜图像,其中,第二卷积神经网络用于对图像进行语义分割。在一些实施例中,融合单元进一步用于:融合特征图像和掩膜图像,得到融合图像。在一些实施例中,融合单元进一步用于:将特征图像和掩膜图像对应像素点的数据的乘积作为融合图像中对应像素点的数据;或者将对特征图像中的像素点按照掩膜图像中的对应像素点的N个初始置信度进行阈值截断后的数据作为融合图像中对应像素点的数据;或者将特征图像中的像素点所包括的数据和掩膜图像中对应像素点所包括的N个初始置信度作为融合图像中对应像素点的数据。在一些实施例中,目标检测单元进一步用于:将融合图像输入至预先训练的第三卷积神经网络,得到与待检测图像对应的检测结果图像,其中,第三卷积神经网络用于检测图像中的目标。在一些实施例中,第二卷积神经网络和第三卷积神经网络是通过如下训练步骤得到的:初始化第二卷积神经网络和第三卷积神经网络的网络参数;获取训练样本集,其中,每个训练样本包括样本图像、与样本图像对应的标注掩膜图像和标注检测结果图像;对于训练样本集中的每个训练样本,执行以下操作:将该训练样本中的样本图像输入至第一卷积神经网络,得到与该训练样本对应的特征图像;将与该训练样本对应的特征图像输入至第二卷积神经网络,得到与该训练样本对应的掩膜图像;融合与该训练样本对应的特征图像和与该训练样本对应的掩膜图像,得到与该训练样本对应的融合图像;将与该训练样本对应的融合图像输入至第三卷积神经网络,得到与该训练样本对应的检测结果图像;基于第一差异和第二差异调整第二卷积神经网络和第三卷积神经网络的网络参数,其中,第一差异是与该训练样本对应的掩膜图像和与该训练样本对应的标注掩膜图像之间的差异,第二差异是与该训练样本对应的检测结果图像和与该训练样本对应的标注检测结果图像之间的差异。第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本申请实施例提供的用于检测目标的方法和装置,通过将待检测图像与对待检测图像进行语义分割所得到的掩膜图像进行融合本文档来自技高网...
用于检测目标的方法和装置

【技术保护点】
1.一种用于检测目标的方法,包括:获取待检测图像;对所述待检测图像进行语义分割,得到掩膜图像,其中,所述掩膜图像中的每个像素点包括N个初始置信度,每个像素点的N个初始置信度用于表征所述待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度,N为正整数;融合所述待检测图像和所述掩膜图像,得到融合图像;将所述融合图像输入至预先训练的目标检测模型,得到与所述待检测图像对应的检测结果图像,其中,所述检测结果图像中的每个像素点包括区域信息和N个置信度,每个像素点的区域信息用于指示所述待检测图像中与该像素点相对应的区域,每个像素点的N个置信度用于表征所述待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度,所述目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。

【技术特征摘要】
1.一种用于检测目标的方法,包括:获取待检测图像;对所述待检测图像进行语义分割,得到掩膜图像,其中,所述掩膜图像中的每个像素点包括N个初始置信度,每个像素点的N个初始置信度用于表征所述待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度,N为正整数;融合所述待检测图像和所述掩膜图像,得到融合图像;将所述融合图像输入至预先训练的目标检测模型,得到与所述待检测图像对应的检测结果图像,其中,所述检测结果图像中的每个像素点包括区域信息和N个置信度,每个像素点的区域信息用于指示所述待检测图像中与该像素点相对应的区域,每个像素点的N个置信度用于表征所述待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度,所述目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。2.根据权利要求1所述的方法,其中,所述对所述待检测图像进行语义分割,得到掩膜图像,包括:将所述待检测图像输入至预先训练的第一卷积神经网络,得到与所述待检测图像对应的特征图像,其中,所述第一卷积神经网络用于提取图像特征;对所述特征图像进行语义分割,得到所述掩膜图像。3.根据权利要求2所述的方法,其中,所述对所述特征图像进行语义分割,得到所述掩膜图像,包括:将所述特征图像输入至预先训练的第二卷积神经网络,得到所述掩膜图像,其中,所述第二卷积神经网络用于对图像进行语义分割。4.根据权利要求3所述的方法,其中,所述融合所述待检测图像和所述掩膜图像,得到融合图像,包括:融合所述特征图像和所述掩膜图像,得到融合图像。5.根据权利要求4所述的方法,其中,所述融合所述特征图像和所述掩膜图像,得到融合图像,包括:将所述特征图像和所述掩膜图像对应像素点的数据的乘积作为所述融合图像中对应像素点的数据;或者将对所述特征图像中的像素点按照所述掩膜图像中的对应像素点的N个初始置信度进行阈值截断后的数据作为所述融合图像中对应像素点的数据;或者将所述特征图像中的像素点所包括的数据和所述掩膜图像中对应像素点所包括的N个初始置信度作为所述融合图像中对应像素点的数据。6.根据权利要求5所述的方法,其中,所述将所述融合图像输入至预先训练的目标检测模型,得到与所述待检测图像对应的检测结果图像,包括:将所述融合图像输入至预先训练的第三卷积神经网络,得到与所述待检测图像对应的检测结果图像,其中,所述第三卷积神经网络用于检测图像中的目标。7.根据权利要求6所述的方法,其中,所述第二卷积神经网络和所述第三卷积神经网络是通过如下训练步骤得到的:初始化所述第二卷积神经网络和所述第三卷积神经网络的网络参数;获取训练样本集,其中,每个训练样本包括样本图像、与样本图像对应的标注掩膜图像和标注检测结果图像;对于所述训练样本集中的每个训练样本,执行以下操作:将该训练样本中的样本图像输入至所述第一卷积神经网络,得到与该训练样本对应的特征图像;将与该训练样本对应的特征图像输入至所述第二卷积神经网络,得到与该训练样本对应的掩膜图像;融合与该训练样本对应的特征图像和与该训练样本对应的掩膜图像,得到与该训练样本对应的融合图像;将与该训练样本对应的融合图像输入至所述第三卷积神经网络,得到与该训练样本对应的检测结果图像;基于第一差异和第二差异调整所述第二卷积神经网络和所述第三卷积神经网络的网络参数,其中,所述第一差异是与该训练样本对应的掩膜图像和与该训练样本对应的标注掩膜图像之间的差异,所述第二差异是与该训练样本对应的检测结果图像和与该训练样本对应的标注检测结果图像之间的差异。8.一种用于检测目标的装置,包括:获取单元,配置用于获取待检测图像;语义分割单元,配置用于对所述待检测图像进行语义分割,得到掩膜图...

【专利技术属性】
技术研发人员:杜康
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1