用于检测目标的方法和装置制造方法及图纸

技术编号：18351247 阅读：21 留言：0更新日期：2018-07-02 01:01

本申请实施例公开了用于检测目标的方法和装置。该方法的一具体实施方式包括：获取待检测图像；对待检测图像进行语义分割，得到掩膜图像；融合待检测图像和掩膜图像，得到融合图像；将融合图像输入至预先训练的目标检测模型，得到与待检测图像对应的检测结果图像，其中，检测结果图像中的每个像素点包括区域信息和N个置信度，每个像素点的区域信息用于指示待检测图像中与该像素点相对应的区域，每个像素点的N个置信度用于表征待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度，目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。该实施方式提高了目标检测的速度。

全部详细技术资料下载

【技术实现步骤摘要】
用于检测目标的方法和装置
本申请实施例涉及计算机
，具体涉及图像识别
，尤其涉及用于检测目标的方法和装置。
技术介绍
图像目标检测，即检测出图像中所包括的目标的类别和/或位置信息。现有的图像目标检测方法通常直接在待检测的原始图像中进行检测。
技术实现思路
本申请实施例提出了用于检测目标的方法和装置。第一方面，本申请实施例提供了一种用于检测目标的方法，该方法包括：获取待检测图像；对待检测图像进行语义分割，得到掩膜图像，其中，掩膜图像中的每个像素点包括N个初始置信度，每个像素点的N个初始置信度用于表征待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度，N为正整数；融合待检测图像和掩膜图像，得到融合图像；将融合图像输入至预先训练的目标检测模型，得到与待检测图像对应的检测结果图像，其中，检测结果图像中的每个像素点包括区域信息和N个置信度，每个像素点的区域信息用于指示待检测图像中与该像素点相对应的区域，每个像素点的N个置信度用于表征待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度，目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。在一些实施例中，对待检测图像进行语义分割，得到掩膜图像，包括：将待检测图像输入至预先训练的第一卷积神经网络，得到与待检测图像对应的特征图像，其中，第一卷积神经网络用于提取图像特征；对特征图像进行语义分割，得到掩膜图像。在一些实施例中，对特征图像进行语义分割，得到掩膜图像，包括：将特征图像输入至预先训练的第二卷积神经网络，得到掩膜图像，其中，第二卷积神经网络用于对图像进行语义分割...
用于检测目标的方法和装置

【技术保护点】
1.一种用于检测目标的方法，包括：获取待检测图像；对所述待检测图像进行语义分割，得到掩膜图像，其中，所述掩膜图像中的每个像素点包括N个初始置信度，每个像素点的N个初始置信度用于表征所述待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度，N为正整数；融合所述待检测图像和所述掩膜图像，得到融合图像；将所述融合图像输入至预先训练的目标检测模型，得到与所述待检测图像对应的检测结果图像，其中，所述检测结果图像中的每个像素点包括区域信息和N个置信度，每个像素点的区域信息用于指示所述待检测图像中与该像素点相对应的区域，每个像素点的N个置信度用于表征所述待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度，所述目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。

【技术特征摘要】
1.一种用于检测目标的方法，包括：获取待检测图像；对所述待检测图像进行语义分割，得到掩膜图像，其中，所述掩膜图像中的每个像素点包括N个初始置信度，每个像素点的N个初始置信度用于表征所述待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的初始置信度，N为正整数；融合所述待检测图像和所述掩膜图像，得到融合图像；将所述融合图像输入至预先训练的目标检测模型，得到与所述待检测图像对应的检测结果图像，其中，所述检测结果图像中的每个像素点包括区域信息和N个置信度，每个像素点的区域信息用于指示所述待检测图像中与该像素点相对应的区域，每个像素点的N个置信度用于表征所述待检测图像中与该像素点相对应的区域存在预设N种目标中每种目标的置信度，所述目标检测模型用于表征图像与图像对应的检测结果图像之间的对应关系。2.根据权利要求1所述的方法，其中，所述对所述待检测图像进行语义分割，得到掩膜图像，包括：将所述待检测图像输入至预先训练的第一卷积神经网络，得到与所述待检测图像对应的特征图像，其中，所述第一卷积神经网络用于提取图像特征；对所述特征图像进行语义分割，得到所述掩膜图像。3.根据权利要求2所述的方法，其中，所述对所述特征图像进行语义分割，得到所述掩膜图像，包括：将所述特征图像输入至预先训练的第二卷积神经网络，得到所述掩膜图像，其中，所述第二卷积神经网络用于对图像进行语义分割。4.根据权利要求3所述的方法，其中，所述融合所述待检测图像和所述掩膜图像，得到融合图像，包括：融合所述特征图像和所述掩膜图像，得到融合图像。5.根据权利要求4所述的方法，其中，所述融合所述特征图像和所述掩膜图像，得到融合图像，包括：将所述特征图像和所述掩膜图像对应像素点的数据的乘积作为所述融合图像中对应像素点的数据；或者将对所述特征图像中的像素点按照所述掩膜图像中的对应像素点的N个初始置信度进行阈值截断后的数据作为所述融合图像中对应像素点的数据；或者将所述特征图像中的像素点所包括的数据和所述掩膜图像中对应像素点所包括的N个初始置信度作为所述融合图像中对应像素点的数据。6.根据权利要求5所述的方法，其中，所述将所述融合图像输入至预先训练的目标检测模型，得到与所述待检测图像对应的检测结果图像，包括：将所述融合图像输入至预先训练的第三卷积神经网络，得到与所述待检测图像对应的检测结果图像，其中，所述第三卷积神经网络用于检测图像中的目标。7.根据权利要求6所述的方法，其中，所述第二卷积神经网络和所述第三卷积神经网络是通过如下训练步骤得到的：初始化所述第二卷积神经网络和所述第三卷积神经网络的网络参数；获取训练样本集，其中，每个训练样本包括样本图像、与样本图像对应的标注掩膜图像和标注检测结果图像；对于所述训练样本集中的每个训练样本，执行以下操作：将该训练样本中的样本图像输入至所述第一卷积神经网络，得到与该训练样本对应的特征图像；将与该训练样本对应的特征图像输入至所述第二卷积神经网络，得到与该训练样本对应的掩膜图像；融合与该训练样本对应的特征图像和与该训练样本对应的掩膜图像，得到与该训练样本对应的融合图像；将与该训练样本对应的融合图像输入至所述第三卷积神经网络，得到与该训练样本对应的检测结果图像；基于第一差异和第二差异调整所述第二卷积神经网络和所述第三卷积神经网络的网络参数，其中，所述第一差异是与该训练样本对应的掩膜图像和与该训练样本对应的标注掩膜图像之间的差异，所述第二差异是与该训练样本对应的检测结果图像和与该训练样本对应的标注检测结果图像之间的差异。8.一种用于检测目标的装置，包括：获取单元，配置用于获取待检测图像；语义分割单元，配置用于对所述待检测图像进行语义分割，得到掩膜图...

【专利技术属性】
技术研发人员：杜康，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人