基于物体检测和特征搜索的精确目标识别的方法及系统技术方案

技术编号:21004533 阅读:59 留言:0更新日期:2019-04-30 21:38
本发明专利技术提供了一种基于物体检测和特征搜索的精确目标识别的方法及系统,其中,该方法包括:获取原始输入图像,通过CNN卷积神经网络得到第一特征图组;对所述第一特征图组依次进行重采样和拼接操作,得到第二特征图组;将所述第二特征图组映射到所述原始输入图像中,对所述原始输入图像进行预测框的位置检测,得到所述原始输入图像的预测框;判断所述预测框是否为目标区域,若是,则获取所述目标区域中的类别信息;提取所述目标区域的视觉特征;将视觉特征与原始输入图像的详细类别信息相匹配。本发明专利技术实施例采用物体检测和特征搜索相结合的方法,实现目标的精确识别,可快速添加新目标,具有良好的可扩展性。

【技术实现步骤摘要】
基于物体检测和特征搜索的精确目标识别的方法及系统
本专利技术涉及目标检测识别
,具体而言,涉及一种基于物体检测和特征搜索的精确目标识别的方法及系统。
技术介绍
现有技术中,单纯使用基于深度学习的检测技术,只能识别目标的分类信息,无法精确识别目标是具体的某一个目标。若为了识别目标到具体的某一个目标,只能将目标分类分得更多更细致,但算法精度和速度会有明显下降,且目标分类需要的数据量巨大,成本高昂。对新目标的添加,只能添加分类,并需要新的数据训练新的检测识别模型,扩展周期长,可扩展性。
技术实现思路
有鉴于此,本专利技术的目的在于提供基于物体检测和特征搜索的精确目标识别的方法及系统,可实现目标的精确识别,做到快速添加新的目标,具有良好的可扩展性,。第一方面,本专利技术实施例提供了一种基于物体检测和特征搜索的精确目标识别的方法,其中,包括:获取原始输入图像,通过CNN卷积神经网络得到第一特征图组;对所述第一特征图组依次进行重采样和拼接操作,得到第二特征图组;将所述第二特征图组映射到所述原始输入图像中,对所述原始输入图像进行预测框的位置检测,得到所述原始输入图像的预测框;判断所述预测框是否为目标区域,若是,则获取所述目标区域中的类别信息;提取所述目标区域的视觉特征;将视觉特征与原始输入图像的详细类别信息相匹配。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,所述重采样包括上采样和下采样,对所述第一特征图组依次进行重采样和拼接操作,得到第二特征图组包括:对所述第一特征图组进行下采样,得到第三特征图组;对所述第三特征图组中最大尺度特征图之外的特征图进行上采样,得到第四特征图组;将所述第三特征图组和所述第四特征图组中具有相同尺度的特征图分别进行拼接,得到所述第二特征图组。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,所述将所述第二特征图组映射到所述原始输入图像中,对所述原始输入图像进行预测框位置检测,得到所述原始输入图像的预测框包括:基于所述第二特征图组的尺度在所述原始输入图像上划分网格;将所述第二特征图组中的各特征图分别映射到所述原始输入图像的网格中;在所述网格上至少生成一个预测框;基于边界框回归模型计算所述预测框的修正位置,得到所述预测框的修正值;基于所述预测框和所述预测框的修正值,得到所述原始输入图像的预测框的中心位置。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,所述判断所述预测框是否为目标区域包括:在所述预测框中生成目标概率;判断所述目标概率是否小于第一预设阈值,若是,则所述预测框不是所述目标区域;若否,则所述预测框为所述目标区域。结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,所述若是,则获取所述目标区域中的类别信息包括:生成所述目标的分类概率;所述目标概率与所述分类概率相乘,生成条件类别概率;选取所述条件类别概率最大值,将与所述条件类别概率最大值相对应的类别信息输入到数据库中。结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,所述提取所述目标检测区域的视觉特征包括:将确定目标区域后的所述原始输入图像作为查询图像输入到视觉特征提取模型中;提取所述查询图像的视觉特征。第二方面,本专利技术实施例还提供了一种基于物体检测和特征搜索的精确目标识别的系统,其中,包括:目标检测模块,获取原始输入图像,通过CNN卷积神经网络得到第一特征图组;对所述第一特征图组依次进行重采样和拼接操作,得到第二特征图组;将所述第二特征图组映射到所述原始输入图像中,对所述原始输入图像进行预测框的位置检测,得到所述原始输入图像的预测框;判断所述预测框是否为目标区域,若是,则获取所述目标区域中的类别信息;目标特征提取模块,用于提取所述目标区域的视觉特征;目标特征搜索模块,用于将视觉特征与原始输入图像的详细类别信息相匹配。结合第二方面,本专利技术实施例提供了第二方面的第一种可能的实施方式,其中,所述重采样包括上采样和下采样,所述目标检测模块具体用于:对所述第一特征图组进行下采样,得到第三特征图组;对所述第三特征图组中最大尺度特征图之外的特征图进行上采样,得到第四特征图组;将所述第三特征图组和所述第四特征图中具有相同尺度的特征图分别进行拼接,得到所述第二特征图组。结合第二方面,本专利技术实施例提供了第二方面的第二种可能的实施方式,其中,所述目标检测模块还具体用于:基于所述第二特征图组的尺度在所述原始输入图像上划分网格;将所述第二特征图组中的各特征图分别映射到所述原始输入图像的网格中;在所述网格上至少生成一个预测框;基于边界框回归模型计算所述预测框的修正位置,得到所述预测框的修正值;基于所述预测框和所述预测框的修正值,得到所述原始输入图像的预测框的中心位置。结合第二方面,本专利技术实施例提供了第二方面的第三种可能的实施方式,其中,所述目标特征提取模块具体用于:将确定目标区域后的所述原始输入图像作为查询图像输入到视觉特征提取模型中;提取所述查询图像的视觉特征。本专利技术实施例提供的基于物体检测和特征搜索的精确目标识别的方法及系统,采用物体检测和特征搜索相结合的方法,与现有技术中的单纯使用基于深度学习的检测技术相比,不仅可以识别目标的分类信息,还可以实现目标的精确识别,可快速添加新目标,具有良好的可扩展性。。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1示出了本专利技术实施例所提供的基于物体检测和特征搜索的精确目标识别的方法的流程图;图2示出了本专利技术实施例所提供的C.ReLU结构示意图;图3示出了本专利技术实施例所提供的fireModle+Inception结构示意图;图4示出了本专利技术实施例所提供的重采样的流程图;图5示出了本专利技术实施例所提供的预测框的位置检测的流程图;图6示出了本专利技术实施例所提供的判断预测框是否为目标区域的流程图;图7示出了本专利技术实施例所提供的获取目标区域中的类别信息的流程图;图8示出了本专利技术实施例所提供的提取目标区域的视觉特征的流程图;图9示出了本专利技术实施例所提供的基于物体检测和特征搜索的系统的结构示意图。主要元件符号说明:1-目标检测模块;2-目标特征提取模块;3-目标特征搜索模块。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。考虑到现有技术中单纯使用基于深度学习的检测技术本文档来自技高网...

【技术保护点】
1.一种基于物体检测和特征搜索的精确目标识别的方法,其特征在于,包括:获取原始输入图像,通过CNN卷积神经网络得到第一特征图组;对所述第一特征图组依次进行重采样和拼接操作,得到第二特征图组;将所述第二特征图组映射到所述原始输入图像中,对所述原始输入图像进行预测框的位置检测,得到所述原始输入图像的预测框;判断所述预测框是否为目标区域,若是,则获取所述目标区域中的类别信息;提取所述目标区域的视觉特征;将视觉特征与原始输入图像的详细类别信息相匹配。

【技术特征摘要】
1.一种基于物体检测和特征搜索的精确目标识别的方法,其特征在于,包括:获取原始输入图像,通过CNN卷积神经网络得到第一特征图组;对所述第一特征图组依次进行重采样和拼接操作,得到第二特征图组;将所述第二特征图组映射到所述原始输入图像中,对所述原始输入图像进行预测框的位置检测,得到所述原始输入图像的预测框;判断所述预测框是否为目标区域,若是,则获取所述目标区域中的类别信息;提取所述目标区域的视觉特征;将视觉特征与原始输入图像的详细类别信息相匹配。2.根据权利要求1所述的方法,其特征在于,所述重采样包括上采样和下采样,对所述第一特征图组依次进行重采样和拼接操作,得到第二特征图组包括:对所述第一特征图组进行下采样,得到第三特征图组;对所述第三特征图组中最大尺度特征图之外的特征图进行上采样,得到第四特征图组;将所述第三特征图组和所述第四特征图组中具有相同尺度的特征图分别进行拼接,得到所述第二特征图组。3.根据权利要求1所述的方法,其特征在于,所述将所述第二特征图组映射到所述原始输入图像中,对所述原始输入图像进行预测框位置检测,得到所述原始输入图像的预测框包括:基于所述第二特征图组的尺度在所述原始输入图像上划分网格;将所述第二特征图组中的各特征图分别映射到所述原始输入图像的网格中;在所述网格上至少生成一个预测框;基于边界框回归模型计算所述预测框的修正位置,得到所述预测框的修正值;基于所述预测框和所述预测框的修正值,得到所述原始输入图像的预测框的中心位置。4.根据权利要求1所述的方法,其特征在于,所述判断所述预测框是否为目标区域包括:在所述预测框中生成目标概率;判断所述目标概率是否小于第一预设阈值,若是,则所述预测框不是所述目标区域;若否,则所述预测框为所述目标区域。5.根据权利要求1所述的方法,其特征在于,所述若是,则获取所述目标区域中的类别信息包括:生成所述目标的分类概率;所述目标概率与所述分类概率相乘,生成条件类别...

【专利技术属性】
技术研发人员:柯恒忠董志忠
申请(专利权)人:环球智达科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1