基于Faster-RCNN物体空间区分方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:32502923 阅读:18 留言:0更新日期:2022-03-02 10:12
本申请涉及图像处理技术领域,具体而言,涉及基于Faster

【技术实现步骤摘要】
基于Faster

RCNN物体空间区分方法、装置、计算机设备及存储介质


[0001]本申请涉及图像处理
,具体而言,涉及基于Faster

RCNN物体空间区分方法、装置、计算机设备及存储介质。

技术介绍

[0002]物体检测(object detection):它是计算机视觉中的经典问题之一,其任务是用框去标出图像中物体的位置,并给出物体的类别和置信度。上下文感知(context awareness):它是一种在信息系统中,结合物体周边环境一起推理的能力。
[0003]目前针对于基于环境的物体检测的方法包含两种,一种方案是基于多个单纯的物体检测模型,一个模型识别物体,另一个识别场景。当被识别物体处于不符合要求的场景时,不输出结果。另一种方案是,一个模型识别物体,另一个模型对全场景进行语义分割。当被识别物体处于不符合要求的场景时,不上报结果。
[0004]利用多个检测模型的方案,只能对大小、长宽比例合适的“场景”进行检测,例如一辆卡车上运输的纸箱:模型检测出纸箱,另一模型检测出卡车,若规定卡车上的纸箱不属于被检测的类型,则不输出结果。但对于形状不规则,大小比例不适合物体检测模型识别的“场景”时,如天空、湖泊,街道等,此方法无效,会将路灯误认为井盖。
[0005]针对于这样的问题,现有技术中常使用利用语义分割的方法理论上能解决上述问题。但由于效果较好的语义分割模型,都使用了较高的分辨率,边缘端设备由于性能限制无法使用。同时,由于被识别物体的场景多样,语义分割模型无法包含所有的背景类别,模型也无法推理出待识别物体与环境的关系,最后的输出结果需要依据两个模型的结果人为地进行逻辑判断,缺乏灵活性。

技术实现思路

[0006]本申请实施例提供一种基于Faster

RCNN物体环境区分方法、装置、计算机设备及其存储介质,该方法在数据标注的时候需要除了要提供被识别物体的位置、类别信息外,还要求提供该物体周围的场景与该物体是否匹配的标签。
[0007]为了达到上述目的,本申请实施例采用的技术方案如下:第一方面,本申请实施例提供了一种基于Faster

RCNN物体环境区分方法,该方法包括:获取待识别图像;针对待识别图像,通过Faster

RCNN目标区域推荐网络获得多个感兴趣区域;获取独立感兴趣区域的参量;通过参量生成高斯热图,其中热图与特征图大小相同;高斯热图作为掩膜,通过点乘所述特征图得到环境热图;对环境热图进行池化,得到特征热图,基于特征热图得到特征向量;基于Faster

RCNN识别结果回归层生成类别向量,将类别向量与所述特征向量进行拼接,得到目标向量;对目标向量进行回归处理,得到物体

环境匹配值;基于物体

环境匹配值进行物体环境的区分。
[0008]进一步地,参量包括所述感兴趣区域的中心位置坐标及宽度和高度。
[0009]进一步地,环境热图池化处理在Faster

RCNN感兴趣区域池化层中进行。
[0010]进一步地,对环境热图进行池化处理后,得到特征热图,并对特征热图进行调整,调整为1维向量,得到特征向量。
[0011]进一步地,类别向量通过Faster

RCNN全连接层与softmax函数生成。
[0012]进一步地,类别向量拼接至特征向量的数据后部,形成目标向量。
[0013]进一步地,物体

环境匹配值的获得通过以下方式:将目标向量通过循环神经网络LSTM变形,经过Sigmoid函数得到。
[0014]进一步地,物体

环境匹配值的获得通过以下方式:将目标向量通过变压器模型Transformer变形,经过Sigmoid函数得到。
[0015]第二方面,本申请实施例还提供一种基于Faster

RCNN物体环境区分方法的装置,包括:获取模块,用于获取采集的图像;处理模块:用于处理基于获取模块获取待识别图像,得到物体

环境匹配值;展示模块,用于在图像中展示物体

环境区分框图。
[0016]第三方面,本申请实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述的基于Faster

RCNN物体环境区分方法。
[0017]第四方面,本申请实施例还提供了一种计算机可读存储介质,存储介质内存储有计算机程序,计算机程序被处理器执行时实现本申请实施例第一方面提供的基于Faster

RCNN物体环境方法。
[0018]本申请实施例提供的技术方案中,基于模型以及物体环境区分方法,通过结合上下文信息,输出识别目标的类别、位置、置信度以及场景匹配度。能有效克服被识别物体与预设场景不符的情况,增加了对于物体识别的准确度。
[0019]通过算法的构建,增加了物体识别过程中对于环境的敏感度,降低了物体识别中环境因素的干扰。
[0020]附图说明
[0021]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]附图中的方法、系统和/或程序将根据示例性实施例进一步描述。这些示例性实施例将参照图纸进行详细描述。这些示例性实施例是非限制的示例性实施例,其中示例数字在附图的各个视图中代表相似的机构。
[0023]图1是根据本申请的一些实施例所示的一种物体环境区分方法流程图;图2是根据本申请的一些实施例所示的一种物体环境区分装置的结构示意图;图3是根据本申请的一些实施例所示的现有技术中物体检测示意图;图4是根据本申请的一些实施例所示的热图示意图;图5是根据本申请的一些实施例所示的感兴趣区域示意图;图6是现有技术中的一种实施例效果附图;
图7是现有技术中的一种实施例效果附图;图8是现有技术中的一种实施例效果附图;图9是基于本实施例的一种识别效果图。
具体实施方式
[0024]为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
[0025]在下面的详细描述中,通过实例阐述了许多具体细节,以便提供对相关指导的全面了解。然而,对于本领域的技术人员来说,显然可以在没有这些细节的情况下实施本申请。在其他情况下,公知的方法、程序、系统、组成和/或电路已经在一个相对较高水平上被描述,没有细节,以避免不必要本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Faster

RCNN的物体环境区分方法,其特征在于,所述方法包括:获取待识别图像;针对所述待识别图像,通过Faster

RCNN目标区域推荐网络获得多个感兴趣区域;获取独立所述感兴趣区域的参量;通过所述参量生成高斯热图,所述热图与所述特征图大小相同;所述高斯热图作为掩膜,通过点乘所述特征图得到环境热图;对所述环境热图进行池化,得到特征热图,基于所述特征热图得到特征向量;基于Faster

RCNN识别结果回归层生成类别向量,将所述类别向量与所述特征向量进行拼接,得到目标向量;对所述目标向量进行回归处理,得到物体

环境匹配值;基于所述物体

环境匹配值进行物体环境的区分。2.根据权利要求1所述的物体环境区分方法,其特征在于,所述参量包括所述感兴趣区域的中心位置坐标及宽度和高度。3.根据权利要求1所述的物体环境区分方法,其特征在于,所述环境热图池化处理在所述Faster

RCNN感兴趣区域池化层中进行。4.根据权利要求3所述的物体环境区分方法,其特征在于,对所述环境热图进行池化处理后,得到所述特征热图,并对所述特征热图进行调整,调整为1维向量,得到特征向量。5.根据权利要求4所述的物体环境区分方法,其特征在于,所述类别向量通过Faster

RCNN全连接层与softmax函数生成。6.根据...

【专利技术属性】
技术研发人员:姜帝兆郑义李骥东
申请(专利权)人:成都合能创越软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1