基于类人化广义感知机制的目标误识别纠正方法技术

技术编号:40578312 阅读:20 留言:0更新日期:2024-03-06 17:20
本发明专利技术公开了基于类人化广义感知机制的目标误识别纠正方法,首先,感知不同时刻交通场景的图像信息,构建图像描述模型并生成对应时刻图像描述文本,对前后时刻图像描述文本进行语义相似度求解;其次,利用三元组抽取模型抽取前后时刻图像描述文本的三元组信息,对该三元组信息进行相似度匹配并对有差异的三元组进行验证;最后,生成标准化程序问句,对该问句进行推理,并将输出结果发送至下游的规划决策任务中。本发明专利技术方法解决了现有技术在对复杂场景感知过程中对物体误识别的问题,提高了感知过程中的鲁棒性和对物体识别的准确性。

【技术实现步骤摘要】

本专利技术属于自动驾驶感知方法,涉及一种基于类人化广义感知机制的目标误识别纠正方法


技术介绍

1、在自动驾驶领域,目标识别任务随着深度学习技术的发展得到了有效完成,然而,受到算法的准确性、输入数据的质量、光照变化等因素的影响,目标误识别问题依然没有得到有效解决,其中目标误识别是指系统或算法错误地将目标对象错误地识别为其他对象,目标的错误识别会降低自动驾驶系统决策的可靠性和安全性。例如:广告牌上的动物图片被误识别成真实的动物,会导致自主车辆出现不必要的规避行为,进而影响其他交通参与者的安全通行。再如,光照所形成的阴影被误识别为车道线后导致自车产生危险的横向偏移。因此,解决目标误识别问题对于推动并保障自动驾驶系统大规模商业化落地和安全运行具有重要意义。

2、从理论角度而言,尽管可以根据不同被错识别对象设置对应的模型,从而提高识别准确率,但是从实际角度出发,一方面,面对城市道路场景中不计其数的未知物体,传统目标识别任务中所采用“一对一”式的解决方法由于耗资巨大,难以得到大规模推广;另一方面,相较于其他计算机视觉领域中的目标识别任务,自动驾驶系统中目本文档来自技高网...

【技术保护点】

1.基于类人化广义感知机制的目标误识别纠正方法,其特征在于,首先,感知不同时刻交通场景的图像信息,构建图像描述模型并生成对应时刻图像描述文本,对前后时刻图像描述文本进行语义相似度求解;其次,利用三元组抽取模型抽取前后时刻图像描述文本的三元组信息,对该三元组信息进行相似度匹配并对有差异的三元组进行验证;最后,生成标准化程序问句,对该问句进行推理,并将输出结果发送至下游的规划决策任务中。

2.根据权利要求1所述的基于类人化广义感知机制的目标误识别纠正方法,其特征在于,具体按照以下步骤实施:

3.根据权利要求1或2所述的基于类人化广义感知机制的目标误识别纠正方法,其特征...

【技术特征摘要】

1.基于类人化广义感知机制的目标误识别纠正方法,其特征在于,首先,感知不同时刻交通场景的图像信息,构建图像描述模型并生成对应时刻图像描述文本,对前后时刻图像描述文本进行语义相似度求解;其次,利用三元组抽取模型抽取前后时刻图像描述文本的三元组信息,对该三元组信息进行相似度匹配并对有差异的三元组进行验证;最后,生成标准化程序问句,对该问句进行推理,并将输出结果发送至下游的规划决策任务中。

2.根据权利要求1所述的基于类人化广义感知机制的目标误识别纠正方法,其特征在于,具体按照以下步骤实施:

3.根据权利要求1或2所述的基于类人化广义感知机制的目标误识别纠正方法,其特征在于,所述图像描述模型的构建过程为:使用卷积神经网络对场景图进行特征提取和编码,再利用长短期记忆神经网络解码方式捕获交通场景要素的文本信息;同时,使用yolo v8进行交通标志和信号灯识别,通过双目视觉和跟踪算法获取场景要素的运动状态信息;应用gps和地图软件感知场景中自车所处的gps信息,获得所需要的宏观位置和时间信息。

4.根据权利要求1或2所述的基于类人化广义感知机制的目标误识别纠正方法,其特征在于,生成图像描述文本的具体过程为:利...

【专利技术属性】
技术研发人员:周劲草宁本燏傅卫平李睿杨世强
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1