图像感知模型的训练、图像识别方法、装置、设备及介质制造方法及图纸

技术编号:42539977 阅读:29 留言:0更新日期:2024-08-27 19:44
本发明专利技术实施例提供了一种图像感知模型的训练、图像识别方法、装置、设备及介质,涉及计算机技术领域。该训练方法包括:根据第一相机的内参数和外参数,确定第一相机对应的像素坐标系与世界坐标系之间的目标映射关系;根据目标映射关系,生成稀疏矩阵;将稀疏矩阵作为矩阵乘法节点替换初始感知模型的投影模块,获得待训练模型;基于训练数据对待训练模型进行训练,获得图像感知模型,拍摄训练数据集中的图像的第二相机的内参数、外参数均与第一相机的内参数、外参数相同。该方法去除了传统鸟瞰视图感知模型中的非矩阵运算操作,降低了算力需求和数据存储需求,降低了模型在NPU上的部署难度,提升了模型的训练速度和推理速度。

【技术实现步骤摘要】

本专利技术涉及计算机,特别是涉及一种图像感知模型的训练、图像识别方法、装置、设备及介质


技术介绍

1、随着自动驾驶领域的发展和计算能力的增强,基于深度学习的新型感知算法模型得以大量涌现。这些模型能够自动进行对于环境特征进行深层次的表示和抽取,具备更强的表达能力和适应性,能够从原始传感器数据中提取高级语义信息,解决传统模型在复杂场景和动态环境下的准确性和鲁棒性有限的问题,使得高阶智能驾驶成为可能。其中,鸟瞰视图(bird's-eye view,bev,也称为俯视图,是指从上方视角观察场景的图像)感知算法模型由于其良好的可扩展性和融合友好特性,已经得到广泛的采纳。即使如此,大部分基于神经网络的鸟瞰视图感知算法模型在设计之初并未考虑在小算力神经网络处理器(neuralnetwork processing unit,npu)上部署可能带来的问题。小算力神经网络处理器npu与加速神经网络推理常用的通用图形处理器(general-purpose computing on graphicsprocessing units,gpgpu)不同,其是专门为推理神经网络而设计本文档来自技高网...

【技术保护点】

1.一种图像感知模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据第一相机的内参数和外参数,确定所述第一相机对应的像素坐标系与世界坐标系之间的目标映射关系,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标映射关系,生成稀疏矩阵,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述多个第二观测点获得第二观测点集合,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述第一观测点集合和所述第二...

【技术特征摘要】

1.一种图像感知模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据第一相机的内参数和外参数,确定所述第一相机对应的像素坐标系与世界坐标系之间的目标映射关系,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述目标映射关系,生成稀疏矩阵,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述多个第二观测点获得第二观测点集合,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述第一观测点集合和所述...

【专利技术属性】
技术研发人员:程栩悠
申请(专利权)人:亿咖通湖北技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1