双目立体匹配模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：40963917 阅读：6 留言：0更新日期：2024-04-18 20:43

本申请涉及图像数据处理技术领域，特别是涉及到一种双目立体匹配模型训练方法、装置、设备及存储介质。训练教师端模型时，采用多尺度代价体，并且针对各个尺度的代价体进行代价聚合，提升了模型感受野，从而提高了教师端模型对无纹理区域的视差估计能力。并用教师端模型对学生端模型的多视差尺度图进行监督，通过损失函数优化使轻量的学生端模型具有与教师端模型接近的特征表达能力，提高了学生端模型输出的精度，训练好的学生端模型作为双目立体匹配模型。在实际使用时，仅需用双目立体匹配模型处理图像，即可得到高精度的视差图，提升了双目立体匹配算法的实时性和可移植性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像数据处理，特别是涉及到一种双目立体匹配模型训练方法、装置、设备及存储介质。

技术介绍

1、基于双目立体匹配技术原理的深度相机工作流程包括：同步图像获取、双目标定、立体校正(含消除畸变)、立体匹配(含视差计算)、深度计算。立体匹配算法包括传统立体匹配算法和基于深度学习技术的立体匹配算法，相比于传统立体匹配算法，深度学习立体匹配算法在精度上具有显著的优势，然而，由于当前深度学习立体匹配算法一般采用已有的分类网络预训练模型(该类模型计算量大都比较高)用于提取图像特征，同时在代价聚合步骤时涉及3d卷积模块，导致该类算法对计算资源(包括计算量、内存)的占用非常大，在运行效率上离实时性也有一定的差距；另外，对于当前的传统立体匹配算法和深度学习立体匹配算法而言，均涉及对匹配代价体的构建，该操作涉及到大量的拷贝运算，对移动端的运算平台--神经网络处理单元(neuro process unit，npu)来说十分不友好，导致运行效率极低，严重阻碍了深度学习双目立体匹配算法的落地应用。

技术实现思路

1、本申请的主要目的为提供一种双目立体匹配模型训练方法、装置、设备及存储介质，旨在解决现有技术中双目立体匹配算法运行效率低和实时性差的问题。

2、为了实现上述专利技术目的，本申请提出一种双目立体匹配模型训练方法，包括：

3、获取左相机图像、右相机图像和对应的雷达扫描图；

4、根据所述左相机图像、右相机图像和对应的雷达扫描图，训练教师端模型；

5、

6、进一步地，所述根据所述左相机图像、右相机图像和对应的雷达扫描图，训练教师端模型，包括：

7、对所述左相机图像、右相机图像进行多尺度特征提取，分别构建多尺度匹配代价体；

8、对所述多尺度匹配代价体进行代价聚合操作，得到聚合后的多尺度匹配代价体；

9、对所述聚合后的多尺度匹配代价体进行尺度间的匹配代价体融合，得到跨尺度融合的多尺度匹配代价体；

10、通过softargmax函数对所述跨尺度融合的多尺度匹配代价体进行视差计算，得到教师端多尺度的视差图；

11、根据所述教师端多尺度的视差图，进行视差上采样，得到教师端原图像尺度的视差图；

12、根据所述雷达扫描图和所述教师端原图像尺度的视差图计算损失函数，根据所述损失函数训练教师端模型。

13、进一步地，所述softargmax函数，包括：

14、计算softargmax函数的公式为：

15、

16、其中d表示预先设置的范围是[0,d)的整数视差，表示模型输出的对每一整数视差预测的概率分布，为亚像素视差。

17、进一步地，所述根据所述左相机图像、右相机图像和教师端模型，训练学生端模型，所述学生端模型训练完成后，作为双目立体匹配模型，包括：

18、将所述左相机图像和右相机图像进行通道串联，进行视差下采样，得到学生端多尺度的视差图；

19、根据所述教师端多尺度的视差图和所述学生端多尺度的视差图，计算各尺度的损失函数，根据所述各尺度的损失函数训练学生端模型，所述学生端模型训练完成后，作为双目立体匹配模型。

20、进一步地，所述损失函数，包括：

21、计算损失函数的公式为：

22、

23、其中，p为像素坐标，dp表示p像素坐标的整数视差，为p像素坐标的亚像素视差，smoothl1为

24、

25、进一步地，所述根据所述左相机图像、右相机图像和教师端模型，训练学生端模型，所述学生端模型训练完成后，作为双目立体匹配模型之后，包括：

26、获取待匹配的左相机图像和右相机图像；

27、将所述待匹配的左相机图像和右相机图像输入双目立体匹配模型，得到视差图。

28、本申请还提供了一种双目立体匹配模型训练装置，所述装置包括：

29、训练图像获取模块，用于获取左相机图像、右相机图像和对应的雷达扫描图；

30、教师端模型训练模块，用于根据所述左相机图像、右相机图像和对应的雷达扫描图，训练教师端模型；

31、双目立体匹配模型生成模块，用于根据所述左相机图像、右相机图像和教师端模型，训练学生端模型，所述学生端模型训练完成后，作为双目立体匹配模型。

32、进一步地，所述教师端模型训练模块，包括：

33、教师端模型训练子模块，用于对所述左相机图像、右相机图像进行多尺度特征提取，分别构建多尺度匹配代价体；对所述多尺度匹配代价体进行代价聚合操作，得到聚合后的多尺度匹配代价体；对所述聚合后的多尺度匹配代价体进行尺度间的匹配代价体融合，得到跨尺度融合的多尺度匹配代价体；通过softargmax函数对所述跨尺度融合的多尺度匹配代价体进行视差计算，得到教师端多尺度的视差图；根据所述教师端多尺度的视差图，进行视差上采样，得到教师端原图像尺度的视差图；根据所述雷达扫描图和所述教师端原图像尺度的视差图计算损失函数，根据所述损失函数训练教师端模型。

34、本申请还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

35、本申请还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

36、本申请提供的一种双目立体匹配模型训练方法、装置、设备及存储介质，训练教师端模型时，采用多尺度代价体，并且针对各个尺度的代价体进行代价聚合，提升了模型感受野，从而提高了教师端模型对无纹理区域的视差估计能力。并用教师端模型对学生端模型的多视差尺度图进行监督，通过损失函数优化使轻量的学生端模型具有与教师端模型接近的特征表达能力，提高了学生端模型输出的精度，训练好的学生端模型作为双目立体匹配模型。在实际使用时，仅需用双目立体匹配模型处理图像，即可得到高精度的视差图，提升了双目立体匹配算法的实时性和可移植性。

本文档来自技高网...

【技术保护点】

1.一种双目立体匹配模型训练方法，其特征在于，包括：

2.根据权利要求1所述的双目立体匹配模型训练方法，其特征在于，所述根据所述左相机图像、右相机图像和对应的雷达扫描图，训练教师端模型，包括：

3.根据权利要求2所述的双目立体匹配模型训练方法，其特征在于，所述SoftArgMax函数，包括：

4.根据权利要求2所述的双目立体匹配模型训练方法，其特征在于，所述根据所述左相机图像、右相机图像和教师端模型，训练学生端模型，所述学生端模型训练完成后，作为双目立体匹配模型，包括：

5.根据权利要求2或4所述的双目立体匹配模型训练方法，其特征在于，所述损失函数，包括：

6.根据权利要求1所述的双目立体匹配模型训练方法，其特征在于，所述根据所述左相机图像、右相机图像和教师端模型，训练学生端模型，所述学生端模型训练完成后，作为双目立体匹配模型之后，包括：

7.一种双目立体匹配模型训练装置，其特征在于，所述装置包括：

8.根据权利要求7所述的双目立体匹配模型训练装置，其特征在于，所述教师端模型训练模块，包括：>

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种双目立体匹配模型训练方法，其特征在于，包括：

3.根据权利要求2所述的双目立体匹配模型训练方法，其特征在于，所述softargmax函数，包括：

5.根据权利要求2或4所述的双目立体匹配模型训练方法，其特征在于，所述损失函数，包括：

6.根据权利要求1所述的双目...

【专利技术属性】
技术研发人员：李玉鹏，任亮亮，伍俊龙，
申请(专利权)人：广州视源电子科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人