学习方法、存储介质以及图像处理装置制造方法及图纸

技术编号：36610168 阅读：18 留言：0更新日期：2023-02-08 09:57

本发明专利技术的实施方式涉及一种学习方法、存储介质以及图像处理装置。实施方式的学习方法具备如下步骤：取得通过摄像装置从多视点摄像第一被摄体而得到的多视点图像；以及基于将多视点图像中的第一图像作为输入而从统计模型输出的第一模糊值以及将多视点图像中的第二图像作为输入而从统计模型输出的第二模糊值来使统计模型学习。学习的步骤包括如下步骤：从多视点图像取得到第一图像所包括的第一被摄体的第一距离和到第二图像所包括的第一被摄体的第二距离；以及以第一模糊值和第二模糊值的大小关系变得与第一距离和第二距离的大小关系相等的方式使统计模型学习。关系相等的方式使统计模型学习。关系相等的方式使统计模型学习。

全部详细技术资料下载

【技术实现步骤摘要】
学习方法、存储介质以及图像处理装置
[0001]相关申请
[0002]本申请以日本专利申请2021
‑
124296(申请日：2021年7月29日)为基础上，从该申请享有优先的利益。本申请通过参照该申请，全部包括该申请的内容。

[0003]本专利技术的实施方式涉及学习方法、存储介质以及图像处理装置。

技术介绍

[0004]为了取得到被摄体的距离，已知有使用由2个摄像装置(相机)、立体相机(复眼相机)摄像到的图像的技术，但近年来，开发了使用由1个摄像装置(单眼相机)摄像到的图像来取得到被摄体的距离的技术。
[0005]在此，为了如上述那样使用图像来取得到被摄体的距离，考虑对应用神经网络等机器学习算法而生成的统计模型加以使用。
[0006]然而，为了生成高精度的统计模型，需要使统计模型学习庞大的学习用的数据集(学习用图像与和到该学习用图像中的被摄体的距离有关的正确值的集合)，但准备该数据集并不容易。

技术实现思路

[0007]本专利技术要解决的技术问题在于，提供一种能够提高用于取得到被摄体的距离的统计模型中的学习的容易性的学习方法、存储介质以及图像处理装置。
[0008]根据实施方式，提供一种学习方法，该学习方法用于使统计模型学习，该统计模型用于将包括被摄体的图像作为输入而输出对根据到该被摄体的距离而在该图像中产生的模糊进行表示的模糊值。所述学习方法包括如下步骤：取得由摄像装置从多视点摄像第一被摄体而得到的第一多视点图像；以及基于第一模糊值及第二模糊...

【技术保护点】

【技术特征摘要】
1.一种学习方法，用于使统计模型学习，该统计模型用于将包括被摄体的图像作为输入而输出对模糊进行表示的模糊值，该模糊是根据到该被摄体的距离而在该图像中产生的，所述学习方法具备如下步骤：取得通过摄像装置从多视点对第一被摄体进行摄像而得到的第一多视点图像；以及基于第一模糊值及第二模糊值来使所述统计模型学习，所述第一模糊值是将所述第一多视点图像中的第一图像作为输入而从所述统计模型输出的模糊值，所述第二模糊值是将所述第一多视点图像中的第二图像作为输入而从所述统计模型输出的模糊值，所述学习的步骤包括如下步骤：从所述第一多视点图像取得第一距离及第二距离，所述第一距离是摄像所述第一图像时的从所述摄像装置到该第一图像所包括的第一被摄体的距离，所述第二距离是摄像所述第二图像时的从所述摄像装置到该第二图像所包括的第一被摄体的距离；判别所述第一距离与所述第二距离的大小关系；以及以所述第一模糊值与所述第二模糊值的大小关系变得与判别出的所述大小关系相等的方式使所述统计模型学习。2.根据权利要求1所述的学习方法，所述统计模型将所述第一图像作为输入而输出所述第一模糊值以及该第一模糊值的第一不可靠度，将所述第二图像作为输入而输出所述第二模糊值以及该第二模糊值的第二不可靠度，所述学习的步骤包括如下步骤：以使基于从所述统计模型输出的第一模糊值及第二模糊值计算的位次损失最小化的方式使所述统计模型学习，所述位次损失基于所述第一不可靠度及所述第二不可靠度中的至少一个不可靠度而被调整。3.根据权利要求1或2所述的学习方法，所述统计模型将所述第一多视点图像中的第三图像作为输入而输出从所述统计模型输出的第三模糊值，所述学习的步骤包括如下步骤：以所述第一模糊值与所述第三模糊值之间的差分被最小化的方式使所述统计模型学习，摄像所述第一图像时的从所述摄像装置到该第一图像所包括的第一被摄体的第一距离与摄像所述第三图像时的从所述摄像装置到该第三图像所包括的第一被摄体的第三距离之间的差分在预先决定的值以下。4.根据权利要求1～3中任一项所述的学习方法，所述第一多视点图像在所述摄像装置的焦点被固定的状态下被摄像。5.根据权利要求1～4中任一项所述的学习方法，所述学习的步骤包括如下步骤：在基于所述第一模糊值及所述第二模糊值使所述统计模型学习之后，基于将第四图像作为输入而从所述统计模型输出的第四模糊值、以及将第五图像作为输入而从所述统计模型输出的第五模糊值，来使统计模型学习，所述第四图像是所述第一多视点图像中的从与所述第一图像不同的视点摄像到的图像，所述第五图像是所述第一多视点图像中的从与所述第二图像不同的视点摄像到的图像。
6.根据权利要求1～5中任一项所述的学习方法，还具备取得通过所述摄像装置从多视点对第二被摄体进行摄像而得到的第二多视点图像的步骤，所述学习的步骤还包括如下步骤：基于将所述第二多视点图像中的第六图像作为输入而从所述统计模型输出的第六模糊值以及将所述第二多视点图像所包括的第七图像作为输入而从所述统计模型输出的第七...

【专利技术属性】
技术研发人员：三岛直，关晃仁，
申请(专利权)人：株式会社东芝，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人