基于机器学习的图像处理技术制造技术

技术编号：24105676 阅读：40 留言：0更新日期：2020-05-09 16:51

本文中公开了基于机器学习的图像处理架构和相关联的应用。在一些实施例中，训练机器学习框架以学习低级图像属性，诸如对象/场景类型、几何形状、放置、材料和纹理、相机特性、照明特性、对比度、噪声统计信息等。之后，该机器学习框架可以被采用以在其他图像中检测这样的属性，并在属性级别处理该图像。

Image processing technology based on machine learning

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于机器学习的图像处理技术其他申请的交叉引用本申请要求2017年8月4日提交的题为DIRECTANDDERIVED3DDATAFORMACHINELEARNINGINIMAGEBASEDAPPLICATIONS的美国临时专利申请No.62/541,603的优先权，该美国临时专利申请出于所有目的通过引用并入本文中。
技术介绍
图像处理技术传统上已经以像素级别（即，对像素值或像素强度）进行操作。然而，对于诸如更改图像的高级视觉外观之类的应用，对低级（low-level）像素数据进行操作是不实际的。对于此类任务，基于特征的方法更为有效。基于特征的技术包括：首先定义具体特征（例如，边缘、斑块、SURF、SIFT等）的集合，并且然后定义关于可以被用来分析和操纵图像内容的那些特征的数学模型。机器学习技术可以被采用以基于相关的取决于应用的成本函数来学习特征和数学模型参数中的任一个或两个。然而，这样的人工智能技术需要详尽的训练数据集，该数据集跨越针对特定应用的所有特征的空间，并利用相关地面真实数据被标记。对于大多数有用的应用，通常禁止收集详尽的训练数据集。另外，很难用更复杂或更精细的地面真实数据来标记图像。因此，直到最近，机器学习技术的使用尚被限于基本的对象识别或分类应用。因此，需要并在本文中公开了一种克服这种局限并有效利用机器学习技术的图像处理架构，以及由此产生的新颖的基于图像的应用。附图说明在以下的详细描述和附图中公开了本专利技术的各种实施例。图1是用于学习与数据集相关联的属性的基于机器学习的图...

【技术保护点】
1.一种方法，包括：/n使用机器学习框架来检测输入图像的一个或多个属性的集合；以及/n输出包括所述输入图像的经修改版本的输出图像，其中，通过修改检测到的属性的集合的至少一个子集来修改所述输入图像。/n

【技术特征摘要】
【国外来华专利技术】20170804 US 62/5416031.一种方法，包括：
使用机器学习框架来检测输入图像的一个或多个属性的集合；以及
输出包括所述输入图像的经修改版本的输出图像，其中，通过修改检测到的属性的集合的至少一个子集来修改所述输入图像。

2.根据权利要求1所述的方法，其中，在由所述机器学习框架进行检测之前，对于所述输入图像，检测到的属性的集合是未知的。

3.根据权利要求1所述的方法，其中，检测到的属性的集合与风格或美学效果相关联。

4.根据权利要求3所述的方法，其中，所述输出图像包括所述输入图像的重新风格化的版本。

5.根据权利要求1所述的方法，其中，检测到的属性的集合与第一风格相关联，并且所述输出图像的经修改的属性的集合与第二风格相关联。

6.根据权利要求5所述的方法，其中，修改所述输入图像包括将所述第一风格修改为所述第二风格。

7.根据权利要求1所述的方法，其中，检测到的属性的集合与所述输入图像中的对象相关联。

8.根据权利要求7所述的方法，其中，所述输入图像中的对象由所述输出图像中的不同对象替代。

9.根据权利要求1所述的方法，其中，检测到的属性的集合与照明相关联。

10.根据权利要求9所述的方法，其中，所述输出图像包括所述输入图像的重新照明的版本。

11.根据权利要求1所述的方法，其中，检测到的属性的集合与噪声相关联。

12.根据权利要求11所述的方法，其中，所述输出图像包括所述输入图像的去噪版本。

13.根据权利要求1所述的方法，其进一步包括利用经修改的属性的集合对所述输出图像进行标记或加标签。

14.根据权利要求1所述的方法，其中，检测到的属性的集合包括与对象/场景类型、几何形状、放置、材料、纹理、相机特性、照明特性、噪声统计信息和对比度相关联的一个或多个属性。

15.根据权利要求1所述的方法，其中，在图像数据集上训练所述机器学习框架，所述图像数据集包括与所述输入图像所属的规定场景类型相关联的受约束的对象集合的排列。

16.根据权利要求1所述的方法，其中，在包括从三维对象模型渲染的标记图像的数据集上训练所述机器学习框架。

17.根据权利要求1所述的方法，其中，所述输入图像和所述输出图像均包括照片或照片级渲染。

18.根据权利要求1所述的方法，其中，所述输入图像和所述输出图像均包括动画或视频序列的帧。

19.一种系统，包括：
处理器，其被配置成：
使用机器学习框架来检测输入图像的一个或多个属性的集合；以及
输出包括所述输入图像的经修改版本的输出图像，其中，通过修改检测到的属性的集合的至少一个子集来修改所述输入图像；以及
存储器，其耦合到所述处理器并被配置成向所述处理器提供指令。

20.一种计算机程序产品，其体现在非暂时性计算机可读存储介质中，并且包括计算机指令以用于：
使用机器学习框架来检测输入图像的一个或多个属性的集合；以及
输出包括所述输入图像的经修改版本的输出图像，其中，通过修改检测到的属性的集合的至少一个子集来修改所述输入图像。

21.一种方法，包括：
使用机器学习框架来检测与具有共享美学效果的图像的第一集合相关联的美学属性；以及
通过将检测到的美学属性应用于被用来渲染图像的第二集合的三维对象模型，生成具有相同的共享美学效果的图像的第二集合。

22.根据权利要求21所述的方法，其中，所述图像的第一集合的共享美学效果来自后处理。

23.根据权利要求21所述的方法，其中，由艺术家将所述共享美学效果赋予所述图像的第一集合。

24.根据权利要求21所述的方法，其中，在没有艺术家输入或后处理的情况下，生成具有相同的共享美学效果的所述图像的第二集合。

25.根据权利要求21所述的方法，其中，所述美学属性包括一个或多个低级属性的组合。

26.根据权利要求25所述的方法，其中，所述美学属性可分离为其构成的低级属性。

27.根据权利要求25所述的方法，其中，所述低级属性包括与对象/场景类型、几何形状、放置、材料、纹理、相机特性、照明特性、噪声统计信息和对比度相关联的一个或多个属性。

28.根据权利要求21所述的方法，其中，所述共享美学效果与规定品牌相关联。

29.根据权利要求21所述的方法，其中，所述共享美学效果与规定场景类型相关联。

30.根据权利要求21所述的方法，其中，所述第二集合包括比所述第一集合更多的图像。

31.根据权利要求21所述的方法，其中，所述第一集合和所述第二集合共同包括具有共享美学效果的图像的超级目录，其中仅所述第一集合是艺术家后处理的。

32.根据权利要求21所述的方法，其中，所述第一集合和所述第二集合共同包括具有共享美学效果的图像的超级目录，所述共享美学效果被用来进一步训练和构建所述机器学习框架。

33.根据权利要求21所述的方法，进一步包括利用...

【专利技术属性】
技术研发人员：C徐，M帕马，
申请(专利权)人：奥沃德公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人