【技术实现步骤摘要】
【国外来华专利技术】用于图像变型和识别的神经风格迁移
本公开涉及用于经由神经风格迁移进行图像变型的方法和系统,这些方法和系统可以用于改善图像识别系统的性能。
技术介绍
深度学习已广泛用于图像识别。例如,分类机器学习模型(例如,神经网络)可以被训练用于通过向模型馈送许多图像来识别对象。通常,图像需要用相应的内容物(例如,图像中待识别的对象,例如字母、数字、标号、符号、字符等)标记。
技术实现思路
在众多行业和应用中,期望对图像进行变型以训练图像识别机器学习算法/模型(例如,神经网络)。本公开提供了用于经由神经风格迁移进行图像变型的方法和系统,这些方法和系统可以用于改善经由图像识别机器学习算法/模型进行的图像识别。简而言之,在一个方面,本公开描述了一种计算机实施的方法,该方法包括向处理器提供多个数字图像。每个数字图像包括待识别的对象以及反映在其下获取对象的图像的真实世界条件的纹理或风格特征。该方法还包括根据图像的纹理或风格特征经由处理器将多个数字图像聚类成不同的群组,每个群组包括具有相似纹理或风格特征的数字图像中的一个或 ...
【技术保护点】
1.一种计算机实施的方法,包括:/n向处理器提供多个数字图像,每个数字图像包括待识别的对象以及反映在其下获取所述对象的图像的真实世界条件的纹理或风格特征;/n根据所述图像的所述纹理或风格特征经由所述处理器将所述多个数字图像聚类成不同的群组,每个群组包括具有相似纹理或风格特征的所述数字图像中的一个或多个;/n经由所述处理器从图像的每个群组中选择一个或多个代表性风格图像;/n经由所述处理器来训练用于所述代表性风格图像中的至少一个的风格迁移神经网络,以获得一个或多个经训练的风格迁移神经网络;/n经由所述经训练的风格迁移神经网络将所述纹理或风格特征从每个代表性图像迁移到目标图像以生 ...
【技术特征摘要】
【国外来华专利技术】20170801 US 62/539,7721.一种计算机实施的方法,包括:
向处理器提供多个数字图像,每个数字图像包括待识别的对象以及反映在其下获取所述对象的图像的真实世界条件的纹理或风格特征;
根据所述图像的所述纹理或风格特征经由所述处理器将所述多个数字图像聚类成不同的群组,每个群组包括具有相似纹理或风格特征的所述数字图像中的一个或多个;
经由所述处理器从图像的每个群组中选择一个或多个代表性风格图像;
经由所述处理器来训练用于所述代表性风格图像中的至少一个的风格迁移神经网络,以获得一个或多个经训练的风格迁移神经网络;
经由所述经训练的风格迁移神经网络将所述纹理或风格特征从每个代表性图像迁移到目标图像以生成风格化的图像;以及
使用所述风格化的图像来训练图像识别机器学习模型。
2.根据权利要求1所述的方法,其中对所述风格迁移神经网络进行预训练,并存储所述经训练的风格迁移神经网络以便于调用来使用。
3.根据权利要求2所述的方法,其中所述存储的风格迁移神经网络中的至少一个被调用为由实时应用使用。
4.根据权利要求1所述的方法,其中所述经训练的风格迁移神经网络各自对应于代表性纹理或风格特征。
5.根据权利要求1所述的方法,还包括基于所述对应的数字图像群组的统计选择一个经训练的风格迁移神经网络。
6.根据权利要求5所述的方法,还包括经由复用器根据所述群组的尺寸从所述经训练的风格迁移神经网络中选择一个经训练的风格迁移神经网络。
7.根据权利要求5所述的方法,还包括经由复用器根据所述图像的预先确定的概率分布从所述经训练的风格迁移神经网络中选择一个经训练的风格迁移神经网络。
8.根据权利要求1所述的方法,其中对所述多个数字图像进行聚类包括将所述数字图像输入到多层神经网络。
9.根据权利要求8所述的方法,还包括经由所述多层神经网络将每个图像的所述纹理或风格特征分解成格拉姆矩阵。
10.根据权利要求8所述的方法,其中所述多层神经网络包括视觉几何组(VGG)网络。
11.根据权利要求9所述的方法,其中每个格拉姆矩阵对应于所述多层神经网络的一个层,并且表示每个层中的每个图像的特征图之间的相关性矩阵。
12.根据权利要求9所述的方法,其中基于在所述格拉姆矩阵内经由K-均值聚类方法发现的相似性将所述图像聚类成所述群组。
13.根据权利要求9所述的方法,还包括计算所述格拉姆矩阵之间的距离。
14.根据权利要求13所述的方法,其中使用余弦角度来计算所述距离作为距离测量值。...
【专利技术属性】
技术研发人员:穆罕默德·贾迈勒·阿夫里迪,埃莉萨·J·科林斯,乔纳森·D·甘德若德,詹姆斯·W·霍华德,阿尔希·桑格瑞,詹姆斯·B·斯奈德,
申请(专利权)人:三M创新有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。