利用去噪扩散模型对输入干扰进行通用净化的系统和方法技术方案

技术编号：40541335 阅读：5 留言：0更新日期：2024-03-05 18:57

提供了利用去噪扩散模型对输入干扰进行通用净化的系统和方法。一种存储指令的计算机程序产品，当由计算机执行时，所述指令使计算机进行以下操作：从传感器接收输入数据；利用输入数据生成训练数据集，其中通过创建输入数据的一个或多个副本并将噪声添加到一个或多个副本来创建训练数据集；将训练数据集发送到扩散模型，其中扩散模型被配置成通过以下方式重建和净化训练数据集：去除与输入数据相关联的噪声，并重建训练数据集的一个或多个副本，以创建经修改的输入数据集；将经修改的输入数据集发送到固定分类器；以及响应于由固定分类器获得的经修改的输入数据集的分类的多数投票，输出与输入数据相关联的分类。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及利用机器学习对图像(或其他输入)的增强和处理。关于联邦资助研究的声明本专利技术在美国国家科学基金会授予的政府资助下做出，授予号为1190060-430433。政府可能具有本专利技术的某些权利。

技术介绍

1、机器学习分类器已经表明在测试时易于损坏和受干扰。这种干扰/损坏可能是自然发生的(常见损坏)或最坏情况下是对抗性干扰，其中输入域中的小变化可能导致错误预测。自然损坏通常改变图像的所有像素，并且这种损坏对于人类感知是可见的。另一方面，有两种主要类型的对抗性干扰，范数限界的干扰和基于补丁的干扰。范数限界的干扰也以有限的(由lp范数限界的)强度改变图像的所有像素，而基于补丁的干扰仅改变图像的子区域内的像素，但是可以将这些像素的值改变为图像的像素范围内的任何值。

2、由于三种类型干扰的这种非常不同的性质，尽管已经提出了针对本领域已知的一种或两种类型干扰训练鲁棒模型的方法，例如用于对抗性净化、对抗性鲁棒和鲁棒视觉变换器的扩散模型。可能没有一种方法可以使模型在所有三种类型的干扰下都是鲁棒的。本专利技术提出了一种框架，该框架将使既被预训练又被微调的分类器对常见的损坏和对抗性干扰是鲁棒的。

技术实现思路

1、第一实施例公开了一种用于训练机器学习网络的计算机实现的方法。一种用于训练机器学习网络的计算机实现的方法包括：从传感器接收输入数据，其中输入数据指示图像、雷达、声纳或声音信息；利用输入数据生成训练数据集，其中通过创建输入数据的一个或多个副本并将具有相同均值和方差的噪声添加

2、第二实施例公开了一种包括机器学习网络的系统。该系统包括配置成从传感器接收输入数据的输入接口，其中传感器包括相机、雷达、声纳或麦克风。该系统还包括与输入接口通信的处理器，其中处理器被编程为：从传感器接收输入数据，其中输入数据指示图像、雷达、声纳或声音信息；利用输入数据生成训练数据集，其中训练数据集包括数据的多个副本，所述数据的多个副本包括噪声；通过以下方式来重建和净化训练数据集：去除与输入数据相关联的噪声，并重建训练数据集的多个副本，以创建经修改的输入数据集；以及响应于从经修改的输入数据集获得的分类的多数投票，输出与输入数据相关联的最终分类。

3、第三实施例公开了一种存储指令的计算机程序产品，当由计算机执行时，所述指令使计算机进行以下操作：从传感器接收输入数据；利用输入数据生成训练数据集，其中通过创建输入数据的一个或多个副本并将噪声添加到一个或多个副本来创建训练数据集；将训练数据集发送到扩散模型，其中扩散模型被配置成通过以下方式重建和净化训练数据集：去除与输入数据相关联的噪声，并重建训练数据集的一个或多个副本，以创建经修改的输入数据集；将经修改的输入数据集发送到固定分类器；以及响应于由固定分类器获得的经修改的输入数据集的分类的多数投票，输出与输入数据相关联的分类。

本文档来自技高网...

【技术保护点】

1.一种用于训练机器学习网络的计算机实现的方法，包括：

2.根据权利要求1所述的计算机实现的方法，其中扩散模型和固定分类器二者是预训练的。

3.根据权利要求1所述的计算机实现的方法，其中所述方法包括，对于每个训练数据集，利用扩散模型和固定分类器计算干净图像。

4.根据权利要求1所述的计算机实现的方法，其中噪声包括高斯噪声、散粒噪声、运动模糊、变焦模糊、压缩或亮度变化。

5.根据权利要求1所述的计算机实现的方法，其中固定分类器和扩散模型在相同的数据分布上被训练。

6.根据权利要求1所述的计算机实现的方法，其中扩散模型被配置为通过随时间对噪声进行去噪来反转与训练数据集相关联的噪声。

7.根据权利要求1所述的计算机实现的方法，其中扩散模型被去噪。

8.根据权利要求1所述的计算机实现的方法，其中传感器是相机，并且输入数据包括从相机获得的视频信息。

9.一种包括机器学习网络的系统，包括：

10.根据权利要求9所述的系统，其中噪声包括高斯噪声、散粒噪声、运动模糊、变焦模糊、压缩或亮度变化。

11.根据权利要求9所述的系统，其中输入数据指示图像，并且通过选择与从高斯分布中随机抽取的图像相关联的每个像素来生成训练数据集。

12.根据权利要求9所述的系统，其中所述系统包括扩散模型，所述扩散模型是被配置为通过扩散处理生成图像的去噪扩散模型。

13.根据权利要求12所述的系统，其中扩散模型用于重建和净化训练数据集。

14.根据权利要求9所述的系统，其中利用分类器输出最终分类。

15.一种存储指令的计算机程序产品，当由计算机执行时，所述指令使计算机进行以下操作：

16.根据权利要求15所述的计算机程序产品，其中输入数据包括图像、雷达、声纳或声音信息。

17.根据权利要求15所述的计算机程序产品，其中添加噪声包括将具有相同均值和相同方差的噪声添加到一个或多个副本中的每一个。

18.根据权利要求15所述的计算机程序产品，其中添加噪声包括添加具有相同均值的噪声。

19.根据权利要求15所述的计算机程序产品，其中添加噪声包括添加具有相同方差的噪声。

20.根据权利要求15所述的计算机程序产品，其中输入数据包括从麦克风获得的声音信息。

...

【技术特征摘要】