一种面向图像数据集的域间差异度量方法技术

技术编号：40116585 阅读：9 留言：0更新日期：2024-01-23 20:00

本发明专利技术提出一种面向图像数据集的域间差异度量方法，包括，对图像数据集进行数学特征分析，实现对图像数据集的差异度量的数学抽象；基于数学抽象建立具有图像特征针对性的数学度量方法；对数学度量方法进行优化；获取待处理图像数据集，根据优化后的数学度量方法对待处理图像数据集进行差异度量。本发明专利技术可以通过客观的定量方式计算图像数据集间的差异，提高了图像任务域自适应的泛化性，也节省了计算资源和运行时间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉领域。

技术介绍

1、在计算机视觉中，域(domain)通常指的是一个数据集的来源或分布。实际场景中通常存在多个不同的域，每个域都有不同的数据分布，即不同数据样本的统计特征。由于不同域的数据分布不同，不能简单地将在一个域上训练的模型直接应用于另一个域上。域自适应问题指的是模型能够自适应地根据不同域的数据解决对应域的相同任务。域自适应问题的本质是将源域的知识迁移至目标域中，因此需要度量两个域间的距离，即两个域数据分布间的距离，以便找到其共性和差异，从而实现在源域训练一个模型，能有效应用于目标域。

2、目前，神经网络中常用的度量分布差异的计算方法主要包括kl散度、js散度和hellinger度量。kl散度和js散度计算方式简单、计算代价较小，但其不满足度量定义中的对称性和三角不等式，所以不具备通用性；hellinger度量虽然满足度量定义，但不具有不同属性拓扑空间的泛化性。此外，上述度量差异的计算方法均无法计算无重叠分布间的距离，即无法给出几乎不相关的图像数据集间的差异大小。

3、如上所述，目前的域度量方法主要存在以下缺点：

4、当前的图像相似性度量方法多为直接比较两张图像间的相似度，或使用特征分类器比较两个图像集间的相似度。使用特征分类器必然带有对某个或某些特定数据集的特征偏向，对复杂或极端环境图像集的判断易出现较大偏差。

5、现有方法大多无法同时满足非负性、对称性、非退化性和三角不等式，无法推广至对距离有严格定义要求的领域，使得这些方法的应用场景受到局限。</p>

6、已有的集合度量方式需要将待度量集合中的每个元素一一计算单元素距离，而由于图像维度较高，该方法在图像集域差异度量任务中计算开销很大。

技术实现思路

1、本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。

2、为此，本专利技术的目的在于提出一种面向图像数据集的域间差异度量方法，用于实现完备的图像数据集的域间差异度量。

3、为达上述目的，本专利技术第一方面实施例提出了一种面向图像数据集的域间差异度量方法，包括：

4、对图像数据集进行数学特征分析，实现对所述图像数据集的差异度量的数学抽象；

5、基于所述数学抽象建立具有图像特征针对性的数学度量方法；

6、对所述数学度量方法进行优化；

7、获取待处理图像数据集，根据优化后的数学度量方法对所述待处理图像数据集进行差异度量。

8、另外，根据本专利技术上述实施例的一种面向图像数据集的域间差异度量方法还可以具有以下附加的技术特征：

9、进一步地，在本专利技术的一个实施例中，所述对图像数据集进行数学特征分析，包括：

10、对于所述图像数据集中的每张图像，将其中的每个像素视为一个维度；

11、定义一个维度为p2标准度量空间(n,d)，定义一个任意空间a到n的映射f:a→n，使得所有图像均可被映射至标准度量空间中，从而所述图像数据集的差异被抽象为标准度量空间中离散分布的距离。

12、进一步地，在本专利技术的一个实施例中，所述基于所述数学抽象建立具有图像特征针对性的数学度量方法，包括：

13、对于高维离散分布的度量采用wasserstein度量：

14、

15、其中s为源域图像分布，t为目标域图像分布，π[s,t]为所述源域图像分布和所述目标域图像分布所有联合分布的集合；

16、将标准度量空间中的度量d按如下方式构造：

17、

18、其中是可调参数，与标准度量空间的维度p2有关；其中

19、

20、其中x和y分别为源域图像集和目标域图像集的图像，μx代表图像像素均值，σx代表图像像素标准差，σxy代表两张图像像素协方差。

21、进一步地，在本专利技术的一个实施例中，在基于所述数学抽象建立具有图像特征针对性的数学度量方法之后，还包括根据所述数学度量方法对高维图像度量进行计算，具体包括：

22、对wasserstein度量进行等价变换：

23、w[s,t]＝minp<c,p>

24、cij＝d(xi,yj)，

25、

26、其中，c是距离矩阵，其中的元素由不同数据集间单张图像的距离，即标准度量空间中的度量值构成，xi是源域图像数据集中的第i张图像，yj是目标域图像数据集中的第j张图像；p是耦合矩阵，表示最优传输方案；距离矩阵c与最优传输的耦合矩阵p的内积即为求得的wasserstein度量。

27、进一步地，在本专利技术的一个实施例中，其特征在于，还包括：

28、引入矩阵熵对所述wasserstein度量进行迭代近似求解：

29、h(p)＝-∑ijpijlogpij

30、

31、其中ε是可调的正则化常数，是正则化后的wasserstein度量；将正则化后的wasserstein度量，使用sinkhorn迭代法进行近似求解：

32、

33、u(0)＝[0]|s|,v(0)＝[0]|t|t

34、u(n+1)＝u(n)+ε(logμ-lsejk(u(n),v(n)))

35、v(n+1)＝v(n)+ε(logv-lseik(u(n+1),v(n)))

36、

37、其中|s|是s的基数，即源域图像数据集的图片数量，|t|是目标域图像数据集的图片数量；μ是一个元素均为共|s|个元素的列向量，v是一个元素均为共|t|个元素的行向量，两者分别表示两个图像数据集每张图像的权重；u(0)是一个元素均为0、共|s|个元素的列向量，v(0)是一个元素均为共|t|个元素的行向量，作为迭代起始点进行式(6)中的迭代，式中lse为logsumexp函数，为取每行或每列的最大值；

38、在进行设定好的次数迭代后得到最终向量，并求得正则化耦合矩阵，最终求得正则化wasserstein度量：

39、

40、

41、其中m是最大迭代次数，是正则化耦合矩阵。

42、进一步地，在本专利技术的一个实施例中，所述对所述数学度量方法进行优化，包括：

43、根据随机填充法求解正则化wasserstein度量，包括设定一个正整数随机阈值r，每次不重不漏地从源域图像数据集和目标域图像数据集随机选取和张图像构建距离矩阵，并计算正则化wasserstein度量，得到每批次的正则化wasserstein度量之和从正向逼近原正则化wasserstein度量：

44、

45、其中sr和tr分别表示单个批次中从源域图像数据集和目标域图像数据集随机选取出的图像集合；

46、通过将按随机填充法计算求得的近似正则化wasserstein度量替代原正则化wasserstein度量，从而降低计算所需时间。本文档来自技高网...

【技术保护点】

1.一种面向图像数据集的域间差异度量方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述对图像数据集进行数学特征分析，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述数学抽象建立具有图像特征针对性的数学度量方法，包括：

4.根据权利要求1所述的方法，其特征在于，在基于所述数学抽象建立具有图像特征针对性的数学度量方法之后，还包括根据所述数学度量方法对高维图像度量进行计算，具体包括：

5.根据权利要求4所述的方法，其特征在于，还包括：

6.根据权利要求1所述的方法，其特征在于，所述对所述数学度量方法进行优化，包括：

7.一种面向图像数据集的域间差异度量装置，其特征在于，包括以下模块：

8.一种计算机设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-6中任一所述的面向图像数据集的域间差异度量方法。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，

...

【技术特征摘要】

1.一种面向图像数据集的域间差异度量方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述对图像数据集进行数学特征分析，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述数学抽象建立具有图像特征针对性的数学度量方法，包括：

5.根据权利要求4所述的方法，其特征在于，还包括：

6.根据...

【专利技术属性】
技术研发人员：欧中洪，朱子谦，郭翼天，林炎龙，宋美娜，尧思远，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人