数据匿名采样与可微相关损失函数制造技术

技术编号：39727609 阅读：8 留言：0更新日期：2023-12-17 23:31

描述了一种用于评估多个数据单元

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】数据匿名采样与可微相关损失函数

[0001]本专利技术涉及从数据单元
(
例如图像
)
到定量值的映射
。
这些值可用于对数据单元进行排名或以其它方式对数据单元进行比较
。

技术介绍

[0002]成功地从数据单元
(
例如图像
)
映射到任意维度
(
轴线
)
的定量
(
标量
)
值涉及生成一个函数，该函数将数据单元作为输入，并输出代表输入数据单元的某些特性的标量值
。
[0003]这种函数的一个示例涉及基于图像视觉质量进行的感知图像质量评估和图像定量评分
。
一旦将单个标量分配给集合中的图像，就可以使用相应的分数按任意维度对图像列表进行排序，从而可以以顺序的方式对图像进行排名
。
在此应用中，使用标量对列表进行排序将产生按视觉质量排序的图像列表
。
[0004]将主观视觉质量作为图像
‑
分数映射的示例，基于定性外观自动为图像分配标量的过程通常称为图像质量评估
(image quality assessment
，
IQA)。
[0005]对于该
IQA
应用，已经开发了一系列映射技术，以便自动评估图像的感知视觉质量
。
可接受的自动
IQA
估计输出通常应与大量人类评估人员进行的质量评估
(/>通常称为平均意见得分
(mean opinion score
，
MOS))
高度相关
。IQA
已广泛应用于下游计算摄影和计算机视觉问题，其中，图像质量构成了一个基本方面，例如图像复原
、
图像超分辨率和图像检索
。
关于
IQA
的研究集中在
FR
‑
IQA(
全参考
)
和
NR
‑
IQA(
无参考
)
设置上，后者是在没有任何可用参考
(
基线质量
)
图像的情况下必须为
(
潜在质量缺陷
)
图像建立图像质量的情况
。
[0006]可训练
(
可学习
)
模型和确定性系统都可用于从图像映射到定量评估分数
。
[0007]可训练模型
(
例如神经网络
)
使用标签数据
(
图像
、
定量分数元组对
)
与监督式学习技术结合使用，以便学习能够将图像映射到相应的评估分数的回归函数
。
在这种情况下，评估评级可以构成任意图像属性
。
[0008]例如，在
IQA
中，图像“感知质量”可以作为示例性属性
。
但是，主观图像“感知质量”在数学意义上并不是一个定义明确的术语，从而导致了自然不适定映射问题示例
。
[0009]卷积神经网络
(convolutional neural network
，
CNN)
的成功和广泛流行鼓励了研究人员探索其在
IQA
问题以及许多其它计算机视觉任务中的潜在应用
。
与先前的手工方法相比，这项对可学习
、
数据驱动方法的研究取得了显著的改进
。
[0010]这种可学习模型的一个显著组成部分是它们对大型训练数据的要求
。
由于与收集此类数据集相关的相对成本较高
(
即每个图像的
MOS
记录和整理耗费大量劳动力和时间
)
，因此尤其缺乏用于
IQA
问题的大型公开可用数据集
。
因此，任何考虑使用数据驱动方法来解决
IQA
问题的著作都必须解决的一个关键问题是，缺乏可用于模型训练
(
函数拟合
)
的大型
IQA
数据集
。
[0011]尤其是神经网络方法在这一点上特别敏感，因为如果模型变得更深更宽
(
增加其表达能力和灵活性
)
，内部模型参数的数量会急剧增加，并且需要更多的数据来避免与“模型过拟合”相关的众所周知的问题，这些问题在考虑看不见的新测试数据时通常会损害泛
化能力
(
即，随着参数数量的增加，模型变得更加需要训练数据，从而可能会损害预测性能
)。
总之，先前可学习的
IQA
方法的一个缺点是需要大量数据的可训练
CNN
模型的本质冲突，以及手工标记和收集
IQA
数据集的高成本和高费用
。
[0012]由于前面提到的数据集数量级问题，模型训练需要越来越大的注释数据集
。
但是，如所说明，
IQA
图像数据集的注释过程需要为每个图像进行多个人工注释，因此收集和整理过极其耗费劳动力且成本高昂
。
因此，大多数可用的
IQA
数据集太小，无法高效地训练
CNN。
[0013]需要开发一种克服这些问题的方法
。

技术实现思路

[0014]根据第一方面，提供了一种用于评估多个数据单元的处理机制，所述处理机制包括一个或多个处理器，所述处理器用于通过机器学习算法处理所述数据单元，并因此为每个数据单元形成输出值，所述输出值表示
(i)
所述单元的评级和
(ii)
所述单元相对于所述多个数据单元中的其它数据单元的排名
。
这可以支持使用所述输出值容易地比较所述数据单元的特性，例如它们的质量
。
[0015]所述数据单元可以表示语义不同的内容，并且所述一个或多个处理器用于，作为所述算法的一部分，选择用于比较处理的所述数据单元的组，所述组中的至少一些包括表示语义不同的内容的数据单元
。
与典型的先前图像语义内容约束比较相比，该方法可以支持图像内容不可知的采样，因此可以支持下游图像不可知的质量比较
。
[0016]所述机器学习算法可以在多个批次上进行操作，每个批次包括所述数据单元的部分集合
。
[0017]所述机器学习算法可以根据使用第一可微相关系数的训练目标进行操作，所述第一可微相关系数用于在整个批次上使所述批次的每个成员的输出值与所述每个成员在所述批次的成员中的相应评级之间的具有单调关系
。
这可以支持可微相关系数集成到损失函数中
。
这可以使模型对相关系数测量的图像集排名有更全局的了解...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种用于评估多个数据单元
(201、202)
的处理机制
(1000)
，其特征在于，所述处理机制包括一个或多个处理器
(1001)
，所述处理器
(1001)
用于通过机器学习算法处理所述数据单元，并因此为每个数据单元形成输出值
(203)
，所述输出值
(203)
表示
(i)
所述单元的评级和
(ii)
所述单元相对于所述多个数据单元中的其它数据单元的排名
。2.
根据权利要求1所述的处理机制，其特征在于，所述数据单元表示语义不同的内容，并且所述一个或多个处理器用于，作为所述算法的一部分，选择用于比较处理的所述数据单元的组，所述组中的至少一些包括表示语义不同的内容的数据单元
。3.
根据上述权利要求中任一项所述的处理机制，其特征在于，所述机器学习算法在多个批次上进行操作，每个批次包括所述数据单元的部分集合
。4.
根据权利要求3所述的处理机制，其特征在于，所述机器学习算法根据使用第一可微相关系数的训练目标进行操作，所述第一可微相关系数用于在整个批次上使所述批次的每个成员的输出值与所述每个成员在所述批次的成员中的相应评级之间的具有单调关系
。5.
根据权利要求4所述的处理机制，其特征在于，所述单调关系是线性关系
。6.
根据权利要求4或5所述的处理机制，其特征在于，所述第一可微相关系数是皮尔逊
(Pearson)
相关系数
。7.
根据权利要求3至6中任一项所述的处理机制，其特征在于，所述机器学习算法根据使用第二可微相关系数的训练目标进行操作，所述第二可微相关系数用于在整个批次上使所述批次的每个成员的输出值与所述每个成员在所述批次的成员中的相应评级之间的具有秩相关
。8.
根据权利要求7所述的处理机...

【专利技术属性】
技术研发人员：威廉，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人