通过自举法对感知质量模型不确定性进行量化制造技术

技术编号：26927579 阅读：58 留言：0更新日期：2021-01-01 22:58

在各种实施例中，自举训练子系统对包括主观评分的训练数据库执行(一个或多个)采样操作，以生成重采样数据集。对于每个重采样数据集，自举训练子系统执行(一个或多个)机器学习操作，以生成不同的自举感知质量模型。自举训练子系统随后使用自举感知质量模型，对由基线感知质量模型针对经编码视频内容的部分生成的感知质量评分的准确性进行量化。有利的是，相对于感知质量评分的准确性未知的现有技术，自举感知质量模型使得开发者和软件应用能够基于感知质量评分得出更有效的结论和/或更可靠地优化编码操作。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】通过自举法对感知质量模型不确定性进行量化相关申请的交叉引用本申请要求于2018年3月20日递交的序列号为62/645,774(律师案卷号：NETF0191USL)的美国临时专利申请、于2018年11月14日递交的序列号为62/767,454(律师案卷号：NETF0228USL)的美国临时专利申请、于2019年3月13日递交的序列号为16/352,755(律师案卷号：NETF0191US1)的美国专利申请、以及于2019年3月13日递交的序列号为16/352,757(律师案卷号：NETF0191US2)的美国专利申请的优先权。这些相关申请的主题通过引用结合于此。
本专利技术的实施例一般地涉及计算机科学和视频技术，更具体地涉及用于通过自举法(bootstrapping)对感知质量模型不确定性进行量化的技术。
技术介绍
高效且准确地对源视频进行编码是高质量源视频的实时递送的重要方面。由于经编码源视频的质量变化，通常实施质量控制来确保从经编码源视频得出的重建源视频的视觉质量(观看者感知的视觉质量)是可接受的。对重建源视频的视觉质量进行手工核实是令人望而却步地耗时的。因此，自动预测经编码视频质量通常是编码和流传输基础设施的组成部分。例如，在评估编码器/解码器(编解码器)并微调流传输比特率时一般采用自动的经编码视频质量预测来优化经编码视频的质量。一种自动预测经编码视频质量的方法包括：基于与一组经编码训练视频相关联的原始意见评分执行机器学习操作，以生成感知质量模型。原始意见评分是由一组人类主体在观看从该组经...

【技术保护点】
1.一种计算机实现的方法，包括：/n对包括主观评分的训练数据库执行一个或多个采样操作，以生成多个重采样数据集；/n对于每个重采样数据集，基于该重采样数据集执行一个或多个机器学习操作，以生成不同的自举感知质量模型；以及/n基于所述自举感知模型执行一个或多个操作，以对由基线感知质量模型针对经编码视频内容部分生成的感知质量评分的准确性进行量化。/n

【技术特征摘要】
【国外来华专利技术】20180320 US 62/645,774;20181114 US 62/767,454;20191.一种计算机实现的方法，包括：
对包括主观评分的训练数据库执行一个或多个采样操作，以生成多个重采样数据集；
对于每个重采样数据集，基于该重采样数据集执行一个或多个机器学习操作，以生成不同的自举感知质量模型；以及
基于所述自举感知模型执行一个或多个操作，以对由基线感知质量模型针对经编码视频内容部分生成的感知质量评分的准确性进行量化。

2.如权利要求1所述的计算机实现的方法，进一步包括：基于所述训练数据库执行一个或多个机器学习操作，以生成所述基线感知质量模型。

3.如权利要求1所述的计算机实现的方法，其中，所述感知质量模型和所述自举感知质量模型中的每个模型将描绘经编码视频内容的一组特征的一组特征值映射到不同的感知质量评分。

4.如权利要求3所述的计算机实现的方法，其中，所述一组特征包括附加损伤度量(ADM)特征、视觉信息保真度(VIF)特征、盲/无参考图像空间质量评估器(BRISQUE)特征以及时间信息(TI)特征中的至少一者。

5.如权利要求1所述的计算机实现的方法，其中，执行所述一个或多个采样操作包括：对所述训练数据库中包括的与训练经编码视频内容的各部分相关联的特征值执行一个或多个重采样替换操作。

6.如权利要求1所述的计算机实现的方法，其中，执行所述一个或多个采样操作包括：对所述主观评分执行一个或多个重采样替换操作，以生成多个重采样主观矩阵。

7.如权利要求1所述的计算机实现的方法，其中，执行所述一个或多个采样操作包括：
对所述训练数据库中包括的与经编码内容的各部分相关联的特征值执行一个或多个重采样替换操作，以生成多个重采样特征矩阵；以及
对所述主观评分执行一个或多个重采样替换操作，以生成多个重采样主观矩阵。

8.如权利要求7所述的计算机实现的方法，进一步包括：将所述多个重采样特征矩阵中包括的每个重采样特征矩阵与所述多个重采样主观矩阵中包括的每个重采样主观矩阵进行组合，以生成所述多个重采样数据集。

9.如权利要求1所述的计算机实现的方法，其中，基于所述自举感知模型执行所述一个或多个操作包括：对于每个自举感知模型，基于所述经编码视频内容部分生成不同的自举感知质量评分，其中，所述自举感知质量评分的分布量化了所述感知质量评分的准确性。

10.如权利要求1所述的计算机实现的方法，其中，基于所述自举感知模型执行所述一个或多个操作包括：
对于每个自举感知模型，基于所述经编码视频内容部分生成不同的自举感知质量评分；以及
基于所述自举感知质量评分和置信等级计算置信区间。

11.一种或多种非暂态计算机可读介质，包括指令，所述指令在由一个或多个处理器执行时使得所述一个或多个处理器执行以下步骤：
对包括主观评分的训练数据库执行一个或多个采样操作，以生成多个重采样数据集；
对于每个重采样数据集，基于该重采样数据集执行一个或多个机器学习操作，以生成不同的自举感知质量模型；以及
基于所述自举感知模型和经编码视频内容部分计算多个自举感知质量评分，以对由基线感知质量模型针对所述经编码视频内容部分生成的感知质量评分的准确性进行量化。

12.如权利要求11所述的一种或多种非暂态计算机可读介质，其中，所述主观评分中包括的第一主观评分是由人响应于观看所述训练数据库中包括的经编码视频内容部分的重建版本而指派的。

13.如权利要求11所述的一种或多种非暂态计算机可读介质，其中，所述感知质量评分是视频多方法评估融合(VMAF)度量的值。

14.如权利要求11所述的一种或多种非暂态计算机可读介质，其中，执行所述一个或多个采样操作包括：对所述训练数据库中包括的与训练经编码视频内容的各部分相关联的特征值执行一个或多个重采样替换操作。

15.如权利要求11所述的一种或多种非暂态计算机可读介质，其中，执行所述一个或多个采样操作包括：对所述主观评分执行一个或多个重采样替换操作，以生成多个重采样主观矩阵。

16.如权利要求15所述的一种或多种非暂态计算机可读介质，进一步包括：对所述多个重采样主观矩阵中包括的每个重采样主观矩阵执行一个或多个聚合操作，以生成多个主观向量。

17.如权利要求11所述的一种或多种非暂态计算机可读介质，其中，执行所述一个或多个采样操作包括：
对所述训练数据库中包括的与经编码内容的各部分相关联的特征值执行一个或多个重采样替换操作，以生成多个重采样特征矩阵；以及
对所述主观评分执行一个或多个重采样替换操作，以生成多个重采样主观矩阵。

18.如权利要求17所述的一种或多种非暂态计算机可读介质，进一步包括：将所述多个重采样特征矩阵中包括的每个重采样特征矩阵与所述多个重采样主观矩阵中包括的每个重采样主观矩阵进行组合，以生成所述多个重采样数据集。

19.如权利要求11所述的一种或多种非暂态计算机可读介质，进一步包括：基于所述多个自举感知质量评分和置信等级计算置信区间。

20.一种系统，包括：
一个或多个存储器，存储指令；以及
一个或多个处理器，耦合到所述一个或多个存储器，并且在执行所述指令时被配置为：
对包括主观评分和特征值的训练数据库执行一个或多个重采样替换操作，以生成多个重采样数据集；
对于每个重采样数据集，基于该重采样数据集执行一个或多个机器学习操作，以生成不同的自举感知质量模型；以及
基于所述自举感知模型执行一个或多个操作，以对由基线感知质量模型针对经编码视频内容部分生成的感知质量评分的准确性进行量化。
<...

【专利技术属性】
技术研发人员：克里斯托斯·巴皮斯，李智，拉瓦尼亚·沙兰，朱莉·诺瓦克，马丁·丁利，
申请(专利权)人：奈飞公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人