用于以有损方式对图像或视频进行编码、传输和解码的方法及数据处理系统技术方案

技术编号:42093973 阅读:11 留言:0更新日期:2024-07-19 17:06
一种训练一个或更多个神经网络的方法,一个或更多个神经网络用于以有损方式对图像或视频进行编码、传输和解码,该方法包括以下步骤:在第一计算机系统处接收输入图像;使用第一神经网络对输入图像进行编码;以及使用第二神经网络对潜在表示进行解码,以产生输出图像;第一神经网络或第二神经网络的多个层中的至少一层包括变换;以及该方法还包括以下步骤:评估输出图像和输入图像之间的差异,并基于变换之输出来评估函数;基于评估出的差异和被评估的函数,更新第一神经网络和第二神经网络的参数;以及重复上述步骤。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍


技术实现思路

【技术保护点】

1.一种训练一个或更多个神经网络的方法,所述一个或更多个神经网络用于以有损方式对图像或视频进行编码、传输和解码,该方法包括以下步骤:

2.根据权利要求1所述的方法,其中,所述函数基于的是多个变换之多个输出,其中,每个变换位于所述第一神经网络或所述第二神经网络的所述多个层中的不同层中。

3.根据权利要求2所述的方法,其中,按预定值就所述多个输出中的每一个对所述函数评估的贡献而进行度量。

4.根据权利要求1至3中任一项所述的方法,其中,所述变换之输出包括多个值;以及

5.根据权利要求1至3中任一项所述的方法,其中,所述变换之输出包括多个值;以及...

【技术特征摘要】
【国外来华专利技术】

1.一种训练一个或更多个神经网络的方法,所述一个或更多个神经网络用于以有损方式对图像或视频进行编码、传输和解码,该方法包括以下步骤:

2.根据权利要求1所述的方法,其中,所述函数基于的是多个变换之多个输出,其中,每个变换位于所述第一神经网络或所述第二神经网络的所述多个层中的不同层中。

3.根据权利要求2所述的方法,其中,按预定值就所述多个输出中的每一个对所述函数评估的贡献而进行度量。

4.根据权利要求1至3中任一项所述的方法,其中,所述变换之输出包括多个值;以及

5.根据权利要求1至3中任一项所述的方法,其中,所述变换之输出包括多个值;以及

6.根据权利要求4或5所述的方法,其中,所述函数是基于所述多个值中的每一个的平方和绝对值的。

7.根据权利要求4至6中任一项所述的方法,其中,所述函数是基于所述多个值中的每一个的平均值的。

8.根据权利要求6或7所述的方法,其中,按预定值就所述平方和所述绝对值对所述函数评估的贡献而进行度量。

9.根据权利要求4至8中任一项所述的方法,其中,所述函数是附加地基于所述多个值的方差的。

10.根据权利要求1至9中任一项所述的方法,其中,按预定值就所述评估的函数对所述第一神经网络和所述第二神经网络的所述参数更新的贡献而进行度量。

11.根据权利要求1至10中任一项所述的方法,其中,按某一值就所述评估的函数对所述第一神经网络和所述第二神经网络的所述参数更新的贡献而进行度量;以及

12.根据权利要求1至11中任一项所述的方法,其中,所述第一神经网络或所述第二神经网络的所述多个层中的至少一层包括在所述变换之后应用的附加变换;以及

13.一种用于以有损方式对图像或视频进行编码、传输和解码的方法,该方法包括以下步骤:

14.一种用于以有损方式对图像或视频进行编码和传输的方法,该方法包括以下步骤:

15.一种用于以有损方式对图像或视频进行接收和解码的方法,该方法包括以下步骤:

16.一种数据处理系统,该数据处理系统被配置为执行权利要求1至13中任一项所述的方法。

17.一种数据处理设备,该数据处理设备被配置为执行权利要求14或15所述的方法。

18.一种计算机程序,该计算机程序包括指令,当所述程序由计算机执行时,所述指令使所述计算机执行权利要求14或15所述的方法。

19.一种计算机可读存储介质,该计算机可读存储介质包括指令,所述指令在由所述计算机执行时,使所述计算机执行权利要求14或15所述的方法。

20.一种用于以有损方式对图像和视频进行编码、传输和解码的方法,该方法包括以下步骤:

21.根据权利要求20所述的方法,其中,所述第一操作是线性运算。

22.根据权利要求20所述的方法,其中,所述第一操作是非线性运算。

23.根据权利要求20至22中任一项所述的方法,其中,所述第一操作是可微运算。

24.根据权利要求20至22中任一项所述的方法,其中,所述第一操作是不可微运算。

25.根据权利要求20至24中任一项所述的方法,其中,对所述恢复的潜值的先前获得的像素执行的操作包括矩阵运算。

26.根据权利要求20至25中任一项所述的方法,其中,所述操作中的至少一个包括显式迭代运算。

27.根据权利要求20至26中任一项所述的方法,其中,所述操作中的至少一个包括隐式迭代运算。

28.根据权利要求27所述的方法,其中,所述隐式迭代运算包括计算舍入函数;以及

29.根据权利要求1或2所述的方法,其中,所述第二操作包括迭代运算,所述迭代运算包含算子分裂。

30.根据权利要求29所述的方法,其中,所述迭代运算包括基于所述潜在表示和所述恢复的潜值来定义至少两个变量,并依次对所述至少两个变量中的每一个执行运算。

31.根据权利要求30所述的方法,其中,所述迭代运算包括定义至少两个另外的变量,它们分别与所述至少两个变量中的各一个变量的范围相对应,并且依次附加地对所述至少两个另外的变量中的每个变量执行运算。

32.根据权利要求29至31中任一项所述的方法,其中,所述迭代方法还包括在各迭代步骤之间的步骤,其中,基于所述至少两个变量中的一个变量的值与在先前迭代步骤中的该变量的值之间的差来修正该变量。

33.根据权利要求23至32中任一项所述的方法,其中,当所述矩阵运算为负定的,每个运算都是下降步骤。

34.根据权利要求23至32中任一项所述的方法,其中,当所述矩阵运算为奇异的,将一个附加项引入所述迭代方法中,以针对所述第二操作获得唯一解。

35.根据权利要求23至34中任一项所述的方法,其中,所述第二操作包括对所述矩阵运算执行调整运算。

36.根据权利要求20至35中任一项所述的方法,其中,所述第一操作包括量化操作。

37.根据权利要求20至36中任一项所述的方法,其中,所述第一操作是附加地基于与所述恢复的潜在表示相对应的潜值的;以及

38.根据权利要求20至36中任一项所述的方法,其中,所述第一操作是附加地基于与所述恢复的潜在表示相对应的潜值的;以及

39.根据权利要求20至38中任一项所述的方法,该方法还包括以下步骤:

40.一种训练一个或更多个神经网络的方法,所述一个或更多个神经网络用于以有损方式对图像或视频进行编码、传输和解码,该方法包括以下步骤:

41.根据权利要求40所述的方法,该方法还包括以下步骤:

42.一种用于以有损方式对图像或视频进行编码和传输的方法,该方法包括以下步骤:

43.一种用于以有损方式对图像或视频进行接收和解码的方法,该方法包括以下步骤:

44.一种数据处理系统,该数据处理系统被配置为执行权利要求20至41中任一项所述的方法。

45.一种数据处理设备,该数据处理设备被配置为执行权利要求42或43所述的方法。

46.一种计算机程序,该计算机程序包括指令,当所述程序由计算机执行时,所述指令使得所述计算机实施根据权利要求42或43所述的方法。

47.一种计算机可读存储介质,该计算机可读存储介质包括指令,所述指令在被计算机执行时,使得所述计算机实施根据权利要求42或43所述的方法。

48.一种用于...

【专利技术属性】
技术研发人员:克里斯·芬利乔纳森·雷纳徐阳C·贝森布鲁赫阿尔萨兰·扎法尔S·西泽尔V·科什金纳
申请(专利权)人:荻蒲仁德科技
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1