使用神经网络模型的可变比特率压缩制造技术

技术编号:38852478 阅读:11 留言:0更新日期:2023-09-17 09:59
一种用于操作人工神经网络(ANN)的计算机实现的方法,包括:接收输入。生成该输入的隐性表示。根据基于习得的隐性缩放参数的比特率来传达该隐性表示。该隐性缩放参数是基于通道索引和与平衡该比特率和失真的值相对应的折衷参数值来习得的。参数值来习得的。参数值来习得的。

【技术实现步骤摘要】
【国外来华专利技术】使用神经网络模型的可变比特率压缩
[0001]相关申请的交叉引用
[0002]本申请要求于2022年1月11日提交的题为“Variable Bit Rate compression using neural network models(使用神经网络模型的可变比特率压缩)”的美国专利申请No.17/573,568的优先权,其要求于2021年1月12日提交的题为“Variable Bit Rate compression using neural network models(使用神经网络模型的可变比特率压缩)”的美国临时专利申请No.63/136,607的权益,这些申请的公开内容通过援引整体明确纳入于此。
[0003]公开领域
[0004]本公开的各方面一般涉及神经网络,并且更具体地涉及使用人工神经网络的图像压缩。
[0005]背景
[0006]人工神经网络可包括诸群互连的人工神经元(例如,神经元模型)。人工神经网络可以是计算设备或表示为要由计算设备执行的方法。卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合,其中每个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)(诸如深度卷积神经网络(DCN))具有众多应用。具体而言,这些神经网络架构被用于各种技术,诸如图像识别、模式识别、语音识别、自动驾驶和其他分类任务。
[0007]神经网络在多媒体压缩(诸如视频压缩和图像压缩)中得到了成功的应用。图像压缩有益于传达多媒体,诸如图像和视频。然而,用户可包括具有不同计算能力的不同计算机架构,并且可以在不同的网络状况下操作此类设备。提供多个比特率可以在更多计算能力可用或在更好的网络状况下时允许传送更多数据或更高质量的图像,或者在计算能力有限或网络状况差时允许传送更少的数据或更低质量的图像。在常规技术下,将针对不同比特率训练单独的模型以提供多个比特率,因此从存储角度来看,计算效率低且成本高。
[0008]概述
[0009]本公开在独立权利要求中分别阐述。本公开的一些方面在从属权利要求中描述。
[0010]在本公开的一方面,提供了一种用于操作人工神经网络(ANN)的计算机实现的方法。该计算机实现的方法包括由该ANN接收输入。该计算机实现的方法还包括经由ANN生成该输入的隐性表示。该计算机实现的方法进一步包括根据基于习得的隐性缩放参数的比特率来传达该隐性表示。
[0011]在本公开的另一方面,提供了一种用于操作人工神经网络(ANN)的装置。该装置包括存储器以及耦合到该存储器的一个或多个处理器。(诸)处理器被配置成由该ANN接收输入。(诸)处理器还被配置成经由该ANN生成该输入的隐性表示。(诸)处理器被进一步配置成根据基于习得的隐性缩放参数的比特率来传达该隐性表示。
[0012]在本公开的另一方面,提供了一种用于操作人工神经网络(ANN)的设备。该设备包括用于由该ANN接收输入的装置。该设备还包括用于经由ANN生成该输入的隐性表示的装置。该设备进一步包括用于根据基于习得的隐性缩放参数的比特率来传达该隐性表示的装
置。
[0013]根据本公开的另一方面,提供了一种非瞬态计算机可读介质。该计算机可读介质上编码有用于操作人工神经网络(ANN)的程序代码。该程序代码由处理器执行,并且包括用于由该ANN接收输入的代码。该程序代码还包括用于经由该ANN生成该输入的隐性表示的代码。该程序代码进一步包括用于根据基于习得的隐性缩放参数的比特率来传达该隐性表示的代码。
[0014]在本公开的另一方面,提供了一种用于操作人工神经网络(ANN)的计算机实现的方法。该计算机实现的方法包括由该ANN接收输入比特流。该计算机实现的方法还包括将习得的隐性缩放参数应用于该输入比特流以恢复输入的隐性表示。该计算机实现的方法进一步包括经由该ANN解码该隐性表示以生成该输入的重构。
[0015]在本公开的另一方面,提供了一种用于操作人工神经网络(ANN)的装置。该装置包括存储器以及耦合到该存储器的一个或多个处理器。(诸)处理器被配置成由该ANN接收输入比特流。(诸)处理器还被配置成将习得的隐性缩放参数应用于该输入比特流以恢复输入的隐性表示。(诸)处理器被进一步配置成经由该ANN解码该隐性表示以生成该输入的重构。
[0016]在本公开的另一方面,提供了一种用于操作人工神经网络(ANN)的设备。该设备包括用于由该ANN接收输入比特流的装置。该设备还包括用于将习得的隐性缩放参数应用于该输入比特流以恢复输入的隐性表示的装置。该设备进一步包括用于经由该ANN解码该隐性表示以生成该输入的重构的装置。
[0017]根据本公开的另一方面,提供了一种非瞬态计算机可读介质。该计算机可读介质上编码有用于操作人工神经网络(ANN)的程序代码。该程序代码由处理器执行,并且包括用于由该ANN接收输入的代码。该程序代码还包括用于将习得的隐性缩放参数应用于该输入比特流以恢复输入的隐性表示的代码。该程序代码进一步包括用于经由该ANN解码该隐性表示以生成该输入的重构的代码。
[0018]本公开的附加特征和优点将在下文描述。本领域技术人员应当领会,本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到,这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而,要清楚理解的是,提供每一幅附图均仅用于解说和描述目的,且无意作为对本公开的限定的定义。
[0019]附图简述
[0020]在结合附图理解下面阐述的详细描述时,本公开的特征、本质和优点将变得更加明显,在附图中,相同附图标记始终作相应标识。
[0021]图1解说了根据本公开的某些方面的使用片上系统(SOC)(包括通用处理器)的神经网络的示例实现。
[0022]图2A、2B和2C是解说根据本公开的各方面的神经网络的示图。
[0023]图2D是解说根据本公开的各方面的示例性深度卷积网络(DCN)的示图。
[0024]图3是解说根据本公开的各方面的示例性深度卷积网络(DCN)的框图。
[0025]图4是解说根据本公开的各方面的可使人工智能(AI)功能模块化的示例性软件架构400的框图。
[0026]图5是解说根据本公开的各方面的可变比特率模型的示例架构的框图。
[0027]图6A是解说根据本公开的各方面的可变比特率模型的示例架构的框图。
[0028]图6B是解说根据本公开的各方面的用于表示输入的隐性空间的通道的示图。
[0029]图6C是解说根据本公开的各方面的示例隐性空间的框图。
[0030]图6D是解说根据本公开的各方面的用于可变比特率的架构的框图。
[0031]图7A和7B是解说根据本公开的各方面的用于缩放量化比特宽度的示例钟形曲线的示图。
[0032]图8是解说根据本公开的各本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于操作人工神经网络(ANN)的计算机实现的方法,包括:由所述ANN接收输入;经由所述ANN生成所述输入的隐性表示;以及根据基于习得的隐性缩放参数的比特率来传达所述隐性表示。2.如权利要求1所述的计算机实现的方法,其中所述隐性缩放参数是基于通道索引和折衷参数来习得的。3.如权利要求2所述的计算机实现的方法,其中所述隐性缩放参数被配置成响应于所述隐性缩放参数相对于通道中的隐性表示的值高于预定义阈值而丢弃所述通道。4.如权利要求2所述的计算机实现的方法,其中所述折衷参数对应于平衡所述比特率和失真的值。5.如权利要求4所述的计算机实现的方法,其中所述折衷参数包括在所述ANN的训练期间一起训练的不同折衷参数的阵列,并且与所述不同折衷参数中的每一者相对应的损耗被均衡。6.如权利要求5所述的计算机实现的方法,进一步包括:应用均衡,使得低比特率点的第一损耗值和高比特率点的第二损耗值被均衡。7.如权利要求6所述的计算机实现的方法,其中所述均衡包括普通均衡。8.如权利要求6所述的计算机实现的方法,其中所述均衡包括切线均衡。9.一种用于操作人工神经网络(ANN)的计算机实现的方法,包括:由所述ANN接收输入比特流;将习得的隐性缩放参数应用于所述输入比特流以恢复输入的隐性表示;以及经由所述ANN解码所述隐性表示以生成所述输入的重构。10.如权利要求9所述的计算机实现的方法,其中所述隐性缩放参数是基于通道索引和折衷参数来习得的。11.如权利要求10所述的计算机实现的方法,其中所述折衷参数对应于平衡比特率和失真的值。12.一种用于操作人工神经网络(ANN)的装置,包括:存储器;以及耦合到所述存储器的...

【专利技术属性】
技术研发人员:Y
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1