一种使用神经网络编码或解码图像的方法和装置制造方法及图纸

技术编号：38635134 阅读：13 留言：0更新日期：2023-08-31 18:31

一种使用神经网络对图像进行编码或解码的方法和装置。本发明专利技术公开了对图像进行编码和对可表示经编码图像的码流进行解码的方法和系统。在编码和解码的过程中，缩放操作用于将输入缩放到可以通过神经网络中的一层处理的大小。本文中公开的实施例提供了减小码流大小的缩放所采用的方法，从而改进了压缩。从而改进了压缩。从而改进了压缩。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】一种使用神经网络编码或解码图像的方法和装置
[0001]本专利技术涉及一种使用神经网络对图像进行编码的方法和一种使用神经网络对图像进行解码的方法。本专利技术还涉及一种对图像进行编码的编码器和一种对图像进行解码的解码器以及一种计算机可读存储介质。

技术介绍

[0002]视频译码(视频编码和解码)广泛用于数字视频应用，例如，广播数字电视、基于互联网和移动网络的视频传输、视频聊天和视频会议等实时会话应用、DVD和蓝光光盘、视频内容采集和编辑系统以及安全应用的可携式摄像机。
[0003]即使视频相对较短，也需要大量的视频数据来描述，当数据要在带宽容量有限的通信网络中流式传输或以其它方式传输时，这样可能会造成困难。因此，视频数据通常要先压缩，然后通过现代电信网络进行传输。由于内存资源可能有限，当在存储设备中存储视频时，该视频的大小也可能是一个问题。视频压缩设备通常在信源侧使用软件和/或硬件对视频数据进行编码，然后传输或存储视频数据，从而减少表示数字视频图像所需的数据量。然后，对视频数据进行解码的视频解压缩设备在目的地侧接收压缩数据。在网络资源有限以及对更高视频质量的需求不断增长的情况下，需要改进压缩和解压缩技术，这些改进的技术能够在几乎不影响图像质量的情况下提高压缩比。
[0004]如今，神经网络和使用神经网络的深度学习技术已经在视频、图像等的编码和解码的
中使用了一段时间。
[0005]在这类情况下，码流通常表示或者是可以由包括值的二维矩阵合理表示的数据。例如，这适用于表示或者是图像、视频序列或类似数据的码流。除...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种使用神经网络(neural network，NN)对图像进行编码的方法，其特征在于，所述NN包括多个层，所述多个层包括至少一个下采样层(2110、2120、2130、2140)，所述至少一个下采样层将下采样应用于表示在至少一个维度上具有大小S的矩阵的输入(2101、2102、2103、2104)，所述方法包括：在使用所述至少一个下采样层处理(2311)所述输入之前，将缩放应用(2321)于所述输入，其中，所述缩放包括在所述至少一个维度上改变所述大小S，使得其中，r>1，r是所述至少一个下采样层的下采样比；在所述缩放之后，通过所述至少一个采样层(2110、2120、2130、2140)处理(2311)所述输入，并且提供(2312)具有大小S1<S的输出；在使用所述NN处理所述图像之后，提供码流作为所述NN的输出。2.根据权利要求1所述的方法，其特征在于，所述NN包括个下采样层，每个下采样层m(2110、2120、2130、2140)具有关联的下采样比r
m
>1，其中，m≤M，所述方法还包括：在使用下采样层m处理(2311)表示在至少一个维度上具有大小S
m
的矩阵的输入(2101、2102、2103、2104)之前，如果所述大小S
m
不是所述下采样层m的下采样比r
m
的整数倍，将缩放应用于所述输入，其中，所述缩放包括在所述至少一个维度上改变所述大小S
m
，使得其中，3.根据权利要求2所述的方法，其特征在于，在将所述缩放应用(2321)于所述具有大小S
m
的输入(2101、2102、2103、2104)之前，确定S
m
是否是所述下采样比r
m
的整数倍，如果确定S
m
不是所述下采样比r
m
的整数倍，所述缩放应用于所述输入，使得所述大小S
m
在所述至少一个维度上改变，使得其中，4.根据权利要求2或3所述的方法，其特征在于，如果所述输入(2101、2102、2103、2104)的大小S
m
是所述下采样层m(2110、2120、2130、2140)的下采样比r
m
的整数倍，则在通过所述下采样层m处理所述输入之前，所述输入不缩放到大小5.根据权利要求3或4所述的方法，其特征在于，所述确定S
m
是否是所述下采样比r
m
的整数倍包括：将所述大小S
m
与所述下采样层m(2110、2120、2130、2140)的允许输入大小进行比较。6.根据5所述的方法，其特征在于，所述下采样层m的允许输入大小是根据所述下采样比r
m
和所述大小S
m
中的至少一个计算的。7.根据权利要求5或6所述的方法，其特征在于，所述比较包括：计算S
m
与所述下采样层m(2110、2120、2130、2140)的允许输入大小之间的差值。8.根据权利要求5或7中任一项所述的方法，其特征在于，所述比较包括：确定或9.根据权利要求8所述的方法，其特征在于，确定的是如果则所述缩放应用于所述具有大小S
m
的输入。10.根据权利要求8所述的方法，其特征在于，确定的是如果
则所述缩放应用于所述具有大小S
m
的输入。11.根据权利要求10所述的方法，其特征在于，所述大小是根据所述下采样比r
m
和所述大小S
m
中的至少一个确定的。12.根据权利要求11所述的方法，其特征在于，所述大小是根据包括ceil、int、floor中的至少一个的函数确定的。13.根据权利要求12所述的方法，其特征在于，所述大小是根据确定的；或者所述大小是根据确定的；或者所述大小是根据确定的。14.根据权利要求2至13中任一项所述的方法，其特征在于，所述应用于下采样层m的输入(2101、2102、2103、2104)的缩放与其它下采样层的下采样比r
k
无关，其中，k≠m。15.根据权利要求1至14中任一项所述的方法，其特征在于，所述下采样层m的输入(2101、2102、2103、2104)在所述至少一个维度上具有大小S
m
，所述大小的值在所述下采样层m(2110、2120、2130、2140)的下采样比r
m
的最接近但小于所述大小的整数倍和所述下采样层m(2110、2120、2130、2140)的下采样比r
m
的最接近但大于所述大小的整数倍之间，所述输入的大小S
m
根据条件在所述缩放的过程中改变，以与所述下采样比r
m
的最接近但小于所述大小的整数倍匹配或者与所述下采样比r
m
的最接近但小于所述大小的整数倍匹配。16.根据权利要求1至15中任一项所述的方法，其特征在于，所述下采样层m的输入(2101、2102、2103、2104)在所述至少一个维度上具有大小S
m
，所述大小的值不是所述下采样层m(2110、2120、2130、2140)的下采样比r
m
的整数倍，所述输入的大小S
m
在所述缩放的过程中改变，以与所述下采样比r
m
的最接近但小于所述大小的整数倍匹配或者与所述下采样比r
m
的最接近但大于所述大小的整数倍匹配。17.根据权利要求1至16中任一项所述的方法，其特征在于，所述下采样层m的输入(2101、2102、2103、2104)在所述至少一个维度上具有大小S
m
，其中，lr
m
≤S
m
≤r
m
(l+1)，l和r
m
是所述下采样层m(2110、2120、2130、2140)的下采样比，所述大小S
m
根据条件缩放到或18.根据权利要求1至17所述的方法，其特征在于，如果所述输入(2101、2102、2103、2104)的大小S
m
更接近所述下采样层m(2110、2120、2130、2140)的下采样比r
m
的最接近但小于所述大小的整数倍，而不是更接近所述下采样比r
m
的最接近但大于所述大小的整数倍，则所述输入的大小S
m
减小到与所述下采样比r
m
的最接近但小于所述大小的整数倍匹配的大小19.根据权利要求18所述的方法，其特征在于，将所述输入(2101、2102、2103、2104)的大小S
m
减小到所述大小包括：裁剪所述输入。20.根据权利要求1至19中任一项所述的方法，其特征在于，如果所述输入(2101、2102、2103、2104)的大小S
m
更接近所述下采样层m(2110、2120、2130、2140)的下采样比r
m
的最接近
但大于所述大小的整数倍，而不是更接近所述下采样比r
m
的最接近但小于所述大小的整数倍，则所述输入的大小S
m
增大到与所述下采样比r
m
的最接近但大于所述大小的整数倍匹配的大小21.根据权利要求20所述的方法，其特征在于，将所述输入(2101、2102、2103、2104)的大小S
m
增大到所述大小包括：用0或用从所述具有大小S
m
的输入中获取到的填充信息来填充所述具有大小S
m
的输入。22.根据权利要求21所述的方法，其特征在于，所述从所述具有大小S
m
的输入中获取到的填充信息作为冗余填充信息，以将所述输入(2101、2102、2103、2104)的大小S
m
增大所述大小23.根据权利要求22所述的方法，其特征在于，所述用冗余填充信息来填充包括反射填充和重复填充中的至少一种。24.根据权利要求22或23所述的方法，其特征在于，所述填充信息是或包括所述具有大小S
m
的输入的至少一个值，所述至少一个值最接近所述输入(2101、2102、2103、2104)中要添加所述冗余填充信息的区域。25.根据权利要求1或13所述的方法，其特征在于，所述下采样层m(2110、2120、2130、2140)的输入(2101、2102、2103、2104)的大小S
m
增加到与所述下采样比r
m
的最接近但大于所述大小的整数倍匹配的大小26.根据权利要求17所述的方法，其特征在于，所述条件使用Min(|S
‑
lr
m
|,|S
‑
r
m
(l+1)|)，所述条件包括：如果Min产生|S
m
‑
lr
m
|，则所述输入的大小S
m
减小到如果Min产生|S
m
‑
(l+1)r
m
|，则所述输入的大小S
m
增加到27.根据权利要求26所述的方法，其特征在于，l是根据所述下采样层m(2110、2120、2130、2140)的输入的大小S
m
和所述下采样层m的下采样比r
m
中的至少一个确定的。28.根据权利要求27所述的方法，其特征在于，l是根据确定的和/或l+1是根据确定的。29.根据权利要求1至28中任一项所述的方法，其特征在于，所述下采样层(2110、2120、2130、2140)中的至少一个下采样层在两个维度上将下采样应用于所述输入(2101、2102、2103、2104)，第一维度上的下采样比等于第二维度上的下采样比。30.根据权利要求1至29中任一项所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：伊蕾娜，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人