用于图像编解码的方法和装置制造方法及图纸

技术编号：24422100 阅读：29 留言：0更新日期：2020-06-06 14:39

提供一种用于图像编解码的方法和装置。该方法包括：利用第一神经网络模型提取原始图像的特征，作为原始图像的变换结果；根据第一神经网络模型的参数，生成非均匀的量化参数；根据量化参数，对原始图像的变换结果进行量化，得到原始图像的量化结果；根据原始图像的量化结果，生成原始图像的解码图像；根据原始图像和解码图像之间的差异，利用反向传播算法，对第一神经网络模型的参数进行更新；重复执行上述步骤，直到原始图像和解码图像之间的差异满足预设条件。采用基于神经网络模型的编码方式对图像进行编码，且在编码过程中采用非均匀量化参数进行量化，使得量化结果能够更好地保留原图的信息。

Methods and devices for image coding and decoding

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于图像编解码的方法和装置本专利文件披露的内容包含受版权保护的材料。该版权为版权所有人所有。版权所有人不反对任何人复制专利与商标局的官方记录和档案中所存在的该专利文件或者该专利披露。
本申请涉及图像编解码领域，并且更为具体地，涉及一种用于图像编解码的方法和装置。
技术介绍
随着便携式设备和社交媒体(如微信，微博等)的广泛应用，每天有海量的图像在网络上传播。如果不对图像的大小进行压缩，将导致存储空间占用量大、网络信息传播速度慢等问题。图像中包含大量的冗余信息，因此可以利用图像压缩算法对图像进行压缩，从而减少存储空间，并提高网络信息的传输速度。传统的图像压缩算法一般包括变换、量化、熵编码等操作。利用变换操作可以提取图像特征。传统变换操作包括离散余弦变换(discretecosinetransform，DCT)或离散小波变换(discretewavelettransform，DWT)，均是利用人工先验知识提取图像特征。利用人工先验知识提取出的图像特征表达能力不够强。最近，基于神经网络模型的图像编解码技术被提出，其可以利用神经网络模型执行变换操作。与传统变换方式相比，利用神经网络模型进行变换之后得到的图像特征表达能力更强，更加符合人眼的特性。
技术实现思路
本申请提供一种用于图像编解码的方法和装置，能够改善基于神经网络模型的图像编解码方式。第一方面，提供一种用于图像编解码的方法，包括：利用第一神经网络模型提取原始图像的特征，作为所述原始图像的变换结果；根据第一神经网...

【技术保护点】
1.一种用于图像编解码的方法，其特征在于，包括：/n利用第一神经网络模型提取原始图像的特征，作为所述原始图像的变换结果；/n根据第一神经网络模型的参数，生成非均匀的量化参数；/n根据所述量化参数，对所述原始图像的变换结果进行量化，得到所述原始图像的量化结果；/n根据所述原始图像的量化结果，生成所述原始图像的解码图像；/n根据所述原始图像和所述解码图像之间的差异，利用反向传播算法，对所述第一神经网络模型的参数进行更新；/n重复执行上述步骤，直到所述原始图像和所述解码图像之间的差异满足预设条件。/n

【技术特征摘要】
【国外来华专利技术】1.一种用于图像编解码的方法，其特征在于，包括：
利用第一神经网络模型提取原始图像的特征，作为所述原始图像的变换结果；
根据第一神经网络模型的参数，生成非均匀的量化参数；
根据所述量化参数，对所述原始图像的变换结果进行量化，得到所述原始图像的量化结果；
根据所述原始图像的量化结果，生成所述原始图像的解码图像；
根据所述原始图像和所述解码图像之间的差异，利用反向传播算法，对所述第一神经网络模型的参数进行更新；
重复执行上述步骤，直到所述原始图像和所述解码图像之间的差异满足预设条件。

2.根据权利要求1所述的方法，其特征在于，所述根据第一神经网络模型的参数，生成非均匀的量化参数，包括：
根据所述第一神经网络模型的参数，计算所述第一神经网络模型的概率密度；
根据所述第一神经网络模型的概率密度，生成使得所述第一神经网络模型计算出的变换结果的量化误差最小的所述量化参数。

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述原始图像的量化结果，生成所述原始图像的解码图像，包括：
对所述原始图像的包含所述量化结果在内的待编码符号进行熵编码，得到所述原始图像的码流；
根据所述原始图像的码流，生成所述原始图像的解码图像。

4.根据权利要求3所述的方法，其特征在于，所述对所述原始图像的包含所述量化结果在内的待编码符号进行熵编码，包括：
根据所述待编码符号中的当前符号的上下文，通过第二神经网络模型，预测所述当前符号出现的概率；
根据所述当前符号出现的概率，对所述当前符号进行编码。

5.根据权利要求4所述的方法，其特征在于，所述第二神经网络模型为卷积神经网络模型，所述第二神经网络模型的卷积核包括所述当前符号的已知上下文中的符号对应的权值和未知上下文中的符号对应的权值，其中所述未知上下文中的符号对应的权值为0。

6.根据权利要求1-5中任一项所述的方法，其特征在于，所述解码图像对应的解码过程是基于第三神经网络模型进行的，所述反向传播算法还用于对所述第三神经网络模型的权值进行更新。

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述第一神经网络模型为卷积神经网络模型。

8.一种用于图像编解码的装置，...

【专利技术属性】
技术研发人员：蔡剑锐，曹子晟，胡攀，
申请(专利权)人：深圳市大疆创新科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人