多媒体的量化处理方法、装置及编码、解码设备制造方法及图纸

技术编号：34088418 阅读：36 留言：0更新日期：2022-07-11 20:35

本申请实施例公开了一种多媒体的量化处理方法、装置及编码、解码设备，该多媒体的量化处理方法包括：获取状态预测器的输入数据；获取状态预测器的映射函数；基于映射函数对输入数据进行预测处理，得到源数值x

全部详细技术资料下载

【技术实现步骤摘要】
多媒体的量化处理方法、装置及编码、解码设备

[0001]本申请涉及计算机
，尤其涉及多媒体编码
，具体涉及一种多媒体的量化处理方法、一种多媒体的量化处理装置、一种编码设备、一种解码设备。

技术介绍

[0002]量化是多媒体数据(例如视频、音频、图像等)编码技术的核心过程，依赖性标量量化(Dependent Quantization，DQ)是多媒体数据编码技术中采用的一种量化方式，依赖性标量量化是指将量化过程与量化状态的转换过程相结合的量化技术。目前，依赖性标量量化通常采用人工设计的状态机，状态机一旦设计完成，状态机中量化器(quantizer)的数量和量化状态的数量往往是固定不变的；当量化器的数量改变或者量化状态的数量改变时，需要重新设计状态机；在量化器的数量较多或者量化状态的数量较多的情况下，状态机往往比较复杂，仅凭人工无法完成状态机的设计。因此，如何降低状态机的设计成本以及如何设计支持任意数量的量化状态的状态机成为当前研究的热点问题。

技术实现思路

[0003]本申请实施例提供了一种多媒体的量化处理方法、装置及编码、解码设备，可以训练得到支持任意数量的量化状态之间自动转换的状态预测器，有效降低状态预测器的设计成本。
[0004]第一方面，本申请实施例提供一种多媒体的量化处理方法，该多媒体的量化处理方法包括：
[0005]获取状态预测器的输入数据；其中，输入数据包括源数值x
i
对应的历史量化值序列和历史量化状态序列；源数值x
i
是源序列...

【技术保护点】

【技术特征摘要】
1.一种多媒体的量化处理方法，其特征在于，所述方法包括：获取状态预测器的输入数据；其中，所述输入数据包括源数值x
i
对应的历史量化值序列和历史量化状态序列；所述源数值x
i
是源序列X中的第i个源数值，i为正整数；所述源序列X是对多媒体数据进行采样得到的；所述历史量化值序列中包含y
i
‑
(m
‑
1)
、y
i
‑
(m
‑
2)
至y
i
共m个按序排列的量化值，量化值y
i
是在量化状态s
i
‑1下对所述源数值x
i
进行键值计算得到的；所述量化值y
i
之前的m
‑
1个量化值是对所述源序列X中位于所述源数值x
i
之前的m
‑
1个源数值依次进行键值计算得到的，m为正整数；所述历史量化状态序列包含s
i
‑
n
、s
i
‑
(n
‑
1)
至s
i
‑1共n个按序排列的量化状态，所述量化状态s
i
‑1之前的n
‑
1个量化状态是指对所述m
‑
1个源数值进行键值计算时对应的量化状态，n为正整数；获取所述状态预测器的映射函数，所述映射函数用于表示N个量化状态与J个动作之间的映射关系；N、J均为正整数，N的取值由所述输入数据中的m和n确定；所述J个动作中的任一个动作用于表示从所述N个量化状态中选取一个量化状态作为所述源序列X中的源数值x
i+1
对应的量化状态的操作；基于所述映射函数对所述输入数据进行预测处理，得到所述源数值x
i+1
对应的量化状态s
i
；根据所述源数值x
i+1
和所述量化状态s
i
更新所述映射函数，以训练所述状态预测器。2.如权利要求1所述的方法，其特征在于，所述映射函数采用映射表表示；所述映射表包含N行J列，所述映射表的第p行表示所述N个量化状态中的任一个，p为正整数且p≤N；所述映射表的第j列表示所述J个动作中的任一个，j为正整数且j≤J；所述第p行与所述第j列相交的表格项包括在所述第p行的量化状态下执行所述第j列的动作a
ij
时能够获得的奖励值v
jp
；所述基于所述映射函数对所述输入数据进行预测处理，得到所述源数值x
i+1
对应的量化状态s
i
；包括：基于所述输入数据确定所述映射表；按照预测算法从所述映射表中选择所述量化状态s
i
。3.如权利要求2所述的方法，其特征在于，所述预测算法包括贪婪算法；所述按照预测算法从所述映射表中选择所述量化状态s
i
，包括：按照第一贪婪概率从所述映射表中随机选择目标动作；或者，按照第二贪婪概率从所述映射表中选择最大奖励值对应的目标动作；将所述目标动作对应的量化状态确定为所述量化状态s
i
；其中，所述第一贪婪概率的取值范围为[0，1]，所述第二贪婪概率的取值范围为[0，1]，并且所述第一贪婪概率与所述第二贪婪概率之和为1。4.如权利要求1所述的方法，其特征在于，所述根据所述源数值x
i+1
和所述量化状态s
i
更新所述映射函数，包括：在所述量化状态s
i
下对所述源数值x
i+1
进行量化处理，得到量化值y
i+1
；基于所述映射函数对所述输入数据进行预测处理，得到源数值x
i+2
对应的量化状态s
i+1
；根据所述量化值y
i+1
和所述量化状态s
i+1
，重构得到所述源数值x
i+1
对应的重构数值x
′
i+1
；
基于所述源数值x
i+1
获取目标源序列，基于所述重构数值x
′
i+1
获取目标重构序列以及基于所述量化值y
i+1
获取目标量化值序列；其中，所述目标源序列包括x1、x2到x
i+1
共i+1个按序排列的源数值，所述目标重构序列包括x
′1、x
′2到x
′
i+1
共i+1个按序排列的重构数值，所述目标量化值序列包括y1、y2到y
i+1
共i+1个按序排列的量化值；根据所述目标源序列、所述目标重构序列及所述目标量化值序列，确定奖励函数；根据所述奖励函数对所述映射函数进行更新。5.如权利要求4所述的方法，其特征在于，所述根据所述目标源序列、所述目标重构序列及所述目标量化值序列，确定奖励函数，包括：计算所述目标源序列与所述目标重构序列之间的编码失真值；以及，计算所述目标量化值序列的编码比特消耗值；根据所述编码失真值和所述编码比特消耗值确定所述奖励函数。6.如权利要求4所述的方法，其特征在于，所述方法还包括：获取所述N个量化状态中的每个量化状态对应的量化位置；计算各个所述量化位置的率失真损失；若所述量化值y
i
的量化位置的率失真损失为各个所述量化位置的率失真损失中的最小值，则将所述奖励函数赋值为第一数值；若所述量化值y
i
的量化位置的率失真损失不是各个所述量化位置的率失真损失中的最小值，则将所述奖励函数赋值为第二数值。7.如权利要求1所述的方法，其特征在于，所述方法还包括：获取所述历史量化值序列的替代序列，并根据所述替代序列对所述输入数据进行替代；所述基于所述映射函数对所述输入数据进行预测处理，得到所述源数值x
i+1
对应的量化状态s
i
，包括：基于所述映射函数对替代后的所述输入数据进行预测处理，得到所述源数值x
i+1
对应的所述量化状态s
i
。8.如权利要求7所述的方法，其特征在于，所述获取所述历史量化值序列的替代序列，并根据所述替代序列对所述输入数据进行替代，包括：若所述量化值y
i
是奇数，则确定所述量化值y
i
的奇偶性替代值为第三数值；若所述量化值y
i
是偶数，则确定所述量化值y
i
的奇偶性替代值为第四数值；根据所述历史量化值序列中的各个量化值的奇偶性替代值，生成所述替代序列；采用所述替代序列对所述输入数据中的所述历史量化值序列进行替代。9.如权利要求1至...

【专利技术属性】
技术研发人员：何召亮，李松南，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人