当前位置: 首页 > 专利查询>英特尔公司专利>正文

利用快速低时延比特流大小控制的视频编码的方法和系统技术方案

技术编号：40902319 阅读：5 留言：0更新日期：2024-04-18 11:20

与利用快速低时延比特流大小控制的视频编码相关的技术包括检测离群值并且基于离群值和强化学习来确定目标比特流大小。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

技术介绍

技术实现思路

【技术保护点】

1.一种视频编码的计算机实现的方法，包括：

2.根据权利要求1所述的方法，其中，关系函数是线性回归函数。

3.根据权利要求1或2所述的方法，其中，关系函数的确定包括通过使用与多个帧相关联的时延反馈和比特流大小反馈的平均来确定函数的参数。

4.根据权利要求1至3中任一项所述的方法，其中，一个或多个离群值的确定包括生成相对于关系函数的离群值阈值，以确定时延反馈和对应的比特流大小反馈的反馈对是否足够接近于拟合到关系函数。

5.根据权利要求4所述的方法，其中，反馈对是在存储器中可访问的并且用于形成时延反馈和比特流大小反馈的单独平均的反馈对的集合中的最后接收的反馈对。

6.根据权利要求4所述的方法，其中，设置包括调整关系函数的至少一个参数，使得反馈对拟合到关系函数上，或者被认为足够接近关系函数。

7.根据权利要求1所述的方法，包括取决于时延阈值和关系函数的参数来确定目标比特流大小。

8.根据权利要求1所述的方法，包括通过使用强化学习来细化初始目标比特流大小，其中奖励与反馈相关联。

9.根据权利要

10.至少一种非暂时性制品，具有至少一个机器可读介质，所述至少一个机器可读介质包括多个指令，所述多个指令响应于在计算设备上执行，使得计算设备通过以下内容操作：

11.根据权利要求10所述的制品，其中，通过使用反馈和初始目标比特流大小来生成强化学习状态。

12.根据权利要求11所述的制品其中，状态包括多个帧上的趋势，所述趋势包括比特流大小反馈趋势、时延反馈趋势和初始目标比特流大小趋势。

13.根据权利要求10至12中任一项所述的制品，其中，强化学习的动作器策略包括使用双Q学习表，双Q学习表填充有按照可用状态和每个状态的可用动作值排序的表值。

14.根据权利要求13所述的制品，其中，通过使用奖励和比特流大小反馈和时延反馈的预期反馈对来计算表值。

15.根据权利要求14所述的制品，其中，指令被布置成使得计算设备生成输出目标比特流大小，包括通过使用动作器来修改初始目标比特流大小。

16.根据权利要求10至15中任一项所述的制品，其中，强化学习包括使用动作器策略，其生成作为可用的多个动作之一的动作，可用的多个动作中的每一个与比特流大小的不同帧之间改变速度相关联。

17.根据权利要求10至16中任一项所述的制品，其中，由强化学习生成的动作是应用于初始目标比特流大小的滤波器系数。

18.根据权利要求10所述的制品其中，初始目标比特流大小的生成包括确定关系函数和相对于关系函数的离群值，离群值指示传输编码的视频帧的网络的状况的突然改变；以及使用离群值来修改关系函数。

19.一种计算机实现的系统，包括：

20.根据权利要求19所述的系统，其中，强化学习包括更新两个双Q学习表，包括随机选择两个表中的一个来更新。

21.根据权利要求19或20所述的系统，其中，强化学习包括更新两个双Q学习表，其中在一个表上的值位置处的一个表的更新包括使用表中的另一个表上的对应位置处的值。

22.根据权利要求19至21中任一项所述的系统，其中，强化学习包括通过在一个Q学习表上查找状态并且基于标准选择状态的多个可用表值之一来确定动作，并且其中状态的每个表值指示不同动作值的使用。

23.根据权利要求19至21所述的系统，其中，强化学习包括通过在两个或更多个Q学习表上查找状态，对来自每个表的状态的多个值的对应位置求和，以及取决于满足标准的总和选择动作来确定动作，其中每个总和与不同的动作值相关联。

24.一种设备，包括执行根据权利要求1-9中任一项所述的方法的装置。

25.至少一种机器可读介质，包括多个指令，所述多个指令响应于在计算设备上执行，使得计算设备执行根据权利要求1-9中任一项所述的方法。

...

【技术特征摘要】
【国外来华专利技术】

1.一种视频编码的计算机实现的方法，包括：

2.根据权利要求1所述的方法，其中，关系函数是线性回归函数。

3.根据权利要求1或2所述的方法，其中，关系函数的确定包括通过使用与多个帧相关联的时延反馈和比特流大小反馈的平均来确定函数的参数。

6.根据权利要求4所述的方法，其中，设置包括调整关系函数的至少一个参数，使得反馈对拟合到关系函数上，或者被认为足够接近关系函数。

7.根据权利要求1所述的方法，包括取决于时延阈值和关系函数的参数来确定目标比特流大小。

8.根据权利要求1所述的方法，包括通过使用强化学习来细化初始目标比特流大小，其中奖励与反馈相关联。

9.根据权利要求8所述的方法，其中，通过使用时延反馈与时延阈值的比来生成奖励。

11.根据权利要求10所述的制品，其中，通过使用反馈和初始目标比特流大小来生成强化学习状态。

12.根据权利要求11所述的制品其中，状态包括多个帧上的趋势，所述趋势包括比特流大小反馈趋势、时延反馈趋势和初始目标比特流大小趋势。

13.根据权利要求10至12中任一项所述的制品，其中，强化学习的动作器策略包括使用双q学习表，双q学习表填充有按照可用状态和每个状态的可用动作值排序的表值。

14.根据权利要求13所述的制品，其中，通过使用奖励...

【专利技术属性】
技术研发人员：何凡，Y·林，C·王，Y·衡，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人