System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 视频编码方法、装置、电子设备、存储介质及程序产品制造方法及图纸_技高网

视频编码方法、装置、电子设备、存储介质及程序产品制造方法及图纸

技术编号:40334605 阅读:8 留言:0更新日期:2024-02-09 14:25
本公开提供了一种视频编码方法、装置、电子设备、存储介质及程序产品,涉及视频编码、深度学习等技术领域。该方法包括:根据获取到的视频编码请求,确定待编码的目标视频;对构成目标视频的按时序排列的各视频帧,按周期调用预设的字幕检测算子检测相应的视频帧内的字幕信息,字幕检测算子为基于深度学习算法构建出的用于识别视频中字幕信息的神经网络,字幕信息包括:字幕框数量、字幕框位置和字幕内容;将用于呈现字幕信息的画面区域确定为感兴趣区域,并按照与感兴趣区域匹配的视频编码方式进行编码处理。应用该方法可以在保证字幕信息检测准确性的同时尽可能的减少性能开销。

【技术实现步骤摘要】

本公开涉及数据处理,具体涉及视频编码、深度学习等,尤其涉及一种视频编码方法、装置、电子设备、计算机可读存储介质及计算机程序产品。


技术介绍

1、roi(region of interest,感兴趣区域)技术即识别出视频中人眼感兴趣的区域,并针对性优化该区域码率分配和编码模式,以达到主观质量显著提升的目的。

2、对于视频各类感兴趣区域的识别,是其中最为关键的部分。在各感兴趣区域中,字幕都是视频中较为重要的区域,无论是包含人物的综艺和电影,还是不包含人物的纪录片,人眼都会关注字幕。如果字幕出现编码失真,如模糊、错位等,会极大影响用户体验。

3、所以在用于对视频进行编码的编码器中,需要针对诸如字幕区域在内的感兴趣区域进行针对性的识别,以便于对识别出的感兴趣区域进行针对性编码。


技术实现思路

1、本公开实施例提出了一种视频编码方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

2、第一方面,本公开实施例提出了一种视频编码方法,包括:根据获取到的视频编码请求,确定待编码的目标视频;对构成目标视频的按时序排列的各视频帧,按周期调用预设的字幕检测算子检测相应的视频帧内的字幕信息;其中,字幕检测算子为基于深度学习算法构建出的用于识别视频中字幕信息的神经网络,字幕信息包括:字幕框数量、字幕框位置和字幕内容;将用于呈现字幕信息的画面区域确定为感兴趣区域,并按照与感兴趣区域匹配的视频编码方式进行编码处理。

3、第二方面,本公开实施例提出了一种视频编码装置,包括:目标视频确定单元,被配置成根据获取到的视频编码请求,确定待编码的目标视频;按周期调用算子单元,被配置成对构成目标视频的按时序排列的各视频帧,按周期调用预设的字幕检测算子检测相应的视频帧内的字幕信息;其中,字幕检测算子为基于深度学习算法构建出的用于识别视频中字幕信息的神经网络,字幕信息包括:字幕框数量、字幕框位置和字幕内容;感兴趣区域确定及针对性编码单元,被配置成将用于呈现字幕信息的画面区域确定为感兴趣区域,并按照与感兴趣区域匹配的视频编码方式进行编码处理。

4、第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面描述的视频编码方法。

5、第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面描述的视频编码方法。

6、第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面描述的视频编码方法的步骤。

7、本公开所提供的视频编码方案,针对待编码的目标视频数据,并不是每一视频帧都调用基于神经网络算法构建出的字幕检测算子来对字幕信息进行高精度的识别和检测,而是充分考虑字幕内容呈现的时效性和连续存在性,采用了间隔、抽帧的方式按周期调用字幕检测算子来检测呈现在当前视频帧内的字幕信息,从而降低因连续重复调用字幕检测算子所带来的不必要性能开销,有利于腾出更多性能用于针对性的对呈现字幕信息的区域进行针对性的编码,进而提升用户在后续实际点播该视频时的观看体验。

8、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种视频编码方法,包括:

2.根据权利要求1所述的方法,其中,所述对构成所述目标视频的按时序排列的各视频帧,按周期调用预设的字幕检测算子检测相应的视频帧内的字幕信息,包括:

3.根据权利要求2所述的方法,其中,所述在检测到所述首个字幕信息后,按周期对相应视频帧进行字幕内容变化检测,包括:

4.根据要求3所述的方法,其中,所述检测所述第一字幕框内所框选区域内在当前周期相应的视频帧中出现的字幕内容较所述首字幕内容是否发生了变化,包括:

5.根据权利要求1所述的方法,其中,所述周期包括:以每隔预设图像帧或以每隔预设时长作为一周期。

6.根据权利要求2-5任一项所述的方法,还包括:

7.根据权利要求2-5任一项所述的方法,还包括:

8.根据权利要求2-5任一项所述的方法,还包括:

9.根据权利要求1所述的方法,其中,所述按照与所述感兴趣区域匹配的视频编码方式进行编码处理,包括:

10.根据权利要求9所述的方法,还包括:

11.一种视频编码装置,包括:

12.根据权利要求11所述的装置,其中,所述按周期调用算子单元包括:

13.根据权利要求12所述的装置,其中,所述字幕内容变化检测子单元包括:

14.根据要求13所述的装置,其中,所述变化检测模块被进一步配置成:

15.根据权利要求11所述的装置,其中,所述周期包括:以每隔预设图像帧或以每隔预设时长作为一周期。

16.根据权利要求12-15任一项所述的装置,还包括:

17.根据权利要求12-15任一项所述的装置,还包括:

18.根据权利要求12-15任一项所述的装置,还包括:

19.根据权利要求11所述的装置,其中,所述感兴趣区域确定及针对性编码单元包括被配置成按照与所述感兴趣区域匹配的视频编码方式进行编码处理的针对性编码子单元,所述针对性编码子单元被进一步配置成:

20.根据权利要求19所述的装置,还包括:

21.一种电子设备,包括:

22.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的视频编码方法。

23.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1-10中任一项所述视频编码方法的步骤。

...

【技术特征摘要】

1.一种视频编码方法,包括:

2.根据权利要求1所述的方法,其中,所述对构成所述目标视频的按时序排列的各视频帧,按周期调用预设的字幕检测算子检测相应的视频帧内的字幕信息,包括:

3.根据权利要求2所述的方法,其中,所述在检测到所述首个字幕信息后,按周期对相应视频帧进行字幕内容变化检测,包括:

4.根据要求3所述的方法,其中,所述检测所述第一字幕框内所框选区域内在当前周期相应的视频帧中出现的字幕内容较所述首字幕内容是否发生了变化,包括:

5.根据权利要求1所述的方法,其中,所述周期包括:以每隔预设图像帧或以每隔预设时长作为一周期。

6.根据权利要求2-5任一项所述的方法,还包括:

7.根据权利要求2-5任一项所述的方法,还包括:

8.根据权利要求2-5任一项所述的方法,还包括:

9.根据权利要求1所述的方法,其中,所述按照与所述感兴趣区域匹配的视频编码方式进行编码处理,包括:

10.根据权利要求9所述的方法,还包括:

11.一种视频编码装置,包括:

12.根据权利要求11所述的装置,其中,所述按周期调用算子单元包括:

【专利技术属性】
技术研发人员:林可
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1