【技术实现步骤摘要】
视频处理方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及视频处理方法和装置。
技术介绍
在视频帧中,ROI(regionofinterest)指感兴趣区域。在一般的对ROI的研究中,均采用了图像显著性检测的方式进行ROI区域划分。图像显著性是一种较为主观的概念,在一些场景下,图像显著性检测的表现并不稳定,检测精度有限。一般的目标检测方法,在画面中包含多个目标,且目标有多种类型的情况下,很难准确判断哪些区域属于感兴趣区域。
技术实现思路
本申请实施例提出了视频处理方法和装置。第一方面,本申请实施例提供了一种视频处理方法,包括:获取对目标视频帧进行对象检测所得到的对象区域,其中,各个对象区域中的对象的类型为预设类型;对于所获取的对象区域中的对象区域,响应于确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域;将目标视频帧的各个对象区域中,各个非感兴趣区域以外的对象区域作为感兴趣区域;获取各个感兴趣区域对应的量化参数变化,并基于量化参数变化,对目标视频帧进行编码。 ...
【技术保护点】
1.一种视频处理方法,所述方法包括:/n获取对目标视频帧进行对象检测所得到的对象区域,其中,各个所述对象区域中的对象的类型为预设类型;/n对于所获取的对象区域中的对象区域,响应于确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域;/n将所述目标视频帧的各个所述对象区域中,各个所述非感兴趣区域以外的对象区域作为感兴趣区域;/n获取所述各个感兴趣区域对应的量化参数变化,并基于所述量化参数变化,对所述目标视频帧进行编码。/n
【技术特征摘要】
1.一种视频处理方法,所述方法包括:
获取对目标视频帧进行对象检测所得到的对象区域,其中,各个所述对象区域中的对象的类型为预设类型;
对于所获取的对象区域中的对象区域,响应于确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域;
将所述目标视频帧的各个所述对象区域中,各个所述非感兴趣区域以外的对象区域作为感兴趣区域;
获取所述各个感兴趣区域对应的量化参数变化,并基于所述量化参数变化,对所述目标视频帧进行编码。
2.根据权利要求1所述的方法,其中,所述获取所述各个感兴趣区域对应的量化参数变化,包括:
对于所述目标视频帧中的每个感兴趣区域,基于该感兴趣区域中对象的类型,确定该感兴趣区域对应的量化参数变化,其中,所述对象的类型为至少一个预设类型中的一个。
3.根据权利要求1所述的方法,其中,所述对于所获取的对象区域中的对象区域,响应于确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域,包括:
对于所获取的对象区域中的对象区域,判断该对象区域占所述目标视频帧的比例是否大于预设比例;
若该对象区域占所述目标视频帧的比例大于预设比例,确定该对象区域为非感兴趣区域。
4.根据权利要求3所述的方法,其中,若该对象区域占所述目标视频帧的比例大于预设比例,确定该对象区域为非感兴趣区域,包括:
若该对象区域占所述目标视频帧的比例大于预设比例,响应于确定该对象区域中的对象的类型为优先级最高的预设类型,确定所述目标视频帧中的各个对象区域为非感兴趣区域,其中,所述优先级用于表征确定各个类型的对象区域为感兴趣区域的优先级。
5.根据权利要求1所述的方法,其中,
对于相同类型的对象区域,面积较大的对象区域优先级较高,所述优先级用于表征确定各个类型的对象区域为感兴趣区域的优先级。
6.根据权利要求1所述的方法,其中,
对于分别包含同一人的头部和身体的对象区域,若包含头部的对象区域占目标视频帧的比例大于指定阈值,则包含该头部的对象区域的优先级高于包含该身体的对象区域的优先级,若包含头部的对象区域占目标视频帧的比例不大于所述指定阈值,则包含该身体的对象区域的优先级高于包含该头部的对象区域的优先级,头部和身体的类型均为预设类型。
7.根据权利要求1或6所述的方法,其中,所述对于所获取的对象区域中的对象区域,响应于确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域,包括:
基于对象区域之间的位置关系和对象区域中对象的类型,在各个所述对象区域中,匹配出分别包含同一人的头部和身体的两个对象区域作为关联区域组;
对于任意一个所述关联区域组,响应于该关联区域组中,头部类型的对象区域中的头部占所述目标视频帧的比例超过指定阈值,确定该关联区域组的另一个对象区域为非感兴趣区域,响应于头部类型的对象区域中的头部占所述目标视频帧的比例未超过所述指定阈值,确定该头部类型的对象区域为非感兴趣区域。
8.根据权利要求1所述的方法,其中,所述对于所获取的对象区域中的对象区域,响应于确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域,包括:
对于所获取的对象区域中的对象区域,基于该对象区域的类型确定该对象区域的优先级;
响应于基于该对象区域的优先级确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域。
9.根据权利要求8所述的方法,其中,所述响应于基于该对象区域的优先级确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域,包括:
对于各个所述对象区域,按照对象区域的优先级由高到低的顺序,选取出预设数量的对象区域;
响应于各个所述对象区域中,所选取的对象区域占所述目标视频帧的比例不超过预设比例,将所选取的对象区域以外的对象区域作为非感兴趣区域。
10.根据权利要求1所述的方法,其中,所述头部类型和所述身体类型均属于人体大类;所述对于所获取的对象区域中的对象区域,响应于确定该对象区域满足预设条件,确定该对象区域为非感兴趣区域,包括:
响应于所述目标视频帧包含人体大类的对象区域,和文字类型的对象区域,获取所述目标视频帧中各个人体大类的对象区域对应的目标量化参数变化,其中,所述目标量化参数变化是基于预设常数和指定的常数系数确定的,不同的预设类型对应的预设常数不同;
对于目标视频帧中,每个人体大类的对象区域,基于该对象区域对应的所述目标量化参数变化和该对象区域占所述目标视频帧的比例,预测该对象区域相对于基于编码器的指定量化参数编码得到的对象区域的增加比例,并确定各个人体大类的对象区域的码率的增加比例之和;
响应于所述增加比例之和超过所述目标视频帧的预设增加比例阈值,确定所述目标视频帧中各个所述文字类型的对象区域为非感兴趣区域。
11.根据权利要求2所述的方法,其中,所述对于所述目标视频帧中的每个感兴趣区域,基于该感兴趣区域中对象的类型,确定该感兴趣区域对应的量化参数变化,包括:
获取目标视频帧中各类型的感兴趣区域的码率增加比例之和的最大值,其中,所述码率增加比例之和的最大值,是相对于基于编码器的指定量化参数编码得到的各类型的感兴趣区域得到的;
获取该感兴趣区域中对象的类型对应的预设常数,其中,不同的预设类型对应的预设常数不同,所述量化参数变化是基于预设常数和常数系数确定的;
基于所述码率的增加比例之和的最大值、各类型所述感兴趣区域所对应的预设常数,以及各类型所述感兴趣区域占所述目标视频帧的比例,确定所述目标视频帧中,各类型所述感兴趣区域对应的量化参数变化。
12.根据权利要求1所述的方法,其中,所述获取对目标视频帧进行对象检测所得到的对象区域,包括:
获取视频的视频帧序列;
在所述视频帧序列中确定在先一帧,并基于获取的从在先一帧至在后一帧所经过的帧数,在所述视频帧序列中,确定所确定的在先一帧对应的在后一帧;
执行如下更新步骤:
获取在所确定的在先一帧和在后一帧分别检测到的对象区域,以及各个所述对象区域的置信度;
从所确定的在先一帧的对象区域和在后一帧的对象区域中,分别确定出包含同一对象的第一对象区域和第二对象区域;
对所述第一对象区域的置信度和所述第二对象区域的置信度进行融合,并基于所述融合结果,更新所述第二对象区域的置信度;
所述方法还包...
【专利技术属性】
技术研发人员:王晓明,邢怀飞,丁文鹏,沈慧锋,曹菲菲,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。