一种视频感兴趣区域快速标定方法技术

技术编号:14411712 阅读:115 留言:0更新日期:2017-01-11 23:40
本发明专利技术公开了一种视频感兴趣区域快速标定方法与装置,此方法包括:确定视频数据中的目标帧图像;确定目标帧图像中第一分量图像数据、第二分量图像数据;计算所述第一分量图像数据的阈值TH并计算所述第一分量图像数据和X倍的第二分量图像数据的差值阈值DTH;根据所述阈值TH、所述差值阈值DTH、所述目标帧图像中每个宏块中像素的第一分量的值和第二分量的值确定处于人脸或皮肤区域的宏块,将所述宏块的集合作为所述目标帧图像的感兴趣区域。本发明专利技术提供了一种准确又简单快速的标定视频感兴趣区域的方法,在动态视频图像中标定人脸区域,尤其适用于处理器能力有限的终端和应用情境。

【技术实现步骤摘要】

本专利技术涉及一种视频数据处理方法,尤其涉及一种视频感兴趣区域快速标定方法与装置。
技术介绍
随着互联网、移动互联网基础设施的不断完善,以及蜂窝移动通信网络的升级换代,人们在生活和工作中越来越多地使用视频电话或视频通话作为远距离沟通交流的手段。但是由于诸如网络带宽不足、网络传输负荷过大、视频图像分辨率不断提升等多方面因素的影响,传统的视频编码技术无法保证用户获得高质量的视频图像。视频编码技术经过多年的发展,也逐步接近压缩率的极限,如何在相对稳定的压缩比基础上,进一步获得让观看者主观感知上更高质量的视频图像,是当前视频压缩
的难点之一。颜色空间也称色彩模型(又称色彩空间或色彩系统),它的用途是在某些标准下用通常可接受的方式对颜色加以描述。颜色空间有许多种,常用有RGB、YUV、HSI等。RGB(红绿蓝)是依据人眼识别的颜色定义出的空间,可表示大部分颜色。但因为RGB模型将色调,亮度,饱和度三个量放在一起表示,很难分开,难以进行数字化的细节调整,所以在工程及科研中,一般不直接使用RGB模型,而是将RGB模型转换为YUV或HSI等其他色彩模型再进行后续处理。YUV色彩模型是将RGB模型的R、G、B分量经过矩阵变换得到亮度信号Y和两个色差信号B-Y(即U)、R-Y(即V),最后发送端将亮度和色差三个信号分别进行编码,用同一信道发送出去。其中“Y”表示明亮度(Luminance或Luma),也就是灰阶值;而“U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色,分别用Cr和Cb来表示。其中,Cr反映了RGB输入信号红色部分与RGB信号亮度值之间的差异,而Cb反映的是RGB输入信号蓝色部分与RGB信号亮度值之间的差异。YUV色彩模型的亮度信号Y和色度信号U、V是分离的,非常适合进行增强、压缩等图像处理。HSI〔Hue-Saturation-Intensity(Lightness),HSI或HSL〕颜色模型用H、S、I三参数描述颜色特性,其中H定义颜色的波长,称为色调;S表示颜色的深浅程度,称为饱和度;I表示强度或亮度。当人观察一个彩色物体时,用色调、饱和度、亮度来描述物体的颜色。色调是描述纯色的属性(纯黄色、橘黄或者红色);饱和度给出一种纯色被白光稀释的程度的度量;亮度是一个主观的描述,实际上,它是不可以测量的,体现了无色的强度概念,并且是描述彩色感觉的关键参数。而强度(灰度)是单色图像最有用的描述子,这个量是可以测量且很容易解释。则将提出的这个模型称作为HSI(色调、饱和度、强度)彩色模型,该模型可在彩色图像中从携带的彩色信息(色调和饱和度)里消去强度分量的影响,使得HSI模型成为开发基于彩色描述的图像处理方法的良好工具,而这种彩色描述对人来说是自然而直观的。HSI模型是美国色彩学家孟塞尔(H.A.Munseu)于1915年提出的,它反映了人的视觉系统感知彩色的方式,以色调、饱和度和强度三种基本特征量来感知颜色。感兴趣区域(ROI,RangeofInteresting)视频编码是目前应对以上难题的有效解决方案之一,由于人眼具有视觉感兴趣区的特性,即人眼对一副图像不同区域感兴趣的程度不同,这就意味着人眼对一幅图像不同区域的质量损失可察觉度也相应不同,因此,基于感兴趣区域的视频编码方法,可充分利用视频图像接收者的这一主观特性,对图像中不同区域采用不同的编码策略,可以有效地在不增加编码码率的同时显著提升图像等的主观感受质量。为了实现感兴趣区域视频编码这一技术,当前主流的视频编解码算法标准均提供了相应的建议实现方案,例如国际标准化组织/国际电工委员会(ISO/IEC)运动图像专家组-2(MPEG-2)标准、ISO/IEC运动图像专家组-4(MPEG-4)第10部分高级视频编码标准(AVC)、国际电信联盟(ITU)H.264标准,均提供了在图像特定区域获得比其它区域更高质量的机制,允许发送端通过分析待编码图像的特性区分出感兴趣区域,通过对感兴趣区域分配更多编码比特以保留更多细节,来获得更高的感知质量。而对于一般的ROI提取问题,流行的方法是建立可计算的视觉关注模型,这是一种涉及视觉生理,认知心理,记忆机制,图像信息等等方面的复杂模型,一般难以得到快速标定方法,特别是对于动态图像。另外一些处理特定的从动态图像中标定人脸区域的方法因为过多关注于人脸的形状或人脸上特定部位的性质,往往引入了复杂的算法,也不适用于动态图像中人脸区域的快速标定。符合H264规范的软件编码器如OPENH264编码器,由于算法的复杂性本身会占用处理器的一部分处理资源,因此在其中嵌入人脸区域标定的算法必须是简单快速而又有效的,且由于H264中压缩处理的基本单元是宏块(MB),因此人脸区域标定应该以MB为该区域的基本单元。关于从图像对人脸区域进行标定,目前有多种算法:基于知识的算法利用对人脸先验的知识指定规则进行识别;基于特征的算法先找到人脸的稳定特征然后在图像中进行匹配验证这种特征是否存在;还有基于统计和概率模型的算法。基于人脸各个部分的肤色特征进行分割处理,并考虑各部分的形状特征以及相互之间的位置关系特征,这是一种属于基于特征的算法,与其他种类算法一样,它也具有相当大的复杂性,不适用于快速标定。现有技术的缺点主要体现在计算的复杂性上,大部分视频相关应用都是动态视频,有相当的实时性要求,另一方面,承载视频应用的设备,比如通常的移动终端,处理器能力有限,也不允许太多的计算复杂性。
技术实现思路
为了解决现有技术中视频感兴趣区域标定方式计算方式复杂不适用于处理器能力有限的终端或情境的问题,本专利技术提供了一种视频感兴趣区域快速标定方法与装置。本专利技术提供了一种视频感兴趣区域快速标定方法,包括:确定视频数据中的目标帧图像;确定目标帧图像中第一分量图像数据、第二分量图像数据;计算所述第一分量图像数据的阈值TH并计算所述第一分量图像数据和X倍的第二分量图像数据的差值阈值DTH;根据所述阈值TH、所述差值阈值DTH、所述目标帧图像中每个宏块中像素的第一分量的值和第二分量的值确定处于人脸或皮肤区域的宏块,将所述宏块的集合作为所述目标帧图像的感兴趣域区域。上述视频感兴趣区域快速标定方法还具有以下特点:所述根据所述阈值TH、所述差值阈值DTH、所述目标帧图像中每个宏块中像素的第一分量的值和第二分量的值确定处于人脸或皮肤区域的宏块包括:所述阈值TH的值大于或等于第一TH值时,确定每个宏块的各像素中第一分量的值大于所述第二TH值且小于第一TH值的像素为目标像素;所述阈值TH的值小于所述第一TH值且大于或等于第二TH值时,确定每个宏块的各像素中第一分量的值大于第二TH值且小于所述第一TH值且所述第一分量的值与第二分量的值的差值的绝对值大于所述差值阈值DTH的像素为目标像素;所述阈值TH的值小于所述第二TH值且大于或等于第三TH值时,确定每个宏块的各像素中第一分量的值大于所述第三TH值且所述第一分量的值与第二分量的值的差值的绝对值大于所述差值阈值DTH的像素为目标像素;所述阈值TH的值小于所述第三TH值时,确定每个宏块的各像素中第一分量的值大于第三TH值且小于所述第一TH值的像素为目标像素;确定各宏块中目本文档来自技高网
...
一种视频感兴趣区域快速标定方法

【技术保护点】
一种视频感兴趣区域快速标定方法,其特征在于,包括:确定视频数据中的目标帧图像;确定目标帧图像中第一分量图像数据、第二分量图像数据;计算所述第一分量图像数据的阈值TH并计算所述第一分量图像数据和X倍的第二分量图像数据的差值阈值DTH;根据所述阈值TH、所述差值阈值DTH、所述目标帧图像中每个宏块中像素的第一分量的值和第二分量的值确定处于人脸或皮肤区域的宏块,将所述宏块的集合作为所述目标帧图像的感兴趣域区域。

【技术特征摘要】
1.一种视频感兴趣区域快速标定方法,其特征在于,包括:确定视频数据中的目标帧图像;确定目标帧图像中第一分量图像数据、第二分量图像数据;计算所述第一分量图像数据的阈值TH并计算所述第一分量图像数据和X倍的第二分量图像数据的差值阈值DTH;根据所述阈值TH、所述差值阈值DTH、所述目标帧图像中每个宏块中像素的第一分量的值和第二分量的值确定处于人脸或皮肤区域的宏块,将所述宏块的集合作为所述目标帧图像的感兴趣域区域。2.如权利要求1所述的视频感兴趣区域快速标定方法,其特征在于,所述根据所述阈值TH、所述差值阈值DTH、所述目标帧图像中每个宏块中像素的第一分量的值和第二分量的值确定处于人脸或皮肤区域的宏块包括:所述阈值TH的值大于或等于第一TH值时,确定每个宏块的各像素中第一分量的值大于所述第二TH值且小于第一TH值的像素为目标像素;所述阈值TH的值小于所述第一TH值且大于或等于第二TH值时,确定每个宏块的各像素中第一分量的值大于第二TH值且小于所述第一TH值且所述第一分量的值与第二分量的值的差值的绝对值大于所述差值阈值DTH的像素为目标像素;所述阈值TH的值小于所述第二TH值且大于或等于第三TH值时,确定每个宏块的各像素中第一分量的值大于所述第三TH值且所述第一分量的值与第二分量的值的差值的绝对值大于所述差值阈值DTH的像素为目标像素;所述阈值TH的值小于所述第三TH值时,确定每个宏块的各像素中第一分量的值大于第三TH值且小于所述第一TH值的像素为目标像素;确定各宏块中目标像素个数大于所述宏块中像素个数的第一比例的宏块为处于人脸或皮肤区域的宏块;其中,所述第一TH值、所述第二TH值、所述第三TH值依次降低。3.如权利要求1所述的视频感兴趣区域快速标定方法,其特征在于,所述根据所述阈值TH、所述差值阈值DTH、所述目标帧图像中每个宏块中像素的第一分量的值和第二分量的值确定处于人脸或皮肤区域的宏块包括:针对每个目标帧图像执行以下操作:所述阈值TH的值大于或等于第一TH值时,确定每个宏块的各像素中第一分量的值大于所述第二TH值且小于第一TH值的像素为目标像素;所述阈值TH的值小于第一TH值且大于或等于第二TH值时,确定每个宏块的各像素中第一分量的值大于第一阈值且小于所述第一TH值且所述第一分量的值与第二分量的值的差值的绝对值大于所述差值阈值DTH的像素为目标像素;第一阈值小于所述第二TH值;所述阈值TH的值小于所述第二TH值且大于或等于第三TH值时,确定每个宏块的各像素中第一分量的值大于所述阈值TH且大于第二阈值且第一分量的值与第二分量的值的差值的绝对值大于所述差值阈值DTH的像素为目标像素;所述阈值TH的值小于所述第三TH值时,确定每个宏块的各像素中第一分量的值大于所述阈值TH且大于第三阈值且小于所...

【专利技术属性】
技术研发人员:李永溢徐家骏江周平
申请(专利权)人:一块互动北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1